Learning with clustering structure

par Vincent Roulet

Projet de thèse en Mathématiques

Sous la direction de Alexandre d' Aspremont.

Thèses en préparation à Paris Sciences et Lettres , dans le cadre de École doctorale de Sciences mathématiques de Paris Centre (Paris) , en partenariat avec LIENS - Laboratoire d'informatique de l'École normale supérieure (laboratoire) et de École normale supérieure (Paris ; 1985-....) (établissement de préparation de la thèse) depuis le 01-10-2014 .


  • Résumé

    Nous étudions des problèmes d'apprentissage supervisé en utilisant des contraintes de clustering pour imposer la structure soit sur des coordonnées ou les exemples , cherchant à aider à la fois la prédiction et l'interprétation . Le problème declustering des coordonnées se pose naturellement dans la classification de texte par exemple, pour réduire la dimensionnalité en regroupant les mots ensemble et en identifiant les synonymes . Le problème de la classification des examples d'autre part , arrive par exemple dans les problèmes multiclasses où nous sommes autorisés à faire de multiples prédictions et les performances de la meilleure réponse est enregistrée. Nous obtenons une formulation d'optimisation unifiée mettant en évidence la structure commune de ces problèmes et de produire des algorithmes pour faire face à nos modèles . Nous fournissons des garanties théoriques de nos algorithmes basées sur la géométrie de nos modèles .

  • Titre traduit

    Learning with clustering structure


  • Résumé

    We study supervised learning problems using clustering constraints to impose structure on either features or samples, seeking to help both prediction and interpretation. The problem of clustering features arises naturally in text classification for instance, to reduce dimensionality by grouping words together and identify synonyms. The sample clustering problem on the other hand, applies for example to multiclass problems cases where we are allowed to make multiple predictions and the performance of the best answer is recorded. We derive a unified optimization formulation highlighting the common structure of these problems and produce algorithms to tackle our models. We provide theoretical guarantees of our algorithms based on the geometry of our problems.