Auteur / Autrice : | Jérémie Sublime |
Direction : | Antoine Cornuéjols, Younès Bennani |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique appliquée |
Date : | Soutenance le 09/11/2016 |
Etablissement(s) : | Université Paris-Saclay (ComUE) |
Ecole(s) doctorale(s) : | École doctorale Agriculture, Alimentation, Biologie, Environnement, Santé (Paris ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Mathématiques et Informatique Appliquées (Paris) - Mathématiques et Informatique Appliquées |
Jury : | Président / Présidente : François Yvon |
Examinateurs / Examinatrices : Younès Bennani, François Yvon, Pascale Kuntz-Cosperec, Michaël Aupetit | |
Rapporteurs / Rapporteuses : Pascale Kuntz-Cosperec, Michaël Aupetit |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse présente plusieurs algorithmes développés dans le cadre du projet ANR COCLICO et contient deux axes principaux :Le premier axe concerne l'introduction d'un algorithme applicable aux images satellite à très haute résolution, qui est basé sur les champs aléatoires de Markov et qui apporte des notions sémantiques sur les clusters découverts. Cet algorithme est inspiré de l'algorithme Iterated conditional modes (ICM) et permet de faire un clustering sur des segments d'images pré-traitées. La méthode que nous proposons permet de gérer des voisinages irréguliers entre segments et d'obtenir des informations sémantiques de bas niveau sur les clusters de l'image traitée.Le second axe porte sur le développement de méthodes de clustering collaboratif applicables à autant d'algorithmes que possible, ce qui inclut les algorithmes du premier axe. La caractéristique principale des méthodes proposées dans cette thèse est leur applicabilité aux deux cas suivants : 1) plusieurs algorithmes travaillant sur les mêmes objets dans des espaces de représentation différents, 2) plusieurs algorithmes travaillant sur des données différentes ayant des distributions similaires. Les méthodes que nous proposons peuvent s'appliquer à de nombreux algorithmes comme l'ICM, les K-Moyennes, l'algorithme EM, ou les cartes topographiques (SOM et GTM). Contrairement aux méthodes précédemment proposées, notre modèle permet à des algorithmes très différents de collaborer ensemble, n'impose pas de contrainte sur le nombre de clusters recherchés et a une base mathématique solide.