Modèles hiérarchiques et topologiques pour le partitionnement et la visualisation des données.

par Nhat-quang Doan

Thèse de doctorat en Informatique

Sous la direction de Mustapha Lebbah.

Thèses en préparation à Paris 13 , dans le cadre de Ecole doctorale galilée depuis le 04-01-2011 .


  • Résumé

    Cette thèse se concentre sur les approches hiérarchiques et topologiques pour le clustering et la visualisation de données.Le problème du clustering devient de plus en plus compliqué en raison de présence de données structuréessous forme de graphes, arbres ou données séquentielles. Nous nous sommes particulièrement intéressés aux cartes auto-organisatrices et au modèle hiérarchique AntTree qui modélise la capacité des fourmis réelles. En combinant ces approches, l'objectif est de représenter les données dans une structure hiérarchique et topologique. Ce combiné permet de visualiser les résultats de clustering sous forme de plusieurs arbres organisés sur une carte topologique. Dans ce rapport, nous présentons trois modèles, dans le premier modèle, nous montrons l'intérêt d’utiliser les structures hiérarchiques et topologiques sur des ensembles de données structurés sous formede graphes. Le second modèle est une version incrémentale qui n'impose pas de règles sur la préservation de la topologie. Le troisième modèle aborde notamment la problématique de la sélection de variables en utilisant la structure hiérarchique, nous proposons un nouveau score pour sélectionner les variables pertinentes en contraignant le score Laplacien. Enfin, cette thèse propose plusieurs perspectives pour des travaux futurs.


  • Pas de résumé disponible.