Organisation et interpretation par les treillis de galois de donnees de type multivalue, intervalle ou histogramme

par GERALDINE POLAILLON

Thèse de doctorat en Sciences et techniques communes

Sous la direction de Edwin Diday.

Soutenue en 1998

à Paris 9 .

    mots clés mots clés


  • Pas de résumé disponible.


  • Pas de résumé disponible.


  • Résumé

    Nous nous interessons a la classification par les treillis de galois de donnees de type multivalue, intervalle ou histogrammes et pouvant comporter des donnees manquantes. Le contexte du travail est l'analyse de donnees symbolique qui a pour but d'etendre les methodes d'analyse de donnee classique a des donnees decrites ci-dessus selon le formalisme des objets symboliques. Les treillis de galois permettent naturellement une representation duale intension/extension, et font ressortir l'ordre entre les individus, entre les attributs, mais egalement entre les individus et les attributs. Dans une premiere partie, nous etendons la construction des treillis de galois des tableaux binaires a des tableaux de donnees complexes avec des algorithmes incrementaux et non-incrementaux. Deux types de treillis de galois peuvent etre obtenus : dans un cas, nous nous interessons a des classes dont les proprietes sont communes aux individus de la classe ; dans l'autre cas, nous nous interessons a des classes dont les proprietes sont satisfaites par au moins un individu de la classe. Les noeuds du treillis sont des objets complets, qui sont intuitivement l'extension des concepts binaires. Des contraintes exprimees par l'expert sur le contenu des noeuds peuvent intervenir durant la construction du treillis. Dans une seconde partie, nous nous interessons a l'elagage des treillis de donnees complexes. En effet, les treillis representent un espace de travail tres riche, mais leur taille croit de facon exponentielle en fonction des donnees. Nous montrons que les classifications et les arbres de decision sont inclus dans le treillis. Nous proposons differentes methodes d'elagage basees sur des heuristiques liees a des distances entre objets symboliques et des heuristiques liees aux proprietes du treillis. Selon le but recherche, nous pouvons obtenir des regles entre les objets, ou plusieurs arbres issus des deux treillis (hierarchies generalisees, pyramides generalisees, arbres de decision). L'interpretation du treillis se fait directement et automatiquement a partir des donnees initiales.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 251 p.
  • Annexes : 110 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.