Methodes descriptives en analyse de donnees symboliques

par FRANCISCO TENORIO DE CARVALHO

Thèse de doctorat en Sciences appliquées

Sous la direction de Edwin Diday.

Soutenue en 1992

à Paris 9 .

    mots clés mots clés


  • Résumé

    L'analyse des donnees symboliques se propose d'etendre la problematique, les methodes et les algorithmes de l'analyse des donnees au traitement de connaissances souvent complexes, representees par les objets symboliques. Dans ce cadre, nous etendons des outils de description couramment utilises en analyse des donnees, tels que des histogrammes et des indices de proximite, a la description d'une base de connaissances d'objets symboliques. A partir de l'etude du potentiel de description d'un objet symbolique, nous avons etendu la notion d'histogramme aux variables choisies pour decrire une base de connaissances d'objets symboliques. Nous avons constate l'importance de certains types de dependance logique entre les variables sur les resultats obtenus. Nous avons egalement etudie l'interpretation de ces histogrammes. Pour mesurer la proximite entre les objets symboliques nous avons pu, sous l'angle du potentiel de description, adapter a ces objets les indices de proximite concus pour les variables binaires, ainsi que l'indice de minkowsky. Cette approche nous a permis d'utiliser la meme mesure de proximite independamment du type de variable. Nous avons etudie quelques proprietes des indices proposes et nous avons pu etablir l'equivalence entre quelques-uns de ces indices. Ces indices tiennent compte des dependances logiques entre variables. Enfin, nous avons adapte l'algorithme general de classification ascendante hierarchique pour obtenir une classification d'objets symboliques. Par rapport aux methodes usuelles de l'analyse des donnees, nous obtenons une description immediate de chaque palier par un objet symbolique, nous avons un indice d'agregation qui est le meme aussi bien pour les singletons que pour les paliers, et nous employons un indicage base sur le potentiel de description de l'objet symbolique decrivant le palier. Nous fournissons aussi une aide a l'interpretation de l'arbre de classification basee sur la redescription des fils de chaque nud de l'arbre par les variables qui les discriminent


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Accessible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.