Utilisation de métadonnées pour l’aide à l’interprétation des résultats de classification automatique

par Abdourahamane Baldé

Thèse de doctorat en Informatique

Sous la direction de Edwin Diday.

Soutenue en 2007

à l'Université Paris-Dauphine .


  • Résumé

    De nos jours, l’importance sans cesse croissante des masses de données conduit les décideurs de divers domaines à faire appel aux techniques d’Extraction de Connaissances à partir de Données (ECD). L’une des étapes principales de ce processus est la fouille de données. Or la complexité liée à l’interprétation des résultats fournis par des méthodes de fouille de données rendent fondamentale l’utilisation d’une nouvelle approche de modélisation pour l’automatisation de ce processus. Dans ce travail de thèse, nous proposons une nouvelle approche, appelée AIMFD (Approche d’Incorporation de Me��tadonnées dans la Fouille de Données) qui se résume principalement à intégrer des informations sémantiques. Ce qui permettra d’aider les utilisateurs à interpréter automatiquement les résultats de ces méthodes de fouille de données. Notre travail se consacre à appliquer cette approche au domaine de la classification automatique. Cette approche a aboutit à la création d’un outil permettant d’aider les utilisateurs néophytes dans leur interprétation. Pour évaluer nos travaux, nous avons utilisé notre approche au sein d’applications telles que Weka ou d’algorithmes de classification tels que Sclust.

  • Titre traduit

    Using metadata to help users during clustering result’s interpretation


  • Résumé

    In our work, we propose a new approach, called AIMFD and based on using semantic information in clustering process. This approach, by these characteristics, can be applied to others data mining methods. This consists to design and to use a new metamodel, based on our clustering ontology, for cluster interpreting process. This metamodel, mainly inspired from and based on Common Warehouse Metamodel (CWM), allows us to make automatic interpretation process. Then we create an architecture based on Saxon processor. This architecture allows us to manage interpretation scenarios coding in XQuery. In fine, we defined some interpretation scenarios in our tool. To evaluate our work, we used this new approach on Weka and into Slcust Algorithm

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 187 p
  • Annexes : bibliogr.231 ref.Index

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Consultable sur place dans l'établissement demandeur
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.