Extraction de connaissances dans les bases de données comportant des valeurs manquantes ou un grand nombre d'attributs

par François Rioult

Thèse de doctorat en Sciences et technologie de l'information

Sous la direction de Etienne Grandjean.

Soutenue en 2005

à Caen .


  • Résumé

    L'extraction de motifs est une tâche centrale pour l'extraction de connaissances dans les bases de données et cette thèse traite de deux cas génériques et particulièrement utiles dans de nombreuses applications : les bases de données entachées de valeurs manquantes ou comportant un grand nombre d'attributs. Sans traitement particulier, les valeurs manquantes sont source de graves dommages dans les connaissances extraites. Nous proposons un mécanisme de désactivation temporaire des objets incomplets, qui permet par des calculs dans une base incomplète de mettre en évidence des propriétés compatibles avec la base complète. Ces propriétés sont exploitées avec celles de la base opposée pour proposer une méthode originale de construction de règles d'association informatives généralisées. De nombreuses applications concernent des données comportant un grand nombre d'attributs, comme l'analyse du génome qui produit des données sur des dizaines de milliers de gènes, mais les expériences biologiques sont coûteuses donc peu nombreuses. En utilisant un principe de transposition et les propriétés de la connexion de Galois, nous avons développé un cadre formel pour l'extraction de motifs contraints dans ces données, qui permet de choisir l'orientation de la base de données la plus favorable pour les algorithmes d'extraction. Les contraintes de recherche sont également transposables et permettent d'obtenir les motifs contraints en menant les extractions dans le contexte transposée. Enfin, l'utilisation de règles d'association généralisées à des fins d'apprentissage supervisé et de motifs émergents forts complète ces travaux pour des applications médicales et génomiques.


  • Pas de résumé disponible.

Autre version

Cette thèse a donné lieu à une publication en 2008 par [CCSD] [diffusion/distribution] à Villeurbanne

Extraction de connaissances dans les bases de données comportant des valeurs manquantes ou un grand nombre d'attributs

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (224 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 195-208

Où se trouve cette thèse ?