Méthodes symboliques de fouille de données avec la plate-forme Coron

par Laszlo Szathmary

Thèse de doctorat en Informatique

Sous la direction de Amedeo Napoli.

Soutenue en 2006

à Nancy 1 , en partenariat avec Université Henri Poincaré Nancy 1. Faculté des sciences et techniques (autre partenaire) .


  • Résumé

    Le sujet principal de cette thèse est l'extraction de connaissances dans les bases de données (ECBD). Plus précisément, nous avons étudié deux des plus importantes tâches d'ECBD actuelles, que sont l'extraction de motifs et la génération de règles d'associations. Tout au long de notre travail notre objectif a été de trouver des règles d'associations intéressantes selon plusieurs points de vue : dans un but de fouille efficace, pour réduire au minimum l'ensemble des règles extraites et pour trouver des unités de connaissances intelligibles (et facilement interprétables). Pour atteindre ce but, nous avons développé et adapté des algorithmes spécifiques. Les contributions principales de cette thèse sont : (1) nous avons développé et adapté des algorithmes pour trouver les règles d'association minimales non redondantes ; (2) nous avons défini une nouvelle base pour les règles d'associations appelées ``règles fermées'' ; (3) nous avons étudié un champ de l'ECBD important mais relativement peu étudié, à savoir l'extraction des motifs rares et des règles d'association rares ; (4) nous avons compilé nos algorithmes et une collection d'autres algorithmes ainsi que d'autres opérations auxiliaires d'ECBD dans une boite à outil logicielle appelée Coron.

  • Titre traduit

    Symbolic Data Mining Methods with the Coron Platform


  • Résumé

    The main topic of this thesis is knowledge discovery in databases (KDD). More precisely, we have investigated two of the most important tasks of KDD today, namely itemset extraction and association rule generation. Throughout our work we have borne in mind that our goal is to find interesting association rules from various points of view: for efficient mining purposes, for minimizing the set of extracted rules and for finding intelligible (and easily interpretable) knowledge units. We have developed and adapted specific algorithms in order to achieve this goal. The main contributions of this thesis are: (1) We have developed and adapted algorithms for finding minimal non-redundant association rules ; (2) We have defined a new basis for association rules called Closed Rules ; (3) We have investigated an important but relatively unexplored field of KDD namely the extraction of rare itemsets and rare association rules ; (4) We have packaged our algorithms and a collection of other algorithms along with other auxiliary operations for KDD into a unified software toolkit called CORON.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XIV-245 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 229-239

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation et de l'Edition - BU Sciences et Techniques.
  • Disponible pour le PEB
  • Cote : SC N2006 159
  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : Szathmary m
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.