Intégration de connaissances expertes dans le processus de fouille de données pour l'extraction d'informations pertinentes

par Laurent Brisson

Thèse de doctorat en Informatique

Sous la direction de Martine Collard-Poulard.


  • Résumé

    L’extraction automatique de connaissances à partir des données peut être considérée comme la découverte d’informations enfouies dans de très grands volumes de données. Les approches actuelles, pour évaluer la pertinence des informations extraites, se distinguent en deux catégories : les approches objectives qui mettent en œuvre des mesures d’intérêt afin d’évaluer les propriétés statistiques des modèles extraits et les approches subjectives qui confrontent les modèles extraits à des connaissances exprimées sur le domaine et nécessitent généralement l’interrogation d’experts. Toutefois, le choix de modèles pertinents en regard de la connaissance métier d’un expert reste un problème ouvert et l’absence de formalisme dans l’expression des connaissances nuit à la mise au point de techniques automatiques de confrontation des modèles permettant d’exploiter toute la richesse sémantique des connaissances expertes. L’approche KEOPS que nous proposons dans ce mémoire répond à cette problématique en proposant une méthodologie qui intègre les connaissances des experts d’un domaine tout au long du processus de fouille. Un système d’information dirigé par une ontologie (ODID) joue un rôle central dans le système KEOPS en permettant d’organiser rationnellement non seulement la préparation des données mais aussi la sélection et l’interprétation des modèles générés. Une mesure d’intérêt est proposée afin de prendre en compte les centres d’intérêt et le niveau de connaissance des experts. Le choix des modèles les plus pertinents se base sur une évaluation à la fois objective pour évaluer la précision des motifs et subjective pour évaluer l’intérêt des modèles pour les experts du domaine. Enfin, l’approche KEOPS facilite la définition de stratégies pour améliorer le processus de fouille de données dans le temps en fonction des résultats observés. Les différents apports de l’approche KEOPS favorisent l’automatisation du processus de fouille de données dans le temps en fonction des résultats observés. Les différents apports de l’approche KEOPS favorisent l’automatisation du processus de fouille de données, et ainsi, une dynamique d’apprentissage peut être initiée pour obtenir un processus de fouille particulièrement bien adapté au domaine étudié. KEOPS a été mise en œuvre dans le cadre de l’étude de la gestion des relations avec les allocataires au sein des Caisses d’Allocations Familiales. L’objectif de cette étude a été d’analyser la relation de service rendu aux allocataires afin de fournir aux décideurs des connaissances précises, pertinentes et utilises pour l’amélioration de ce service.

  • Titre traduit

    Expert knowledge integration into data mining process in order to extract intersting and relevant informations


  • Pas de résumé disponible.


  • Résumé

    Knowledge discovery from data is a process that aims to extract potentially useful knowledge hidden in large database. Current works, in order to evaluate extracted patterns use interestingness measures. Such measures of interestingness are divided into objective measures that depend on the structure of a pattern and the underling data used in the discovery process, and the subjective measures that also depend on the class of users who examine the pattern. However, it remains difficult to select relevant models according domain expert knowledge and the lack of formalism in knowledge expression prevents to compare expert knowledge to extracted patterns. We present KEOPS approach based on a method which uses expert knowledge during a data mining process. An ontology driven information system (ODIS) plays a central role in KEOPS, allowing efficient data selection, data preparation and models interpretation. Furthermore, KEOPS uses a part-way interestingness measure between objective and subjective measure in order to evaluate models relevance according to expert knowledge. Finally, KEOPS helps to create and maintain strategies in order to improve data mining processes and to monitor models usage in day-to-day business. KEOPS was deployed in order to study relationships with beneficiaries of allowances from the ‘family’ branch of the French national health care system (CAF : Caisse Nationale d’Allocations familiales). The objective of this study was to help executives with relevant and useful information.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (ix-174 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 165-174. Résumé en français

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Section Sciences.
  • Non disponible pour le PEB
  • Cote : 06NICE4056
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.