Thèse soutenue

Un point de vue théorique sur la découverte des sous-groupes
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Aimene Belfodil
Direction : Mehdi KaytoueCéline Robardet
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 30/09/2019
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : École doctorale en Informatique et Mathématiques de Lyon
Partenaire(s) de recherche : établissement opérateur d'inscription : Institut national des sciences appliquées (Lyon ; 1957-....)
Laboratoire : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Rhône ; 2003-....) - Laboratoire d'InfoRmatique en Image et Systèmes d'information / LIRIS
Equipe de recherche : Data Mining and Machine Learning
Jury : Président / Présidente : Miguel Couciero
Examinateurs / Examinatrices : Mehdi Kaytoue, Céline Robardet, Miguel Couciero, Bruno Crémilleux, Bernhard Ganter, Peggy Cellier, Arno Siebes
Rapporteurs / Rapporteuses : Bruno Crémilleux, Bernhard Ganter

Résumé

FR  |  
EN

Comme le titre pourrait le suggérer, l’objectif principal de cette thèse est de fournir une meilleure compréhension de la tâche de la découverte de sous-groupes à travers la théorie de l’ordre. La découverte de sous-groupes (Subgroup Discovery - SD) est la tâche automatique dont le but est la découverte d’hypothèses intéressantes dans les bases de données. Autrement dit, étant donnée une base de donnée, l’espace de recherche de toutes les hypothèses que l’analyste voudra tester ainsi qu’un moyen formel pour évaluer la qualité de ces hypothèses ; la tâche automatique de la découverte de sous-groupe s’efforce de trouver les meilleurs hypothèses quant à ces trois paramètres. Afin d’élaborer des algorithmes efficaces et efficients pour cette tâche, il est important de comprendre les propriétés des espaces de recherche d’une part et les propriétés de la mesure de qualité d’autre part. Dans cette thèse, nous étendons l’état de l’art par: (i) fournir une vue unifiée sur les espaces d’hypothèses derrière la tâche de découverte de sous-groupes en utilisant la théorie de l’ordre, (ii) proposer l’espace d’hypothèses de conjonctions d’inégalités linéaires dans les bases de données numériques ainsi que différents algorithmes permettant de les énumérer et (iii) proposer un algorithme anytime - fournit progressivement des résultats - pour la tâche particulière de fouille de sous-groupe discriminants dans les bases de données numériques. Ce dernier fournit des garanties sur la qualité des sous-groupes extraits même si l’algorithme est interrompu.