Thèse soutenue

Fouille de données par contraintes

FR  |  
EN
Auteur / Autrice : Abdelhamid Boudane
Direction : Lakhdar Saïs
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 13/09/2018
Etablissement(s) : Artois
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur (Lille)
Jury : Président / Présidente : Salima Benbernou
Examinateurs / Examinatrices : Lakhdar Saïs, Salima Benbernou, Thi Bich Hanh Dao, Frédéric Saubion, Saïd Jabbour, Yakoub Salhi
Rapporteurs / Rapporteuses : Thi Bich Hanh Dao, Frédéric Saubion

Résumé

FR  |  
EN

Dans cette thèse, nous abordons les problèmes bien connus de clustering et de fouille de règles d’association. Notre première contribution introduit un nouveau cadre de clustering, où les objets complexes sont décrits par des formules propositionnelles. Premièrement, nous adaptons les deux fameux algorithmes de clustering, à savoir, le k-means et l’algorithme hiérarchique ascendant, pour traiter ce type d’objets complexes. Deuxièmement, nous introduisons un nouvel algorithme hiérarchique descendant pour le clustering des objets représentés explicitement par des ensembles de modèles. Enfin, nous proposons un encodage basé sur la satisfiabilité propositionnelle du problème de clustering des formules propositionnelles sans avoir besoin d’une représentation explicite de leurs modèles. Dans une seconde contribution, nous proposons une nouvelle approche basée sur la satisfiabilité pour extraire les règles d’association en une seule étape. La tâche est modélisée comme une formule propositionnelle dont les modèles correspondent aux règles à extraire. Pour montrer la flexibilité de notre cadre, nous abordons également d’autres variantes, à savoir, l’extraction des règles d’association fermées, minimales non redondantes, les plus générales et les indirectes. Les expérimentations sur de nombreux jeux de données montrent que sur la majorité des tâches de fouille de règles d’association considérées, notre approche déclarative réalise de meilleures performances que les méthodes spécialisées.