Thèse soutenue

Contribution de la classification automatique à la fouille de données

FR
Auteur / Autrice : François-Xavier Jollois
Direction : Maurice Margenstern
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2003
Etablissement(s) : Metz

Mots clés

FR

Mots clés contrôlés

Résumé

FR

La classification est une étape essentielle dans un processus de fouille de données. Les méthodes usuelles que nous décrivons se basent sur des critères métriques. Mais, l'utilisation des modèles de mélange dans la classification est devenue une approche classique et puissante. En traitant la classification sous cette approche, à partir des algorithmes de type EM, nous nous sommes intéressés aux problèmes suivants : recherche du nombre de classes, gestion des données manquantes, stratégies d'initialisation et accélération de l'algorithme. L'algorithme EM est devenu quasiment incontournable dans l'approche mélange; Alors que beaucoup de travaux sont effectués sur des données continues, nous avons choisi de nous interesser principalement aux données binaires et qualitatives. En premier lieu, nous avons proposé une étude comparative de critères de choix du nombre de classes les plus utilisées.