Thèse soutenue

Décomposition et évaluation des mesures de stabilité d'un partitionnement

FR  |  
EN
Auteur / Autrice : Lassad El Moubarki
Direction : Pierre CazesPatrice Bertrand
Type : Thèse de doctorat
Discipline(s) : Informatique. Statistique exploratoire multidimensionnelle
Date : Soutenance en 2009
Etablissement(s) : Paris 9 en cotutelle avec Université de Tunis. Institut supérieur de gestion

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Plusieurs méthodes ont récemment été proposées afin de valider un partitionnement en évaluant sa stabilité. Les mesures de validation utilisant le critère de stabilité se diffèrent, essentiellement, par leurs façons de comparer les partitions. Partant du principe qu'un manque de stabilité est dû à un défaut de cohésion et/ou d'isolation des classes, nous proposons d'interpréter certaines mesures de stabilité, tel que l'indice de Rand, par le degré global d'isolation et de cohésion de la partition. Nous montrons que pour toutes les classes, ces degrés de cohésion et d'isolation se décomposent en fonction des contributions de chaque élément de l'ensemble des données à classer. Nous illustrons notre approche sur des données réelles et sur des données simulées. En particulier, nous traitons un jeu de données simulées qui illustre le comportement asymptotique des mesures de stabilité qui a été formellement établi dans un article récent de Ben David, von Luxburg (2008). De plus, nous comparons, sur les jeux de données traités, les différentes mesures de stabilité de partitions obtenues par plusieurs méthodes de classification