Validation d'une classe par estimation de sa stabilité

par Ghazi Bel Mufti

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Edwin Diday.

Soutenue en 1998

à Paris 9 .


  • Résumé

    A l'issue d'une classification automatique, il est naturel et important de s'assurer de la validité des classes obtenues. Dans la première partie de notre travail, nous présentons les principes généraux des méthodes de validation en classification automatique. Trois types de validation sont alors traités : l'adéquation des résultats obtenus avec la dissimilarité initiale, la mesure de la stabilité des résultats et l'écart entre les classifications obtenues sur échantillon d'apprentissage et sur échantillon test. Dans la deuxième partie, nous présentons les principales approches qui ont été proposées pour valider une classe issue d'un algorithme de classification. Enfin, dans la troisième partie, nous proposons trois indices de validation i, h et v qui mesurent respectivement l'isolation, la compacité et la validité d'une classe. Les valeurs prises par ces indices ne peuvent être interprétées directement, mais elles sont utilisées afin de tester l'hypothèse nulle h#0 pour laquelle les données sont reparties de façon uniforme dans l'enveloppe convexe des données initiales. A partir de jeux de données simulés, et en tenant compte de plusieurs facteurs (i. E taille des échantillons, nombre de classes générées, méthode de classification utilisée, forme, séparation et degré d'homogénéité des classes), nous décrivons le comportement des trois indices, et comparons leurs valeurs à celles prises par l'indice u de validité introduit par Gordon. Ces simulations nous ont permis de constater que les trois indices, i, h et v constituent un outil précis de validation, et qui permettent de détecter la présence de points qui influencent l'isolation et/ou la compacité d'une classe

  • Titre traduit

    Validation of a cluster by estimating its stability


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 136 p
  • Annexes : 92 réf

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : G-BEL