Validation d'une classe par estimation de sa stabilite

par GHAZI BEL MUFTI

Thèse de doctorat en Sciences et techniques communes

Sous la direction de Edwin Diday.

Soutenue en 1998

à Paris 9 .

    mots clés mots clés


  • Résumé

    A l'issue d'une classification automatique, il est naturel et important de s'assurer de la validite des classes obtenues. Dans la premiere partie de notre travail, nous presentons les principes generaux des methodes de validation en classification automatique. Trois types de validation sont alors traites : l'adequation des resultats obtenus avec la dissimilarite initiale, la mesure de la stabilite des resultats et l'ecart entre les classifications obtenues sur echantillon d'apprentissage et sur echantillon test. Dans la deuxieme partie, nous presentons les principales approches qui ont ete proposees pour valider une classe issue d'un algorithme de classification. Enfin, dans la troisieme partie, nous proposons trois indices de validation i, h et v qui mesurent respectivement l'isolation, la compacite et la validite d'une classe. Les valeurs prises par ces indices ne peuvent etre interpretees directement, mais elles sont utilisees afin de tester l'hypothese nulle h#0 pour laquelle les donnees sont reparties de facon uniforme dans l'enveloppe convexe des donnees initiales. A partir de jeux de donnees simules, et en tenant compte de plusieurs facteurs (i. E taille des echantillons, nombre de classes generees, methode de classification utilisee, forme, separation et degre d'homogeneite des classes), nous decrivons le comportement des trois indices, et comparons leurs valeurs a celles prises par l'indice u de validite introduit par gordon. Ces simulations nous ont permis de constater que les trois indices, i, h et v constituent un outil precis de validation, et qui permettent de detecter la presence de points qui influencent l'isolation et/ou la compacite d'une classe.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 136 P.
  • Annexes : 92 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : G-BEL
  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.