Classification automatique et modèles

par Yamina Bencheikh

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Gérard Govaert.

Soutenue en 1992

à Metz .


  • Résumé

    Jusqu'à présent deux tendances parallèles se sont dégagées dans le développement et la pratique du traitement statistique des données ; la première met en jeu des méthodes qui envisagent la possibilité d'une interprétation probabiliste, la deuxième fait intervenir une classe assez vaste de méthodes de classification automatique conçues dans un cadre purement géometrique. Notre travail se situe à mi-chemin entre ces deux approches ; en effet les liens qui existent entre l'approche probabiliste et l'approche géometrique nous ont permis d'interpréter des méthodes de classification automatique en termes probabilistes, de justifier a posteriori certaines contraintes imposées souvent pour des raisons techniques d'optimisation et de proposer de niveaux critères pouvant améliorer la qualité de la partition ; nous généralisons ensuite l'étude de ces liens aux cas où les données mettent en jeu deux ensembles. Nous montrons comment la classification croisée peut être vu comme une solution à un problème d'estimation de paramètres d'un modèle de mélanges, nous développons une méthode de reconnaissance des composants d'un mélange croisé qui nous permettra d'interpréter des méthodes de classification croisées et de proposer de nouveaux algorithmes de classification croisée utilisant des distances adaptatives. Certaines méthodes proposées dans ce travail ont été programmées et intégrées au logiciel d'analyse de données SICLA (système interactif de classification automatique, INRIA)

  • Titre traduit

    Automuatic clustering and models


  • Résumé

    Up to now, two parallel trends have emerged in the developement and practice of statistical data processing. The first one involves methods that consider the possibility of a probalilistic interpretation ; the second one uses a rather large group of automatic clustering methods applied within a purely geometrical framework. Our study is set halfway betwen those two approach ; indeed the links that exist betwen the probabilistic approach and the geometrical approach have enabled us to interpret automatic clustering methods in probabilistic terms, to propose new criteria that can improve the quality of the partition ; we then extend the study of these links to cases were the data involve two sets ; we show how the cross clustering can be seen as a solution to a problem for the estimation of the parameters of a model with crossed mixture, we develop a method of identification of crossed mixture ; this method will enable us to interpret cross clustering methods and to propose new cross clustering algorithms using adaptative distances. Some methods proposed in this study have been programmed and integrated into the data analysis software SICLA (Interactif Systeme of Automatic Clustering, INRIA)

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (144 f.)
  • Annexes : Bibliogr. f. 140-144

Où se trouve cette thèse ?

  • Bibliothèque : Université de Lorraine. Direction de la documentation et de l'édition. Bibliothèques Metz et Moselle.
  • Non disponible pour le PEB

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Non disponible pour le PEB
  • Cote : MF-1992-BEN
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.