Extension et optimisation pour la segmentation de la distance de kolmogorov-smirnov

par MOUNIR ASSERAF

Thèse de doctorat en Sciences appliquées

Sous la direction de Edwin Diday.

Soutenue en 1998

à Paris 9 .


  • Résumé

    La segmentation est une methode qui entre dans le cadre de l'analyse des donnees multidimensionnelles ; elle se distingue des autres methodes lorsqu'on passe a la phase descriptive des resultats, telle que la lisibilite des regles de decision. La segmentation peut etre vue, d'une part, comme une methode exploratoire et descriptive permettant de resumer et structurer, sous la forme d'un arbre binaire, un ensemble d'observations multidimensionnelles. D'autre part, comme un outil decisionnel et inferentiel visant a produire une regle de classement sur les objets appartenant a une partition connue a priori. Dans la phase decisionnelle, la segmentation emploie un ensemble d'outils statistiques et probabilistes (la theorie bayesienne, les techniques d'echantillonnage, l'estimation de parametres, ). En pratique, plusieurs travaux sur la segmentation ont conduit recemment a developper des algorithmes d'aspects exploratoire et decisionnel, souvent fiables et efficaces ; quant aux regles de production elles sont aisement interpretables par des non-specialistes de la statistique. On rencontre de nombreuses applications realisees dans divers domaines tels que la medecine, la biologie ou la reconnaissance des formes. Dans cette these, on s'interesse au critere de kolmogorov-smirnov, qui fait partie des outils de la segmentation sur les variables quantitatives. Plusieurs simulations ont conclu positivement, tant sur son pouvoir de discrimination assez puissant que sur sa robustesse et son efficacite asymptotique au sens de bayes. La premiere phase de ce travail est consacree a l'extension de ce critere aux variables qualitatives et aux proprietes asymptotiques. La deuxieme phase porte sur la reduction de la complexite exponentielle pour la recherche d'une solution globalement optimale a une complexite polynomiale de degres trois. La phase finale s'interesse a la programmation de ce critere et a son integration dans le logiciel sicla.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 180 P.
  • Annexes : 106 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : G-ASS
  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.