Contribution des algorithmes évolutionnaires au partitionnement des données

par Fatima-Zohra Kettaf

Thèse de doctorat en Informatique

Sous la direction de Jean-Pierre Asselin de Beauville.

Soutenue en 1997

à Tours .


  • Résumé

    Dans cette thèse, on s'intéresse à l'apport des algorithmes évolutionnaires (algorithme génétique et stratégie d'évolution) au partitionnement des données. Il est en effet aujourd'hui reconnu que les méthodes évolutionnaires, par leur parallélisme implicite possèdent de bonnes aptitudes à l'exploration globale de l'espace de solutions et ne nécessitent pas de modélisation a priori des données. Nous proposons de nouveaux codages d'une partition à nombre de classes fixes ou non relativement à différents modèles de classification (exclusive, flore, possibiliste, mélange de lois de probabilité). Ces codages sont de trois types : par appartenance, par prototype et par similitude. Les algorithmes que noous proposons sont construits à partir de ces codages et recherchent en parallèle, dans l'espace des partitions codées, le nombre de classes et la classification associée. Une des originalités de cette thèse concerne l'utilisation de chromosone de longueur variable pour le partitionnement, le nombre de classes n'étant pas fixe a priori. On introduit aussi de nouveaux opérateurs génétiques d'insertion et de fusion de classes à l'image de l'algorithme Isodata. Les algorithmes sont valides sur des données réelles et simulées et compares à deux méthodes de classification non génétique (GMVE et Isodata).

  • Titre traduit

    Contributions of evolutionary algorithms to partitional clustering


  • Résumé

    In this work we are interested in the contribution of evolutionary algorithms (genetic algorithm and evolution strategy) to the partionning problem. It is well known today, that evolutionary methods with their implicit parallelism, have good abilities to perform a global search in the space of possible solutions of the problem at hand, and that they don't need any prior modelling of the data. We propose here new partition encodings with known or unknown number of clusters, adapted to different clustreing models (exclusive, fuzzy, possibilist, mixture model. . . ). These encodings are : belongness, prototype, and similitude. The algorithms we propose are based on these encodings and seek in the partitions'space the number of clusters and the "optimal" partition in regard to a predefined criterion. One of the originality of this thesis is the use of variable length chromosomes, which easily adapt to partitions' encodings with variable number of clusters. We also introduce new genetic operators : insertion and deletion of clusters as in the isodata algorithm. Finally, we give some experimental results on simulated and real data of our algorithms and compare them to GMVE and isodata ones.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 217 p.
  • Annexes : Bibliogr. p. 204-217

Où se trouve cette thèse ?

  • Bibliothèque : Université François Rabelais. Service commun de la documentation. Section Sciences-Pharmacie.
  • Disponible pour le PEB
  • Cote : TS-1997-TOUR-4008
  • Bibliothèque : Ecole Polytechnique de l’Université François Rabelais . Départements Electronique et Energie, Informatique, Mécanique et Systèmes. Centre de documentation.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.