Biologically inspired algortithms for exploratory projection pursuit

par Souad Larabi Marie-Sainte

Thèse de doctorat en Informatique

Sous la direction de Anne Ruiz-Gazen et de Alain Berro.

Soutenue en 2011

à Toulouse 1 Capitole .

  • Titre traduit

    ˜Les œalgorithmes bio-inspirés appliqués aux projections révélatrices exploratrices


  • Résumé

    La thèse consiste à utiliser des méthodes bio-inspirées pour détecter d’éventuelles structures d’intérêt cachées dans des données volumineuses et multidimensionnelles. L’exploration des données et la détection des structures intéressantes sont basées sur l’utilisation de projections révélatrices qui consistent à optimiser des fonctions appelées indices de projection. Les solutions associées à des optimas sont supposées conduire à des représentations graphiques intéressantes dans des espaces de faibles dimensions. Les structures de données sont complexes et les indices de projection ne possèdent pas nécessairement des propriétés de régularité ce qui rend le problème d’optimisation complexe et coûteux en temps de calcul. Parmi les techniques bio-inspirées, les algorithmes génétiques (AG), l’optimisation par essaim particulaire (l’OEP) et une méthode hybride d’OEP dite Tribes ont été choisies. Trois indices issus de la littérature ont été choisis et un autre indice a été proposé. Ces indices sont optimisés dans le cas unidimensionnel et les structures recherchées sont essentiellement des groupes et/ou atypiques. Ces quatre indices de projection et trois méthodes d’optimisation ont été mis en œuvre dans un logiciel appelé EPP-Lab. Ce logiciel est facile à utiliser avec une manière différente d’analyser les résultats obtenus. La recherche de plusieurs optima locaux a été faite par le biais de lancements successifs indépendants. Une autre stratégie consiste à proposer une méthode multimodale inspirée de Tribes qui permet d’obtenir en un seul lancement plusieurs optima. Enfin, la dernière partie consiste à rechercher des groupes en tenant compte de la position géographique des observations statistiques. Une seconde fonction objectif a été proposée pour minimiser la distance entre les observations statistiques appartenant au même groupe. Trois algorithmes multiobjectifs bio-inspirés ont été choisis. Quelques exemples de données réels et simulés ont été traités pour valider la performance de chaque algorithme dans le contexte des projections révélatrices.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (206 p.)
  • Annexes : Bibliogr. p. 197-206

Où se trouve cette thèse ?

  • Bibliothèque : Université Toulouse 1 Capitole. Service commun de la documentation. Bibliothèque de l'Arsenal.
  • Non disponible pour le PEB
  • Cote : TG1001-2011-10
  • Bibliothèque : Université Toulouse 1 Capitole. Service commun de la documentation. Bibliothèque de la Manufacture des tabacs.
  • Disponible pour le PEB
  • Cote : TMI2011/LAR
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.