Outils et méthodes pour la classification pyramidale de données biologiques

par Laure Vescovo

Thèse de doctorat en Bio-informatique

Sous la direction de Jean-Loup Risler.

Soutenue en 2007

à Evry-Val d'Essonne .


  • Résumé

    Le séquençage de génomes complets produit des quantités de données et la génomique comparative introduit de nouveaux problèmes. Nous nous intéressons à l'amélioration de la classification pyramidale pour ses propriétés permettant d'obtenir des représentations proches des données. L'algorithme de calcul des pyramides induit un biais important. Nous proposons deux approches de filtrage pour le corriger : une solution optimale, réalisée par régression isotone, et une approche heuristique. Nous présentons aussi un algorithme permettant d'obtenir la pyramide après l'étape de filtrage. Nous appliquons les pyramides à l'alignement multiple progressif de séquences qui utilise une structure de guidage pour définir l'ordre des séquences à aligner. Nous avons étudié l'influence de cette structure. Cette étape est importante et il faut utiliser une méthode adaptée. Nous proposons aussi une approche d'alignement mixte, basée sur les stratégies d'alignement local et global à partir des pyramides.


  • Résumé

    The sequencing of complete genomes produces a lot of data and the comparative genomics introduces new problems. We focus on the improvement of the pyramidal classification for its properties allowing to obtain representations close to the data. The calculation algorithm of the pyramids induces an important skew. We propose two approaches of filtering to correct it: an optimal solution, carried out by isotone regression, and a heuristic approach. We present also an algorithm allowing to obtain the pyramid after the filtering step. We apply the pyramids to the progressive multiple alignment of sequences which uses a guide structure to define the order to align the sequences. We studied the influence of this structure. This step is important and an adapted method should be used. We propose also a mixed approach of alignment, based on the strategies of local and global alignment starting from the pyramids.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (233 p.)
  • Annexes : Bibliogr. p. 227-233

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Evry-Val d'Essonne. Service commun de la documentation. Bibliothèque centrale.
  • Consultable sur place dans l'établissement demandeur
  • Cote : 004.015 7
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.