Algorithmes incrémentaux pour l'alignement multiple et la phylogénie de grandes familles de séquences homologues

par Jean-François Dufayard

Thèse de doctorat en Informatique. Systèmes et communication

Sous la direction de François Rechenmann.

Soutenue en 2004

à l'Université Joseph Fourier (Grenoble) .

    mots clés mots clés


  • Résumé

    La gestion d'une famille de séquences similaires consiste la plupart du temps à calculer l'alignement multiple puis l'arbre phylogénétique des séquences, ainsi que mettre ces données à jour lorsque de nouvelles séquences sont ajoutées à la famille. Pour des familles de taille réduite (environ inférieure à 2000 gènes), les algorithmes existants pour le calcul des alignements multiples et la construction des arbres phylogénétiques répondent bien aux besoins des biologistes. Cependant, un problème de gestion se pose pour des familles de taille plus importante. Lorsqu'une nouvelle séquence doit être ajoutée à une famille existante, la seule solution est actuellement de recalculer l'alignement multiple et reconstruire l'arbre phylogénétique intégralement. Cette solution n'est pas concrètement utilisable pour des familles de gènes homologues pouvant atteindre la taille de plusieurs dizaines de milliers de membres. Des algorithmes incrémentaux pour le calcul d'alignements multiples et la construction d'arbres phylogénétiques ont été développés dans le cadre de ce travail de thèse. Lorsqu'une séquence est ajoutée dans une famille, l'alignement et l'arbre sont modifiés et non recalculés. Cela permet d'une part d'éviter une partie des redondances de calcul, et d'autre part d'être plus réaliste vis-à-vis de l'utilisation qui est faîte de ce type d'algorithmes. Ces algorithmes ont été implémentés dans un logiciel appelé "Mentalign ". "Mentalign" a été testé sur de nombreuses familles de séquences similaires issues des bases de données.


  • Pas de résumé disponible.

  • Titre traduit

    Incrementai algorithms for the alignement the phylogeny of large homologous sequence families.


  • Résumé

    The managment of similar sequence families consists into computing a mutliple alignment and é phylogenetic tree for each family, and to be able to add new sequences of the family in both the structures. For sm ail families (less than 2000 sequences), existing algorithms are efficient enough for biologists needs. But many problems occur for larger families. First, for families larger than 2000 sequences existing algorithms are most of the time unable to compute a result in a reasonnable time. And wher new sequences are added in a family, the only solution with these algorithms is to recompute entirel) the alignment and the tree. In order to solve this problem, incremental algorithms has been developped. They are able to adc new sequences to an alignment and a tree in a short time, avoiding redondant computings. These algorithms have been implemented in a software named "Mentalign", and have been tested with man) different families.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 95 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 93-95

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS04/GRE1/0215
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS04/GRE1/0215/D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.