Mise en oeuvre de logiciels de comparaison de sequences biologiques sur des machines specialisees systoliques. Application a l'analyse de genomes

par PASCALE GUERDOUX JAMET

Thèse de doctorat en Sciences biologiques et fondamentales appliquées. Psychologie

Sous la direction de Jean-Loup Risler.

Soutenue en 1997

à Paris 6 .

    mots clés mots clés


  • Résumé

    Mon travail prote sur la mise en uvre de logiciels de comparaison de sequences biologiques sur des machines specialisees. Les algorithmes utilises sont ceux traditionnellement employes pour faire de la recherche de similitude et/ou d'homologie dans les banques (fasta, blast, smith & waterman). Les machines specialisees baties sur le modele systolique, apportent des solutions aux problemes de temps de calcul sans entrainer de degradation dans la qualite des resultats. Deux prototypes sont etudies : le premier, hscan, accelere les algorithmes de comparaison sans insertion/ deletion ; il est mis en uvre a l'aide d'une technologie fpga (logique reconfigurable). Le second, samba, accelere tous les algorithmes de comparaison et est construit sur la base d'un reseau de processeurs dedies. Les performances suivantes sont obtenues : acceleration de fasta et blast utilises avec leur sensibilite maximale d'un facteur pouvant aller respectivement jusqu'a 130 et 15 grace a hscan ; acceleration de ssearch pouvant aller jusqu'a 200 pour samba. Ces performances sont d'autant plus elevees que le volume de donnees a traiter est important. Deux applications sur des problemes biologiques sont presentees. La premiere est une analyse exhaustive des sequences anonymes de saccharomyces cerevisiae. La seconde est un travail plus general sur le genome de escherichia coli. La machine samba a permis la construction de familles d'homologie entre les proteines de e. Coli. Ces familles ont ete integrees dans un serveur metalgen, qui regroupe de multiples sources d'informations sur le genome de e. Coli, telle que l'utilisation des codons dans les sequences codantes. Ce serveur a permis d'analyser la strategie d'utilisation des codons chez e. Coli en particulier dans certains sous systemes biologiques comme les systemes de transport, les complexes multienzymatiques ou encore les chaines de biosynthese.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 233 P.
  • Annexes : 174 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université Pierre et Marie Curie. Bibliothèque Universitaire Pierre et Marie Curie. Section Biologie-Chimie-Physique Recherche.
  • Consultable sur place dans l'établissement demandeur
  • Cote : T Paris 6 1997 93
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : PMC RT P6 1997
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.