Thèse soutenue

Détection de répétitions en tandem avec évolution : application aux séquences biologiques

FR  |  
EN
Auteur / Autrice : Richard Groult
Direction : Jean-Pierre Duval
Type : Thèse de doctorat
Discipline(s) : Informatique. Bioinformatique
Date : Soutenance en 2004
Etablissement(s) : Rouen

Mots clés

FR

Résumé

FR  |  
EN

Une répétition en tandem avec évolution consiste en une suite de copies plus ou moins contigue͏̈s où chaque copie est fortement similaire à celle qui la précède et à celle qui lui succède. Il n'existe pas de notion de modèle comme pour les répétitions en tandem "classiques" et la première et la dernière copie peuvent être complètement différentes. Ce "nouveau" type de répétition a été mis en évidence durant l'assemblage du génome humain. Dans ce manuscrit, je commence par définir, de façon formelle, les répétitions en tandem avec évolution à partir des observations effectuées dans les séquences biologiques. Après avoir effectué des tests sur des logiciels de recherche de répétitions, je conclus qu'il n'existe pas de logiciel capable de les détecter efficacement. J'ai alors conçu des algorithmes capables de détecter ce type de répétitions : un premier algorithme, quadratique en la longueur de la séquence, puis un algorithme linéaire. Ces algorithmes ont été implantés afin de mettre à disposition des biologistes des outils qui détectent efficacement ces répétitions dans de très grandes séquences génomiques, telles les chromosomes humains. Plusieurs méthodes de parallélisation sont également présentées. Les résultats des tests réalisés sur des chromosomes montrent la présence de ces répétitions dans plusieurs génomes.