Thèse soutenue

Etude algorithmique et statistique de la comparaison des structures secondaires d'ARN

FR  |  
EN
Auteur / Autrice : Claire Herrbach
Direction : Serge DulucqAlain Denise
Type : Thèse de doctorat
Discipline(s) : Informatique et mathématiques
Date : Soutenance en 2007
Etablissement(s) : Bordeaux 1

Résumé

FR

Notre travail s'inscrit dans la problématique de la comparaison de structures d'ARN. Nous étudions en particulier le cas des structures secondaires sans pseudo-noeud, qu'il est possible de modéliser par des arbres ordonnés étiquetés. Il existe des algorithmes polynomiaux d'édition et d'alignement d'arbres. Cependant, les opérations d'édition utilisées par ces algorithmes ne sont pas adaptées pour l'ARN. D'un autre côté, il a été montré que si l'on utilise un jeu d'opérations réalistes d'un point de vue biologique, le problème de l'édition de structures secondaires sans pseudo-noeud est NP-complet. Dans cette thèse, nous étudions le problème de l'alignement, avec ce même jeu d'opérations réaliste, de structures secondaires d'ARN sans pseudo-noeud. Nous proposons un algorithme polynomial d'alignement global et ses variantes d'alignement local et de recherche d'un motif structurel. Puis nous montrons que cet algorithme, et par le même coup l'algorithme classique d'alignement d'arbres ordonnés, a une complexité moyenne en O(n2). Nous avons implanté notre algorithme d'alignement ainsi que ses variantes afin de comparer notre approche aux outils déjà existants, et nous présentons quelques résultats. Nous présentons ensuite un travail préliminaire sur la construction de matrices de scores pour chaque opération d'édition réaliste pour l'ARN. Enfin, nous étudions le problème de sous-structures secondaires communes à un ensemble de structures tertiaires d'ARN, de façon à maximiser le nombre d'empilements. Nous montrons que dans le cas général, ce problème est NP-complet. Cependant, nous donnons un algorithme polynomial dans le cas où le nombre de structures en entrée est fixé.