Algorithmes pour l'étude de la structure secondaire des ARN et l'alignement de séquences

par Feng Lou

Thèse de doctorat en Informatique

Sous la direction de Peter G. Clote et de Alain Denise.

Soutenue le 30-01-2012

à Paris 11 , dans le cadre de Ecole doctorale Informatique de Paris-Sud , en partenariat avec Laboratoire de recherche en informatique (Orsay, Essonne) (laboratoire) .


  • Résumé

    Ces travaux de thèse concernent la conception et l'étude d'algorithmes, d'une part pourprédire les quantités thermodynamiques et la structure secondaire des ARN, d'autre part pour l'alignement de séquences.Dans une première partie, nous appliquons un algorithme de Monte-Carlo pour approximer la densité d'états d'énergie des structures secondaires d'une séquence d'ARN, ou d'une hybridation de deux molécules d'ARN données. Nous montrons d'abord que la densité estimée par notre programme est aussi bonne que la densité exacte, et le temps d'exécution de notre programme est beaucoup plus rapide. Nous calculons ensuite la température de dénaturation d'une hybridation de deux molécules d'ARN. Nous montrons que nos températures de dénaturation sont plus proches des valeurs expérimentales que celles des deux autres programmes existants.Puis, dans une deuxième partie, nous implémentons un algorithme de programmation dynamique qui engendre des structures sous-optimales, dédié principalement à la prédiction des deux structures fonctionnelles des riboswitchs. Nous appliquons d'abord notre programme sur un riboswitch TPP dans lequel nous avons réussi à détecter les deux structures fonctionnelles. Nous montrons ensuite que les structures prédites par notre programme sont plus proches de la structure réelle par rapport aux cinq autres programmes existants, sur un échantillon de riboswitch purine.Enfin, dans une troisième partie, nous présentons un algorithme de recherche des alignements sous-optimaux de séquences pour améliorer la qualité d'alignement des séquences. Nous comparons d'abord nos alignement à ceux produits par l'algorithme de Needdleman-Wunsch. Nous prédissons plus d'alignements de référrence par rapport l'algorithme de Needdleman-Wunsch. Nous calculons ensuite les fréquences des paires de bases alignées et les entropies de position spécifique dans nos alignements sous-optimaux. Nous montrons que les entropies calculées à partir de notre programme sont plus corrélées que celles des autres programmes avec les positions des paires de résidus fiablement alignées selon BAliBASE.

  • Titre traduit

    Algorithms for the study of RNA secondary structure and sequence alignment


  • Résumé

    This thesis concerns the design and study of algorithms, on the one hand to predict the thermodynamic quantities and the secondary structure of RNA, the other for sequence alignment.In the first part, we apply a Monte Carlo algorithm to approximate the density of states for secondary structures of a given RNA sequence, and for hybridizations of two RNA sequences. We first show that the density estimated by our program is as good as the exact density, and the execution time of our program is much faster. We then calculate the melting temperature for a hybridization of two RNA sequences. We show that our melting temperatures are closer to experimental values than the other two programs.Then in the second part, we implement a dynamic programming algorithm that generates sub-optimal structures, mainly dedicated to the prediction of functional structures of riboswitchs. We first apply our program on a TPP riboswitch in which we were able to detect both functional structures. We then show that the structures predicted by our program are closer to the real structure compared to five other existing programs, on a sample of purine riboswitch.Finally, in the third part, we present a novel algorithm to produce sub-optimal pairwise alignments. We first compare our alignments to those produced by the algorithm of Needdleman-Wunsch. We predict more reference alignments than the algorithm of Needdleman-Wunsch. We then calculate the frequencies and position-specific entropies from our sub-optimal alignments. We show that entropies calculated from our program are more correlated than other programs with locations in the core block of BAliBASE reference alignments.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud 11. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.