Algorithmes de prédiction et de recherche de multi-structures d'ARN

par Azadeh Saffarian

Thèse de doctorat en Informatique

Sous la direction de Hélène Touzet et de Mathieu Giraud.

Soutenue le 16-11-2011

à Lille 1 , dans le cadre de École doctorale Sciences pour l'Ingénieur (Lille) .


  • Résumé

    L'ARN (acide ribonucléique) est une molécule ubiquitaire qui joueplusieurs rôles fondamentaux au sein de la cellule: synthèse desprotéines avec les ARN messagers, activité catalytique ou implicationdans la régulation, les ARN non-codants. Les nouvelles technologies deséquençage à haut- débit permettent de produire des milliards de séquences à moindre coût, posant de manière cruciale la question de l'analyse de ces données.L'objectif de cette thèse est de définir de nouvelles méthodescomputationnelles pour aider à l'analyse de ces séquences dans le casdes ARN non-codants. Dans cette perspective, la "structuresecondaire" d'un ARN, formée par l'ensemble des appariements entrebases, délivre des informations utiles pour étudier la fonction del'ARN. Notre travail se concentre plus particulièrement surl'ensemble des structures potentielles que peut adopter une séquenced'ARN donnée, ensemble que nous appelons "multi-structure". Nousapportons deux contributions: un algorithme pour générersystématiquement toutes les structures localement optimales composantune multi-structure, et un algorithme basé sur la recherche d'unemulti-structure pour identifier un ARN non-codant dans une séquencegénomique. Ces résultats ont été mis en oeuvre dans deux logiciels,Alterna et Regliss, appliqués avec succès à des ensembles de test.

  • Titre traduit

    Prediction and pattern matching algorithms for RNA multi-structures


  • Résumé

    RNA (ribonucleic acid) molecules have various functions in cells. Justas they can store and deliver the DNA message for the proteinsynthesis (messenger RNAs), they can also directly catalyze chemicalreactions or act as a regulator (functional RNAs, also callednon-coding RNAs). Nowadays, recent sequencing technologies yield billions of genomic sequences - DNA, RNA - at a very small cost. However, sequencing isonly the first step: The function of the sequence remains open forinvestigation. The objective of the thesis is to define newcomputational methods to help sequence and structure analysis ofnon-coding RNAs. In this perspective, the "secondary structure" of an RNA,made with base pairs, provides useful hints to further study itsfunction. Our work is focused on sets of all possible RNA structuresfor a given sequence, introducing the concept of "RNAmulti-structures". The thesis details how such sets can be constructed systematically to generate all locally optimal secondary structures, and how they can be used as a pattern to identify non-coding RNAs in genomic sequences.We provide efficient algorithms for these two problems. Thesealgorithms have been implementated in the software tools Alterna andRegliss and tested on real data, providing new insight into RNAstructures.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Informations

  • Détails : 1 vol. (89 p.)
  • Annexes : Bibliogr. p. : 81-89. 135 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université des sciences et technologies de Lille (Villeneuve d'Ascq, Nord). Service commun de la documentation.
  • Disponible pour le PEB
  • Cote : 50376-2011-204
  • Bibliothèque : Université des sciences et technologies de Lille (Villeneuve d'Ascq, Nord). Service commun de la documentation.
  • Disponible pour le PEB
  • Cote : 50376-2011-203
  • Bibliothèque : Université des sciences et technologies de Lille. Service commun de la documentation. Bibliothèque virtuelle.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.