Algorithmes de graphes pour la recherche de motifs récurrents dans les structures tertiaires d'ARN

par Mahassine Djelloul

Thèse de doctorat en Informatique

Sous la direction de Alain Guénoche.

Soutenue en 2009

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .


  • Résumé

    Les molécules d'ARN adoptent des formes spatiales complexes prérequises à l'activation de leur fonction biochimique. Élucider la fonction d’une molécule d’ARN revient donc à comprendre les règles qui président à son repliement spatial. Les récentes études structurales ont montré que le repliement d'une molécule d'ARN est initié et stabilisé par ce que l'on appelle les motifs tertiaires qui sont présents de manière récurrente dans différents ARN. Un recensement de ces motifs récurrents est donc une étape indispensable pour mieux comprendre le phénomène de repliement. Du point de vue informatique, une structure tertiaire d���ARN est modélisée par un graphe étiqueté. Les occurrences d’un motif récurrent deviennent, selon ce modèle, des sous-graphes similaires dont la structure commune est a priori inconnue. Ce type de recherche fait appel au problème du sous-graphe commun maximum bien connu pour être NPdifficile et inapproximable. Les contributions de ma thèse sont: (1) une nouvelle mesure de similarité de graphe permettant d'identifier des occurrences similaires d'un motif potentiel, (2) une nouvelle méthode automatique d'extraction et de classification de motifs d'ARN récurrents. Il existe deux types de motifs d’ARN: les motifs locaux incrustés dans des éléments de structure secondaire et les motifs d'interaction faisant intervenir deux ou plusieurs éléments de structure secondaire. Moyennant une légère adaptation, la mesure de similarité proposée s'applique avec succès aux deux types de motifs. La méthode implémentée a été appliquée à un échantillon représentatif de structures d'ARN. Les résultats, expertisés par des biochimistes, sont mis en ligne dans deux sites Web.

  • Titre traduit

    Graph algorithms for identifying recurrent motifs in RNA tertiary structures


  • Résumé

    To perform their biological roles, RNA molecules adopt complex three dimensional structures. Elucidating the rules behind the folding process of an RNA molecule is therefore a prerequisite to a better understanding of its biological functions. Recent structural studies revealed that RNA folding is intiated and stabilized by what is called tertiary motifs. These motifs are recurrently observed in different RNAs suggesting that their biological roles were conserved through evolution. Consequently, a comprehensive inventory of these recurrent motifs proves indispensable to improve our understanding of the RNA folding process. From a computational point of view, an RNA tertiary structure is modeled by a labeled graph. In this model, occurrences of a recurrent motif are viewed as similar subgraphs the common substructure of which is a priori unknown. This problem reduces to the Maximun Common Subgraph problem, well known to be both NP-hard and APX-hard. My thesis’ contribution is two-fold: (1) a new graph similarity measure to identify similar occurrences of a potential recurrent motif, (2) a new automated method to extract and classify recurrent RNA motifs of a priori unknown pattern. There are two types of RNA motifs: local motifs embedded within the secondary structure elements, and interaction motifs involving two or more secondary structure elements. By means of a slight adjustment, the measure and method proposed apply successfully to both types of motifs. The good results produced were validated by experts and made available on two websites.

Autre version

Cette thèse a donné lieu à une publication en 2013 par [CCSD] [diffusion/distribution] à Villeurbanne

Algorithmes de graphes pour la recherche de motifs récurrents dans les structures tertiaires d'ARN

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (II-92 p.)
  • Annexes : Bibliogr. p. 87-92

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2009)226
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.