Développement d’un environnement bioinformatique dédié à la construction d’architectures d’ARN

par Thomas Ludwig

Thèse de doctorat en Sciences du vivant

Sous la direction de Eric Westhof.


  • Résumé

    Les découvertes de ces dernières années suggèrent que la complexité et le degré d’évolution d’un organisme sont reliés à l’existence de centaines de milliers d’ARN non codants, de petites et de grandes tailles. Ainsi, de «simple» acteur dans les mécanismes de traduction (via les ARNm, ARNt et ARNr), l’ARN se retrouve être un élément clé dans un nombre toujours croissant de mécanismes régulant les grandes fonctions biologiques et, par voie de conséquence, de mécanismes les perturbant et impliqués dans les phénomènes de cancer, d’infections virales et d’affections neurologiques. En conséquence, on assiste depuis quelques années au développement de nombreux outils permettant l’identification de nouveaux ARN non codants au sein des génomes séquencés. Ils ont permis de découvrir un nombre très important de nouveaux candidats dans les organismes modèles. La validation expérimentale de ces candidats et la compréhension de leur fonction biologique passe par la détermination de leur architecture tridimensionnelle. Malheureusement, les limites des approches expérimentales actuelles ne permettent pas de répondre assez rapidement à ce besoin de validation. Dans ce contexte, nous avons décidé de développer un environnement bioinformatique permettant d’optimiser la construction et la compréhension des architectures d’ARN. La première partie de cette thèse se focalise sur la description de cette infrastructure nommée P. A. R. A. DIS. E (Platform to Analyze RNA Annotations over a Distributed Environment). Son développement peut se subdiviser en trois grands axes : – un moteur de gestion des annotations d’ARN (structures secondaires et tertiaires, alignements de séquences,. . . ) – une couche de communication permettant d’utiliser de manière transparente des algorithmes produisant ces annotations. – une couche graphique facilitant la visualisation et la manipulation des ces annotations au moyen de représentations adaptées. La seconde partie est plus particulierment dédiée à la description du module graphique nommé Assemble permettant de construire un modèle de structure tridimensionnelle pour une molécule d’ARN dont la structure secondaire est connue. Assemble dispose d’un grand nombre d’outils automatiques permettant de réaliser un modèle le plus rapidement possible en rendant possible la génération automatique d’un premier jet de structure tertiaire, l’application de motifs structuraux sur certaines régions du modèle et l’affinement des coordonnées du modèle en accord avec des contraintes structurales. L’utilisateur a également la possibilité d’afficher une carte de densité électronique, servant de repère dans le processus de modélisation. Enfin, la troisième et dernière partie du manuscrit s’attache à la validation des outils que nous avons développés, en décrivant de façon détaillée leurs applications concrètes à des problématiques biologiques d’actualité autour de l’ARN.

  • Titre traduit

    Development of a bioinformatics environment dedicated to the construction of RNA architectures


  • Résumé

    Recent discoveries suggest that the complexity and degree of evolution of an organism is linked to the existence of hundreds of thousands non coding RNA of various sizes. Thus, from a mere actor in translation mechanisms (through mRNA, tRNA and rRNA), RNA is found to be a key element in an ever increasing number of mechanisms regulating important biological functions, and therefore in mechanisms disturbing them and is involved in cancer, viral infections and neurological pathologies. In consequence, we witness, since a few year, the development of numerous tools dedicated to the identification of new non coding RNA within the sequenced genomes. Those tools allowed the discovery of a great number of new candidates within model organisms. Experimental validation of these candidates and understanding of their biological function rely on the determination of their three-dimensional architectures. Unfortunately, the limitations in current experimental approaches do not allow to answer quickly enough this need of validation. In that context, we decided to develop a bioinformatics environment to optimize the construction and understanding of RNA architectures. The first part of the present thesis is focused on the description of our infrastructure named P. A. R. A. DIS. E (Platform to Analyze RNA Annotations over a Distributed Environment). Its development can be divided in three main axes : – an RNA annotations (secondary and tertiary structures, sequences alignments,. . . ) engine – a communication layer allowing to contact the algorithms that produce these annotations – a graphical layer allowing to visualize and manipulate these annotations using adapted representations. The second part is more specifically focused on the graphical tool Assemble, that allows to build a tertiary structure model for an RNA molecule with a known secondary structure. Assemble proposes a great number of automated tools speeding up the model construction by allowing to generate a first draft of the 3D model, to apply conformations derived from known structural motifs and to refine the model’s coordinates according to structural constraints. The user also has the possibility to display an electronic density map to guide him during the modelling. The third and last part is dedicated to the validation of our bioinformatics tools and describes in details their use to answer RNArelated biological questions.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XI-221 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 195-221

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Strasbourg. Bibliothèque du Studium.
  • Disponible pour le PEB
  • Cote : Th.Strbg.Sc.2008,5733

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2008STR13103
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.