Prédiction de réseaux d'interactions biomoléculaires à partir des données de la génomique comparée

par Florian Iragne

Thèse de doctorat en Informatique et mathématiques

Sous la direction de David James Sherman.

Soutenue en 2007

à Bordeaux 1 .


  • Résumé

    Les systèmes biologiques présentent de nombreux phénomènes complexes, aux interactions encore plus complexes. La modélisation a pour but de faciliter l'étude et la compréhension des systèmes biologiques, par l'observation ou la simulation des modèles créés. Les réseaux d'interactions biomoléculaires sous-tendent ces modèles. Les travaux de thèse que nous présentons portent sur la prédiction systématique de réseaux d'interactions biomoléculaires, afin de fournir les éléments d'entrée nécessaires au processus de modélisation. Les deux thèmes centraux seront la prédiction de réseaux d'interactions protéine-protéine et l'extrapolation de voies métaboliques. Nous définissons tout d' bord un cadre formel d'extraction de graphes d'interactions dictée par des politiques, qui permet de créer des résumés intelligents à partir de jeux de données hétérogènes. Une séparation claire des tâches d'extraction et de visualisation de l'information nous permet d'exprimer différents algorithmes existants, estimant par exemple la qualité des réseaux d'interactions biomoléculaires prédits. Nous avons mis en oeuvre ce cadre formel dans le logiciel ProViz. Nous présentons par la suite, des méthodes informatiques d'extrapolation de voies métaboliques, inspirées du précédent formalisme et basées sur l'utilisation de voies de référence et sur une identification robuste d'équivalents fonctionnels. Ces méthodes nous permettent de prédire un ensemble de voies métaboliques centrales, formant la base de modèles pour des organismes dont seules les données génomiques sont disponibles. Les différents résultats, disponibles en ligne ou en cours de publication, nous permettent de valider notre approche.

  • Titre traduit

    Biololecular interaction networks prediction using compartive genomics data


  • Résumé

    Biological systems are complex systems, in that they cannot be fully understood through sole study of individual components. Network representations of the relations between individual and groups of functional elements are essential for studying these systems. These networks underly mathematical models of cell processes and their construction is a prerequisite for the modelling step. In this thesis, we present our work on systematic prediction of biomolecular interactions using comparative genomics data. The main two axis of this thesis are the prediction of protein-protein interaction networks, and the extrapolation of metabolic pathways. We will first present a formal framework, called ``graph extraction policies'', that enables the construction of biomolecular interaction networks from heterogeneous datasets, using an strategy based on neighbourhood exploration. This framework enables us to include third-part algorithms, to compute network prediction quality or any other information. We have implemented this framework in ProViz. We then introduce two methods to extrapolate metabolic pathways, based on reference pathways and on the robust identification of functional homologs. These methods enable us to provide core metabolic pathways as a base of models for organisms that are only sequenced, and are available online or under publication.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (v-152 p.)
  • Annexes : Bibliogr. p. 107-121. Annexes

Où se trouve cette thèse ?

  • Bibliothèque : Université de Bordeaux. Direction de la Documentation. Bibliothèque Sciences et Techniques.
  • Disponible pour le PEB
  • Cote : FTA 3388
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.