Thèse de doctorat en Bioinformatique. Biologie structurale et génomique
Sous la direction de Patrick Lemaire.
Soutenue en 2009
à Aix-Marseille 2 , dans le cadre de Ecole Doctorale Sciences de la Vie et de la Santé (Marseille) .
Intégration de données biologiques : pour une compréhension globale du développement des ascidies
La complexification des problématiques biologiques et l’incrément exponentiel des données disponibles pour répondre à ces questions mènent à des problèmes dans la gestion et l’intégrationde ces données. J’ai donc cherché dans ce travail l’application de techniques d’intégration de données pour la résolution de problèmes biologiques complexes. Dans ce contexte, la base de données ANISEED constitue une plateforme idéale pour l’intégration de données biologiques. J’ai donc utilisé cette ressource pour répondre à des questions biologiques: 1) est-ce que le plandu corps des cordées qu’on trouve dans les ascidies et les vertébrées est liée a un programme génétique commun? En comparant les données d’expression de gènes de Ciona et poisson zèbre, j’ai remarqué une divergence généralisé des patrons d’expression des deux espèces, avec plus de similarité dans des tissues liés à la locomotion; 2) quels sont les réseaux de régulation de gènes responsables pour le développement de l’ascidie? A partir de la formalisation de règles simples utilisées par les chercheurs pour inférer des interactions, j’ai pu extraire automatiquement, des données expérimentales disponibles en ANISEED, un réseau de régulation de gènes pendant le développement embryonnaire de l’ascidie. Ces exemples peuvent indiquer des chemins possibles pour l’application de l’intégration de données à la biologie.
The growing complexity of biological questions and the exponential increase in available data to explore these questions are making the management and integration of such information a serious issue for a successful research activity. I therefore aimed at exploring how data integration techniques could be used to answer complex biological problems. In this context, the ANISEED database emerged as an ideal data integration platform, given its rich representation of concepts related to organism development, the availability of large volumes of multiple types of experimental data and the relative simplicity of the ascidian model system. I thus used this rich resource to explore complex biological questions: 1) is the chordate body plan found both in ascidians and vertebrates the result of a common genetic program? By systematically comparing all available gene expression patterns from ANISEED and ZFIN (for zebrafish) I observed a generalized divergence in the gene expression programs of both species, with some similarity noticeable in the locomotory system; 2) what are the gene regulatory networks underlying ascidian development? By formalizing simple rules used by researchers to infer gene regulatory events, I was able to automatically recover, from the experimental data available in ANISEED, a network of gene regulatory interactions throughout ascidian development. These simple examples may indicate potential paths towards the use of data integration in Biology.