Thèse de doctorat en Génétique et mathématiques appliquées
Sous la direction de Sandrine Lagarrigue et de David Causeur.
Soutenue en 2012
Depuis une dizaine d’années, de nombreux projets de génomique fonctionnelle se sont développés, avec pour objectif de mieux comprendre des caractères complexes d’intérêt socio-éconmique en vue de mieux les maîtriser. Ces c aractères sont dits complexes car contrôlés par de multiples facteurs : génétique, alimentation, état de santé…Une stratégie couramment utilisée pour l’étude de tels caractères consiste à localiser des QTL, c'est-à-dire des régions chromosomiques contrôlant leur variabilité. Prarralèlement au développement de ces travaux, les technologies de puces à ADN ont émergé, permettant de mesurer à haut débit l’expression de l’ensemble des gènes d’un organisme via la quantification des transcrits (données transcriptomiques). Des stratégies dites de génétique génomique combinant des approches de génomique fonctionnelle et de cartographie de QTL on alors été développées avec comme objectif de faciliter l’identification des mutations causales sous-jacentes aux QTL détectés. Dans ce contexte nouveau, une originalité de la thèse est de prendre en compte l’hétérogénéité existante dans les données transcriptomiques et causées par des facteurs connus ou inconnus indépendamment au cractère d’intérêt. Au travers de plusieurs études, on montre que l’hétérogénéité du signal d’expression ou des profils d’expression masque bien souvent la détection des gènes et des régions du génome liés aux caractère d’intérêt. Un deuxième volet de la thèse concerne l’inférence de réseaux de gènes. Nous développons de nouvelles méthodes pour l’estimation de telles structures basées sur un modèle à facteurs. Ces méthodes permettent de caractériser des régulateurs clés et des processus biologiques sous-jacents à la variabilité de caractères complexes, apportant de nouvelles informations fonctionnelles quant aux mutations causales recherchées.
Pas de résumé disponible.
For the past ten years, many projects on functional genomics have been developed with the aim of better understanding complex traits of socio-economical interest in order to better control them. These traits are called complex traits because they are controlled by multiple factors : genetics food, health stutus… One strategy commonly used to analyze such traits involves localizing QTL (Quantitative Trait Loci), i. E. Chromosomic regions controlling their variability. In parallel to this work, new technologies (microarrays) have emerged, which allow the high throughput measurement of gene expression through the quantification of transcripts (transcriptomic data). Genetical genomic approaches combining functional genomic methods and QTL mapping have been developed with the aim of facilitating the identification of causal mutations underlying detected QTL. In this new context, an original aspect of my thesis is to take into account the heterogeneity existing in transcriptomic data and due to know or unkno<n factors independently of the trait of interest. Through several studies, we show that signal heterogeneity or expression profile heterogeneity most of thhe time hides the detection of genes or genome regions associated with the trait of interest. A second aspect of the thesis concerns gene network inference using transcriptomic data. Gene network modeling is a promising solution to better understand regulatory mechanisms of genes involved in the trait variability. We develp here new methods to estimate such structures basded on a factor model. These methods are applied in the context of the genetic analysis of a complex trait. They allow characterizing key regulators and biological processes underlying the trait variability, giving new functional information about the sought causal mutations.