Thèse de doctorat en Sciences de la vie et de la santé
Sous la direction de Marie-Laure Martin-Magniette, Julien Chiquet et de Guillem Rigaill.
Soutenue le 02-12-2016
à l'Université Paris-Saclay (ComUE) , dans le cadre de École doctorale Structure et dynamique des systèmes vivants (Gif-sur-Yvette, Essonne ; 2015-....) , en partenariat avec Institut des sciences des plantes de Paris-Saclay (Gif-sur-Yvette, Essonne ; 2015-....) (laboratoire) et de Université d'Évry-Val-d'Essonne (1991-....) (établissement opérateur d'inscription) .
Le président du jury était David Causeur.
Le jury était composé de Franck Picard.
Les rapporteurs étaient Avner Bar-Hen, Nathalie Villa-Vialaneix.
Une méthode d’apprentissage multivariée et pénalisée pour l'inférence jointe des niveaux d’expression et des réseaux de régulation génique
Entre plusieurs conditions biologiques, le comportement d’un gène peut être affecté soit dans son niveau d’expression moyen, soit dans sa relation aux autres, caractérisée par les covariances entre gènes. Ces deux questions sont généralement traitées de manière indépendante en statistique, bien qu’elles soient clairement liées. Afin de palier à ces limitations, cette thèse vise à proposer une modélisation unifiée de ces deux questions pour identifier les gènes clés affectés dans leur moyenne et/ou dans leurs interactions. Le modèle principal est le modèle graphique gaussien avec des pénalisations sur les paramètres de la moyenne et de la matrice de précision.
When comparing different biological conditions, the expression of a gene might shift. It can be a change in terms of its average expression level characterized by its mean. Or it can be a change in terms of its interactions with other genes characterized by the covariance matrix. These two types of events are usually analysed independently even though they are clearly related. In order to alleviate these limitations, we propose in this thesis a unified strategy to address these two questions and identify key genes affected either in terms of their mean or their interactions with other genes. The main statistical model is the Gaussian graphical model with penalization on the mean and precision matrix parameters.
Il est disponible au sein de la bibliothèque de l'établissement de soutenance.