Modèles markoviens graphiques pour la fusion de données individuelles et d'intéractions : application à la classification de gènes

par Matthieu Vignes

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Florence Forbes et de Gilles Celeux.

Soutenue en 2007

à l'Université Joseph Fourier (Grenoble) .


  • Résumé

    Les recherches que nous présentons dans ce mémoire s'inscrivent dans le cadre de l'intégration statistique de données post-génomiques hétérogènes. La classification non supervisée de gènes vise à regrouper en ensembles significatifs les gènes d'un organisme, vu comme un système complexe, conformément aux données expérimentales afin de dégager des actions concertées de ces gènes dans les mécanismes biologiques mis en jeu. Nous basons notre approche sur des modèles probabilistes graphiques. Plus spécifiquement, nous utilisons l'outil de champs de Markov cachés qui permet la prise en compte simultanée de données propres à chacun des gènes grâce a des distributions de probabilités et de données traduisant un réseau d'interaction au sein de l'organisme a l'aide d'un graphe non-orienté entre les gènes. Apres avoir présenté la problématique et le contexte biologique, nous décrivons le modèle utilise ainsi que les stratégies algorithmiques d'estimation des paramètres (Le. Approximations de type champ moyen). Puis nous nous intéresserons à deux particularités des données auxquelles nous avons été confrontés et qui amènent des développements du modèle utilise, notamment la prise en compte de l'absence de certaines observations et la haute dimensionnalité de celles-ci. Enfin nous présenterons des expériences sur données simulées ainsi que sur données réelles sur la levure qui évaluent le gain apporté par notre travail. Notamment nous avons voulu mettre l'accent sur des interprétations plausibles des résultats obtenus.

  • Titre traduit

    Markovian graphical models for individual and interaction data integration : Application to gene clustering


  • Résumé

    The research work presented in this dissertation is on keeping with the statistical integration of post -genomics data of heterogeneous kinds. Gene clustering aims at gathering the genes of a living organism -modeled as a complex system- in meaningful groups according to experimental data to decipher the roi es of the genes acting within biological mechanisms under study. We based our approach on probabilistic graphical models. More specifically, we used Hidden Markov Random Fields (HMRF) that allow us to simultaneously account for gene-individual features thanks to probability distributions and network data that translate our knowledge on existing interactions between these genes through a non-oriented graph. Once the biological issues tackled are set, we describe the model we used as weil as algorithmic strategies to deal with parameter estimation (namely mean field-like approximations). Then we examine two specificities of the data we were faced to: the missing observation problem and the high dimensionality ofthis data. They lead to refinements ofthe model under consideration. Lastly, we present our experiments both on simulated and real Yeast data to assess the gain in using our method. Ln particular, our goal was to stress biologically plausible interpretations of our results.

Autre version

Cette thèse a donné lieu à une publication en 2007 par [CCSD] à Villeurbanne

Modèles markoviens graphiques pour la fusion de données individuelles et d'intéractions : application à la classification de gènes

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ( 232 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. 265 réf.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Grenoble Alpes (Saint-Martin d'Hères, Isère). Bibliothèque et Appui à la Science Ouverte. Bibliothèque universitaire Joseph-Fourier.
  • Disponible pour le PEB
  • Cote : TS07/GRE1/0208/D
  • Bibliothèque : Université Grenoble Alpes (Saint-Martin d'Hères, Isère). Bibliothèque et Appui à la Science Ouverte. Bibliothèque universitaire Joseph-Fourier.
  • Disponible sous forme de reproduction pour le PEB
  • Cote : TS07/GRE1/0208

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2007GRE10208
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.