Analyse de données de métagénomique fonctionnelle par NMF pour la modélisation de la dégradation des fibres par le microbiote intestinal humain.

par Sébastien Raguideau

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Béatrice Laroche.

Soutenue le 06-12-2016

à Paris Saclay , dans le cadre de École doctorale Agriculture, Alimentation, Biologie, Environnement, Santé (Paris ; 2015-....) , en partenariat avec AgroParisTech (France) (établissement opérateur d'inscription) et de Laboratoire Mathématiques et Informatique Appliquées (Paris) (laboratoire) .

Le président du jury était Marie-Laure Martin-Magniette.

Le jury était composé de Marie-Laure Martin-Magniette, Hidde de Jong, Guy Perrière, Théodore Bouchez, Marion Leclerc.

Les rapporteurs étaient Hidde de Jong, Guy Perrière.


  • Résumé

    Ce travail de thèse a pour but de modéliser la capacité de dégradation des polysaccharides non digestibles par le microbiote intestinal humain. Nous exploitons pour cela des données métagénomiques. Il s'agit de données d'abondances de séquences de nucléotides dans 1408 échantillons dont les fonctions métaboliques sont assignées par annotation contre une base de données. Les séquences sont annotées par des marqueurs fonctionnels. Après une étape de sélection manuelle de 86 marqueurs fonctionnels pertinents à l'activité de métabolisation des polysaccharides, nous étudions leurs variations d'abondances parmi les échantillons métagénomiques.Nous proposons une approche de modélisation écologique du microbiote intestinal humain et considérons principalement la sélection fonctionnelle intense de cet écosystème pour faire l'hypothèse que des regroupements identiques de fonctions métaboliques sont présents en proportions différentes dans tous les microbiotes intestinaux humains. Nous proposons le terme d'assemblage fonctionnel qui rend compte de la co-occurrence spatiale et temporelle d'un groupement de fonctions. Ces assemblages sont en pratiques déterminés par leur composition en marqueurs fonctionnels, et peuvent s'interpréter comme une combinaison de traits fonctionnels agrégés au niveau des microorganismes composant l'assemblage.Les assemblages fonctionnels sont inférés par le biais d'une factorisation en matrice positive aussi nommée NMF de l'anglais Non-Negative Matrix Factorisation. Cette méthode permet de déterminer les assemblages fonctionnels, à la fois concernant leur composition et à la fois concernant leur abondance dans chacun des 1408 échantillons. Nous exploitons par ailleurs une information métabolique provenant de 190 génomes microbiens et de la bibliographie qui permet de préciser la composition de ces assemblages fonctionnels. Cette information se traduit sous forme d'une contrainte.Nous trouvons 4 assemblages en considérant un consensus entre différents critères. L'utilisation de l'information métabolique nous permet d'interpréter biologiquement ces assemblages. Les métadonnées associées aux 1408 échantillons nous permettent d'observer un comportement différent pour les échantillons provenant d'individus atteints de la maladie de Crohn. Nous validons cette observation sur des données extérieures.Nous avons proposé une approche réductionniste permettant de représenter un processus métabolique important à l'échelle du microbiote. Nous trouvons un nombre réduit de 4 assemblages fonctionnels qui sont biologiquement vraisemblables et permettent de bien approcher les 1408 échantillons métagénomiques.

  • Titre traduit

    Modelling of fiber degradation by the human gut microbiota based onNMF analysis of functional metagenomic data


  • Résumé

    The purpose of this work of thesis is to model the capacity of degradation of non-digestible polysaccharides by the human intestinal microbiote. To this end we exploit metagenomic data. We use abundances of nucleotide sequences in 1408 samples whose metabolic function are assigned by annotation against a database. The sequences are annotated with functional markers. Upon manual selection of 86 functional markers relevant to the activity of metabolisation of polysaccharides, we their abundances variation among the metagenomic samples are studied.We propose an ecological approach in modeling the human intestinal microbiote. We consider the intense functional selection of this ecosystem and assume that identical cluster of metabolic functions can be found in different proportions in every human gut microbiota. We propose the term of functional assembly as to account for spacial and temporal co-occurence of functional cluster. In practice, theses assemblies are determined by their composition and can be interpreted as combinations of functional traits aggregated at the levels of the cluster of microorganisms composing each assembly. Functional assemblies are inferred by the means of Non-Negative Matrix Factorization (NMF). This method allows to determine the composition of functional assemblies and their abundance in each of the 1408 metagenomic sample.Furthermore, we exploit metabolic information from bibliographic resources and 190 microbial genomes in order to specify the composition of these functional assemblies. This information is translated in the form of a constraint.We find 4 assemblies by considering a consensus between various criteria. The use of metabolic information allow to interpret theses assemblies biologically. By exploiting the metadata of the 1408 samples, we observe a different behaviour for the samples coming from individuals suffering from Crohn disease. We validate this observation on external data.We proposed a reductionistic approach allowing to represent an important metabolic process at the level of the microbiota. We find a small number of 4 functional assemblies which are biologically likely and approach well the 1408 metagenomic samples.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : AgroParisTech. Centre de Paris Claude Bernard. Bibliothèque.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.