Caractérisation et modélisation de l'évolution des interactions hôtes-microbiotes

par Benoît Perez-Lamarque

Projet de thèse en Frontières du vivant

Sous la direction de Hélène Morlon et de Marc-André Selosse.

Thèses en préparation à Paris Sciences et Lettres , dans le cadre de École doctorale Frontières du vivant , en partenariat avec Institut de Biologie de l'École Normale Supérieure (laboratoire) et de École normale supérieure (Paris ; 1985-....) (établissement de préparation de la thèse) depuis le 01-09-2018 .


  • Résumé

    Aujourd'hui, grâce à l'essor du séquençage à haut-débit, l'étude des communautés microbiennes associées à des hôtes multicellulaires, appelées microbiote, a montré les rôles primordiaux de ces micro-organismes sur le fonctionnement de leur hôte. Ces bactéries, champignons, virus et autres micro-organismes vivent durablement en association avec leurs hôtes, influençant grandement leur nutrition, leur reproduction, leur développement, et même leur comportement. Chez l'homme par exemple, des perturbations du microbiote étaient corrélées à certains syndromes pathologiques comme l'obésité́ ou bien l'autisme. Les variations du microbiote pouvant avoir de grandes conséquences, il est important d'étudier à quel point ces interactions sont conservées. Il existe un gradient d'associations hôte-microbiote, allant d'associations labiles, facilement réversibles et peu spécifiques à des associations spécifiques fortement conservées, et donc propices à la coévolution. Ce gradient est notamment le résultat du mode de transmission des micro-organismes à la descendance. Actuellement, l'accumulation considérable et croissante de données collectées dans ce domaine appelle à développer des outils pour mieux comprendre la dynamique des associations hôte-microbiote sur des échelles de temps évolutives. L'objectif de la thèse sera de quantifier, au sein de grands jeux de données haut-débit de microbiotes, l'importance relative des différents modes de transmission des micro-organismes ainsi que d'étudier leurs conséquences évolutives. La première partie du projet consistera à développer des modèles probabilistes visant à inférer, par maximum de vraisemblance, l'histoire évolutive de chacune des espèces microbiennes considérées indépendamment. Les modèles prendront comme entrées la phylogénie des hôtes (supposée connue) et les séquences microbiennes associées à chaque hôte, sous forme d'alignement nucléotidique. Nous considèrerons un modèle où les séquences évoluent par mutations le long des branches de la phylogénie hôte, sont transmises verticalement aux évènements de spéciation de l'hôte, et subissent un certain nombre de transferts horizontaux d'hôtes. A terme il est envisageable de relâcher l'hypothèse d'indépendance des taxons microbiens afin de prendre en compte leurs interactions (e.g. inhibition compétitive, remplacement fonctionnel). Nous calculerons les vraisemblances associées à l'alignement de séquences sous les différents modèles d'évolution envisagés, ce qui nous permettra d'estimer les paramètres des modèles (par exemple, la fréquence des transferts horizontaux entre espèces-hôtes). La deuxième partie du projet consistera à développer d'une part des approches statistiques permettant de mieux caractériser les réseaux d'interactions bipartites hôte-microbiote, et d'autre part des approches de modélisation testant des hypothèses sur l'évolution de tels réseaux. Ces réseaux ayant la particularité́ d'être larges (avec en particulier un grand nombre de taxa microbiens), nous nous attacherons à développer des approches qui permettent de détecter des structures locales. L'approche de modélisation consistera à développer des modèles probabiliste d'évolution des interactions et sera couplée à l'inférence statistique par maximum de vraisemblance des paramètres associés. En appliquant les approches développées en 1) et 2) à une série de données de microbiotes empiriques, nous quantifierons l'importance relative des différents modes de transmission au sein des microbiotes et étudierons leurs conséquences évolutives. Nous traiterons notamment les données relatives aux microbiotes des grands singes dont l'entre humain, aux réseaux plantes-mycorhizes, et à l'évolution de systèmes hôtes-parasites.

  • Titre traduit

    Characterizing and modeling the evolution of host-microbiota interactions


  • Résumé

    Informed by high throughput sequencing data, recent studies on the microbiota - microbial communities associated with a multicellular host - have highlighted the major roles played by these microorganisms in the functioning and evolution of their plant and animal hosts. These bacteria, fungi, viruses and other microbes are durably associated with their hosts, greatly influencing the host nutrition, development, protection, or even behavior. In humans for example, microbiota perturbations are correlated with pathological syndromes such as obesity or autism. Given the importance of microbiota composition on the host, it is essential to study to what extent host-microbiota interactions are conserved. Host-microbiota associations range from labile and poorly specific interactions, to highly conserved and ultra-specific associations; the latter type of interactions are particularly favorable to coevolution. The gradient of specificity in host-microbiota interactions results mainly from the transmission mode of the symbionts to the offspring; yet, the analytical tools needed to analyze these transmission modes from molecular data are lacking. The aim of this PhD project is twofold: i) develop the tools for processing the increasing amount of molecular biota data in order to unravel the dynamics of host-microbiota interactions across evolutionary timescales, and ii) quantify, within large empirical microbiota datasets, the importance of the different transmission modes and study their evolutionary consequences. The first part of the project proposes to develop probabilistic models to infer, via maximum likelihood inference, the evolutionary history of each microbial species considered independently. The model inputs will be the host phylogeny and a nucleotidic alignment of the microbial sequences associated with each host. We will consider a model in which the microbial sequences evolve by mutation along the branches of the host phylogeny, are vertically transmitted during host speciation events, and experiment horizontal host transfers. Finally, we will try to relax the hypothesis of independence between microbial taxa in order to take into account the interactions between symbionts (competitive inhibition, functional replacement…). We will compute the likelihoods associated with the microbial alignments under different evolution models, which will enable us to estimate the models' parameters (e.g. the horizontal host transfer frequency between host lineages). The second part will consist in the improvement of statistical approaches to better characterize the host-microbiota interaction networks, and in the development of models to test precise hypotheses about network evolution. These very large networks (huge number of microbial taxa) will require the development of tools to detect local patterns and structures. The model-based approaches will consist in probabilistic models for the evolution of interactions and will be paired with statistical inferences of the associated parameters via maximum likelihood. Applying the approaches developed in Part 1) and 2) to a set of available empirical microbiota dataset, including the microbiota of great apes and plant-fungi mycorrhizal networks, we will unravel the transmission dynamics and test precise hypotheses about the assembly and evolution of the microbiota.