Comparaison et évaluation d’approches bioinformatiques et statistiques pour l'analyse du pathobiome des plantes cultivées

par Charlie Pauvert

Thèse de doctorat en Écologie évolutive, fonctionnelle et des communautés

Sous la direction de Corinne Vacher et de Jessica Vallance.

Soutenue le 12-11-2019

à Bordeaux , dans le cadre de Sciences et environnements , en partenariat avec BIOdiversité, GEnes et Communautés (Bordeaux) (laboratoire) et de Biodiversité, Gènes & Communautés (laboratoire) .


  • Résumé

    Les interactions entre micro-organismes sous-tendent de nombreux services écosystémiques, y compris la régulation des maladies des plantes cultivées. Un acteur de cette régulation est le pathobiome, défini comme le sous-ensemble des micro-organismes associés à une plante hôte en interaction avec un agent pathogène. L'un des défis actuels consiste à reconstruire les pathobiomes à partir de données de metabarcoding, pour identifier des agents potentiels de biocontrôle et pour surveiller en temps réel leurs réponses aux changements environnementaux. Plusieurs verrous méthodologiques doivent cependant être levés pour atteindre ces objectifs. Tout d’abord, il n’existe pas de consensus concernant l’approche bioinformatique la plus fiable pour déterminer l’identité et l’abondance des micro-organismes présents dans les échantillons végétaux. De plus, les réseaux microbiens construits avec les méthodes actuellement disponibles sont des réseaux d’associations statistiques entre des comptages de séquences, non directement superposables aux réseaux d’interactions (ex : compétition, parasitisme) entre micro-organismes. L’objectif de la thèse était donc de déterminer les approches bioinformatiques et statistiques les plus pertinentes pour reconstruire des réseaux d’interactions microbiennes à partir de données de metabarcoding. Le modèle d’étude était la vigne (Vitis vinifera L. cv. Merlot noir) et l’oïdium de la vigne, Erysiphe necator. Nous avons tout d’abord déterminé l’approche bioinformatique la plus adaptée pour identifier la communauté fongique associée à ce pathogène, en comparant la capacité de 360 pipelines à retrouver la composition d’une communauté artificielle de 189 souches fongiques. DADA2 est apparu comme l’outil le plus performant. Nous avons ensuite évalué l’influence de la pratique culturale (viticulture conventionnelle vs. biologique) sur les communautés fongiques des feuilles et évalué le niveau de réplicabilité des réseaux microbiens construits avec une méthode d’inférence classique, SparCC. La réplicabilité était très faible, jetant ainsi un doute sur l’utilité de ces réseaux pour le biocontrôle et la biosurveillance. Nous avons donc utilisé une nouvelle approche statistique, le modèle PLN, qui permet de prendre en compte la variabilité environnementale, pour explorer finement le pathobiome d’Erysiphe necator. Les interactions microbiennes prédites par le modèle sont en cours de comparaison avec des expériences de confrontations de levures en co-cultures. Une approche alternative, HMSC, a également été testée sur un autre modèle biologique et certaines prédictions ont été confrontées avec succès aux données de la littérature. Les réseaux microbiens, sous réserve d’amélioration des méthodes de reconstruction, pourraient donc être utilisés pour capturer les signaux des interactions biotiques dans le pathobiome.

  • Titre traduit

    Comparison and evaluation of bioinformatic and statistical approaches for the analysis of the pathobiome of crop plants


  • Résumé

    Interactions between microorganisms underpin many ecosystem services, including the regulation of crop diseases. An actor in this regulation is the pathobiome, defined as the subset of microorganisms associated with a host plant in interaction with a pathogen. One of the current challenges is to reconstruct pathobiomes from metabarcoding data, in order to identify potential biocontrol agents and to monitor in real time their responses to environmental changes. However, several methodological hurdles must be overcomed to achieve these objectives. First, there is no consensus on the most reliable bioinformatics approach to determine the identity and abundance of microorganisms present in plant samples. In addition, microbial networks built with currently available methods are networks of statistical associations between sequence counts, not directly related to networks of interactions (e. g. competition, parasitism) between microorganisms. The objective of the thesis was therefore to determine the most relevant bioinformatics and statistical approaches to reconstruct microbial interaction networks from metabarcoding data. The study system was grapevine (Vitis vinifera L. cv. Merlot noir) and the fungal agent of grapevine powdery mildew Erysiphe necator. First, we determined the most appropriate bioinformatics approach to identify the fungal community associated with this pathogen, by comparing the ability of 360 pipelines to recover the composition of an artificial community of 189 fungal strains. DADA2 has emerged as the most powerful tool. We then evaluated the influence of the cropping system (conventional vs. organic viticulture) on foliar fungal communities and assessed the level of replicability of microbial networks built with a standard inference method, SparCC. Replicability was very low, casting doubt on the usefulness of these networks for biocontrol and biomonitoring We therefore used a new statistical approach, the PLN model, which allows us to take into account environmental variability, to finely explore the pathobiome of Erysiphe necator. The microbial interactions predicted by the model are being compared with experiments confronting yeasts in co-cultures. An alternative approach, HMSC, was also tested on another biological model and some predictions were successfully compared with the data in the literature. Microbial networks, provided improved reconstruction methods, could therefore be used to capture signals of biotic interactions in the pathobiome.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Bordeaux. Direction de la Documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.