Les viromes associés aux plantes sauvages : vers des stratégies de caractérisation optimisées et variabilité dans divers environnements

par Yuxin Ma

Thèse de doctorat en Biologie Végétale

Sous la direction de Thierry Candresse.

Thèses en préparation à Bordeaux , dans le cadre de École doctorale Sciences de la vie et de la santé (Bordeaux) , en partenariat avec Candresse (laboratoire) .


  • Résumé

    Les approches de métagénomique basées sur l'utilisation des techniques de séquençage haut débit ont ouvert une nouvelle ère pour la découverte non biaisée et la caractérisation génomique des virus. Comme pour les autres virus, de telles études montrent que la diversité des virus phytopathogènes a jusqu'à tout récemment été fortement sous-estimée. Ces virus constituant une composante potentiellement importante des écosystèmes naturels ou des agrosystèmes anthropisés, il est important d'explorer la diversité des virus associés aux populations végétales et de comprendre les forces structurant cette diversité dans le temps et dans l'espace. Dans le même temps, le développement de telles études reste confronté à des questions d'ordre méthodologique concernant, par exemple, le choix des populations d'acides nucléiques à séquencer, la reproductibilité des analyses ou la disponibilité d'une stratégie permettant de comparer de façon fiable la richesse virale dans différents environnements. Dans le présent travail, le virome associé à des populations végétales échantillonnées dans différents écosystèmes, avec un focus sur les adventices et les plantes sauvages, a été caractérisé par des approches de métagénomique par séquençage haut débit. Dans ces travaux, l'analyse bioinformatique de la richesse du virome a été conduite par deux approches, l'une classique basée sur l'annotation Blast pour l'identification des familles virales présentes dans un échantillon, et l'autre, décrite et validée ici, qui permet de classifier les séquences virales métagénomiques en unités taxonomiques opérationnelles (operational taxonomic units, OTUs) utilisées comme proxy des espèces virales. Toujours dans une perspective méthodologique, les résultats obtenus avec des pools complexes de plantes représentatifs de la diversité végétale au site d'échantillonnage (approche « tondeuse à gazon ») ont permis de comparer les performances des deux techniques actuellement utilisées pour enrichir les séquences virales, la purification d'ARN bicaténaires (double-stranded RNA, dsRNA) ou d'acides nucléiques associés aux virions (virion-associated nucleic acids, VANA). Les résultats obtenus par les deux approches ont mis en évidence des viromes riches mais montrent que l'approche dsRNA devrait être préférée pour l'analyse de tels pools complexes car elle permet de façon reproductible une description plus complète du phytovirome, à l'exception des virus ADN. Les viromes caractérisés montrent, pour les populations végétales de milieux cultivés ou non gérés tempérés échantillonnées, une forte incidence virale (jusqu'à 86.5% dans 126 pools monospécifiques collectés sur une période de deux ans) et confirment la prédominance des virus dsRNA qui représentent plus de 70% des OTU identifiés. Alors qu'une proportion significative des virus ssRNA détectés sont déjà connus, plus de 90% des virus dsRNA détectés sont nouveaux et n'avaient pas été caractérisés auparavant. Un effort important en culturomique visant à comparer le phytovirome avec le mycovirome de cultures fongiques obtenues à partir des mêmes échantillons végétaux a révélé un nombre remarquablement faible d'OTUs partagés, renforçant le questionnement sur la nature, phytovirus ou mycovirus, des virus dsRNA identifiés dans les viromes des plantes. La composition en OTU des viromes analysés s'est révélée variable entre sites d'échantillonnage mais aussi très dynamique dans le temps, avec seulement une très faible fraction des OTUs ré-échantillonnés de façon stable dans la même population végétale sur une période de deux ans. Pris dans leur ensemble, ces travaux exploratoires permettent de mieux raisonner les choix méthodologiques pour l'étude des viromes associés aux plantes et étendent notre connaissance de la diversité des phytovirus, en particulier dans des espèces végétales sauvages largement négligées, apportant des points de référence importants pour de nouveaux travaux en écologie et en évolution virale.

  • Titre traduit

    Wild plant species associated viromes: towards improved characterization strategies and variability in various ecological environments


  • Résumé

    Metagenomics based on high throughput sequencing (HTS) has opened a new era of unbiased discovery and genomic characterization of viruses. As for other viruses, such metagenomic studies indicate that the diversity of plant viruses was until recently far underestimated. As potentially important components of unmanaged and cultivated ecosystems, there is a need to explore the diversity of the viruses associated with plant populations and to understand the drivers shaping their diversity in space and time. At the same time, the development of such studies is still faced by methodological questions concerning, for example, the choice of target nucleic acids populations, the reproducibility of the analyses or the implementation of a strategy to accurately compare virus richness in different environments. In the present thesis the phytovirome associated with plant populations sampled in various ecosystems, with an emphasis on wild plant or weed species was characterized using HTS-based metagenomics. In these experiments, the bioinformatic analysis of the virome complexity was performed using two strategies, a classical one based on Blast-based contigs annotation for the identification of the viral families present in a sample and a novel one, described and validated here, and which allows to classify the metagenomic viral sequences into operational taxonomic units (OTUs) as a proxy to viral species. Also from the methodological perspective, the results obtained using complex plant pools such as those used in the “lawn-mower” sampling strategy allowed to compare the performance of the two currently used viral enrichment methods, double-stranded RNA (dsRNA) or Virion-associated nucleic acids (VANA) purification. The results indicate both of approaches uncovered rich viromes and suggest that the dsRNA approach should be preferred when analyzing complex plant pools since it consistently provided a more comprehensive description of the analysed phytoviromes, with the exception of the DNA viruses. The virome characterization results obtained showed, for the temperate plant populations from unmanaged and cultivated sampling sites, a high virus incidence (up to 86.5% in 126 single species pools collected over a two-year period) and confirmed the predominance of dsRNA viruses with greater than 70% of the phytovirome OTUs. While a significant proportion of detected single-stranded RNA (ssRNA) viruses are already known agents, more than 90% of the dsRNA viruses are novel and had not previously been characterized. A large scale culturomics effort to contrast the phytovirome with the mycovirome of fungal cultures obtained from the same plant samples revealed an extremely low number of shared OTUs, further deepening the debate about the phytovirus or mycovirus nature of the dsRNA viruses identified in plant viromes. The OTU composition of the analyzed phytoviromes varied significantly between sampling sites but was also shown to be highly dynamic over time, with a very low proportion of OTUs consistently re-sampled in the same plant population over a 2 years period. Taken together, these exploratory studies allow a more reasoned choice of methodology for the study of plant-associated viromes and expand our knowledge of plant virus diversity especially in neglected wild plant populations, providing important references for the further viral ecology and evolution studies.