Bacterial strain typing using highly variable genomic sequences

par Wenjun Li

Thèse de doctorat en Pathologie humaine. Maladies transmissibles et pathologies tropicales

Sous la direction de Pierre-Edouard Fournier.

  • Titre traduit

    ˜Le œgénotype de souches bactériennes par l'utilisation des séquences génomiques hypervariables


  • Résumé

    L'accumulation rapide de séquences de génomes bactériens et l'identification de nombreuses caractéristiques spécifiques de souches ont montré que la diversité génétique intra-spécifique des bactéries était sous-estimée. Ceci a mis en évidence l’importance de disposer de méthodes de génotypage à haute résolution applicable aux souches bactériennes. Au cours de notre travail, décrit dans ce mémoire, nous nous sommes attachés à mettre au point et évaluer un système de génotypage des souches bacte��riennes s'appuyant sur des séquences génomiques hypervariables choisies de façon rationnelle par comparaison génomique. Nous avons en particulier étudié quatre pathogènes humains : Bartonella henselae, Tropheryma whipplei, Neisseria meningitidis et Francisella tularensis. Pour B. Henselae, nous avons employé la méthode de «multispacer typing » (MST), en utilisant neuf espaces intergéniques variables sélectionnés par comparaison des génomes de B. Henselae et B. Quintana. Ceci nous a permis d’identifier 39 et 16 génotypes parmi 126 et 75 souches de B. Henselae, respectivement, cultivées à partir de prélèvements félins et humains. Ces résultats démontrent que la diversité génétique des souches félines et humaines est similaire. L'analyse phylogénétique basée sur ces séquences a mis en évidence quatre lignées génétiques au sein de B. Henselae et suggéré que la lignée 4 était moins pathogène pour l'homme que les trois autres. Pour N. Meningitidis, la méthode MST basée sur trois espaces intergéniques a fait preuve d'une résolution comparable à la technique « multilocus sequence typing » (MLST) qui utilise sept gènes, pour identifier 27 génotypes parmi 39 souches. Par comparaison des génomes de trois souches de F. Tularensis, nous avons recensé huit espaces intergéniques hypervariables dont quatre ont été utilisés pour la MST. La résolution obtenue, plus importante, a permis une classification phylogénétique plus raisonnable par rapport aux six loci VNTR trouvés par « multilocus variable-number tandem-repeat analysis» (MLVA). Pour le génotypage de T. Whipplei, quatre séquences génomiques hypervariables (HVGSs) ont été choisies par comparaison des génomes de deux souches pour identifier 24 génotypes parmi 39 souches de patients atteints de la maladie de Whipple et 10 souches de porteurs asymptomatiques. Par analyses génotypique et phylogénétique, aucune corrélation significative n’a été retrouvée entre les génotypes HVGS et les formes cliniques de la maladie de Whipple ou les porteurs asymptomatiques. Nos observations ont révélé une grande diversité génétique des souches de T. Whipplei. En résumé, nos résultats suggèrent que MST et HVGS, basées sur le les séquences génomiques les plus variables, sont des systèmes performants pour le génotypage des bactéries au niveau des souches. Ces méthodes sont plus discriminantes que les autres méthodes de génotypage, ce qui les rend particulièrement utiles pour le suivi épidémiologique des infections bactériennes.


  • Résumé

    With the rapid accumulation of bacterial genome sequences and the identification of an increasing amount of strain-specific characteristics of bacteria, i. E. , host-specific adaptation, virulence and antibiotic resistance, the intraspecies genetic diversity of bacteria was found highly underestimated. This, in turn, highlighted the need for reliable, high resolution, and cost-effective genotyping systems for bacteria at the strain level. In this context, the objective of the work described in this thesis was to develop novel genotyping systems using highly variable genomic sequences rationally selected by genome comparison. We focused our research on four human bacterial pathogens: Bartonella henselae, Tropheryma whipplei, Neisseria meningitidis and Francisella tularensis, for which such tools were not available. For B. Henselae, N. Meningitidis and F. Tularensis, we searched the most variable intergenic spacer sequences that we combined using the multispacer typing (MST) strategy. For T. Whipplei, we identified the most variable genomic fragments, protein-coding or not. For B. Henselae, variations in nine highly variable intergenic spacers identified 39 and 16 genotypes among 126 cat and 75 human strains, respectively, which demonstrated a similar genetic diversity among cat and human strains. The phylogenetic analysis revealed four genetic lineages within B. Henselae and suggested that lineage 4 may be less pathogenic to humans. For N. Meningitidis, MST using three intergenic spacers demonstrated a resolution comparable to multilocus sequence typing (MLST) based on seven housekeeping genes by identifying 27 genotypes among 39 strains. However, MST is cost effective because it requires only three PCR-sequencing reactions in contrast to seven reactions in MLST. In F. Tularensis, following rapid genome sequencing of a clinical isolate by 454 technology, we compared three genome sequences and identified eight highly variable intergenic spacers to construct MST. Our results demonstrated that MST using four highly variable intergenic spacers was valid for individual discrimination and phylogenetic classification of F. Tularensis strains, exhibited higher resolution and more reasonable phylogenetic classification than multilocus variable-number tandem-repeat analysis (MLVA). For subtyping T. Whipplei, 4 highly variable genomic sequences (HVGSs) selected by genomic comparison of two strains were used as genetic markers to identify 24 genotypes among 39 T. Whipplei DNA samples from patients and 10 T. Whipplei DNA samples from asymptomatic carriers. By genotypic and phylogenetic analyses, no significant correlation between HVGS genotypes and clinical manifestations of Whipple’s disease, or asymptomatic carriers, was found for the 49 samples tested. Our observations revealed a high genetic diversity of T. Whipplei strains. In summary, our results demonstrate that rational selection of the most variable genomic fragments, and their combined use for genotyping, is a powerful tool for subtyping bacterial species at the strain level. MST is comparatively more discriminatory than other genotyping methods and thus is especially useful for tracking outbreaks of bacterial infection.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (214 p.)
  • Annexes : Bibliogr., 210 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Aix-Marseille (Marseille. Timone). Service commun de la documentation. Bibliothèque de médecine - odontologie.
  • Disponible pour le PEB
  • Cote : T2008/AIX2/0659Ubis
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.