Mise au point, développement et gestion d’une base de données mondiale des génotypes circulants de bacilles tuberculeux : Méthodes moléculaires et outils web pour cartographier, comprendre et maîtriser l’épidémie

par David Couvin

Thèse de doctorat en Physiologie et biologie des organismes – Populations – Interactions

Sous la direction de Nalin Rastogi.

Le jury était composé de Nalin Rastogi, Igor Mokrousov, Miguel Viveiros, Raymond Césaire, Olivier Gros.

Les rapporteurs étaient Igor Mokrousov, Miguel Viveiros.


  • Résumé

    La tuberculose (TB), maladie infectieuse contagieuse, est causée par une mycobactérie appartenant au complexe Mycobacterium tuberculosis (MTBC). Malgré de nombreuses campagnes de vaccination par le BCG (Bacilles de Calmette et Guérin) et les traitements antituberculeux, on observe une réémergence de la maladie depuis les années 80. Ce bouleversement s’explique par la coïnfection avec le virus du VIH/SIDA, la désorganisation des systèmes de santé et par l’apparition des bactéries résistantes aux principaux antibiotiques antituberculeux. Dans ce contexte une meilleure connaissance des mouvements et de l’évolution des clones circulants du bacille tuberculeux permettrait de détecter plus rapidement et de façon plus pertinente l’émergence d’épidémies. Le contrôle et la surveillance de la maladie représentent des moyens essentiels pour lutter contre l’expansion mondiale de la tuberculose. C’est ainsi que l’unité de la Tuberculose et des Mycobactéries de l’Institut Pasteur de la Guadeloupe (IPG) a mis en place une base de données de profils génotypiques pour l’étude de l’épidémiologie globale de la tuberculose. Dans le cadre de cette thèse, nous décrirons les méthodes de bioinformatique qui ont été utilisées pour la gestion et l’exploitation de la 6ème version (SITVIT2) de cette base de données des génotypes pour mieux comprendre l’évolution et la dissémination mondiale du bacille tuberculeux. Cette base intègre aussi plusieurs marqueurs moléculaires tels que les MIRU-VNTRs (« mycobacterial interspersed repetitive units-variable number of tandem repeats ») et le Spoligotype43 servant à mieux décrire et identifier les familles de profils génotypiques du MTBC. La banque de données SITVIT2 ne cesse d’évoluer, et elle contient actuellement des informations épidémiologiques sur 111 635 isolats cliniques. Cette base de données est consultable en ligne à l’adresse suivante : http://www.pasteur-guadeloupe.fr:8081/SITVIT2/. Nous avons également réalisé une base de données nommée SITVITBovis qui est dédiée à la tuberculose bovine. Cette base de données sera accessible à l’adresse : http://www.pasteur-guadeloupe.fr:8081/SITVIT_Bovis/. Parallèlement au développement et à la gestion des bases de données, ce travail de thèse s’est appuyé sur plusieurs études épidémiologiques et phylogéographiques mettant en corrélation les données disponibles sur la résistance aux médicaments ou les caractéristiques démographiques (dont le sexe, l’âge, le statut VIH, et l’origine du patient). Notre initiative de recherche permet ainsi d’améliorer la caractérisation phylogénétique détaillée des lignées du MTBC, ainsi que l’épidémiologie des clones en circulation, afin d’élaborer une cartographie géographique des isolats cliniques prédominants pour les bacilles tuberculeux principalement impliqués dans la maladie, à l’échelle nationale, régionale et mondiale. La superposition ultérieure de ces cartes avec des données sociopolitiques, économiques et démographiques obtenues auprès de Systèmes d’information géographique (SIG) ont permis de dresser un portrait précis des disparités actuelles par pays ou sous-région. Cette thèse représente une importante collaboration avec plusieurs équipes de chercheurs travaillant également dans le domaine de l’épidémiologie moléculaire de la tuberculose. L’objectif à long terme de ce travail, est d’optimiser la structure de la base, et de pérenniser l’enrichissement de celle-ci (notamment par l’automatisation et la facilité de la saisie de données). Une représentation optimale et une meilleure accessibilité des données de la base conforteraient les efforts faits pour le contrôle et la surveillance de la TB dans monde.


  • Résumé

    Tuberculosis (TB) is a contagious infectious disease caused by mycobacteria belonging to the Mycobacterium tuberculosis complex (MTBC). Despite numerous campaigns of vaccination by the BCG (Bacillus Calmette-Guérin) vaccine, and TB treatments, there was a resurgence of the disease since the 80s. This disruption is due to coinfection with HIV/AIDS, disorganization of health systems and the emergence of bacteria resistant to anti-TB drugs. In this context, a better understanding of the movements and changes of circulating clones of tubercle bacilli would detect faster and more relevant emerging epidemics. The control and monitoring of the disease are essential means to fight against the worldwide spread of tuberculosis. Thus the TB and Mycobacteria unit of the Pasteur Institute of Guadeloupe (IPG) has developed a database of genotypic profiles for the study of global epidemiology of tuberculosis.In this thesis, we discuss the Bioinformatical methods that have been used for the management and development of the 6th version (SITVIT2) of this database of genotypes to better understand the evolution and global dissemination of the tubercle bacillus. The database also includes several molecular markers such as MIRU-VNTRs (mycobacterial interspersed repetitive units- variable number of tandem repeats) and Spoligotype43 allowing a better description and identification of the families of genotypic profiles of Mycobacterium tuberculosis complex. SITVIT2 database is constantly evolving, and it currently contains epidemiological information on 111,635 clinical isolates. This database is available online at the following address: http://www.pasteur-guadeloupe.fr:8081/SITVIT2/. We also developed a database named "SITVITBovis", which is dedicated to bovine tuberculosis. This database will be accessible at: http://www.pasteur-guadeloupe.fr:8081/SITVIT_Bovis/.Alongside the development and management of databases, this work was based on several epidemiological and phylogeographic studies correlating data on drug resistance or demographic characteristics (including sex, age, HIV status, and the origin of the patient). Our research initiative is thus focused to further improve in depth phylogenetic characterization of MTBC lineages, as well as the epidemiological analysis of circulating clones to generate evidence-based geographical mapping of predominant clinical isolates of tubercle bacilli causing the bulk of the disease both at country and regional level. Further superposition of these maps with socio-political, economical and demographical available through Geographic Information Systems (GIS) allows to have a precise view of prevailing disparities at the level of country or sub-region. This thesis represents an important collaboration with several researchers teams also working in the field of molecular epidemiology of tuberculosis.The long-term goal of this work is to further optimize the database structure, and sustain enriching it (including automation and ease of data entry). Optimum performance and accessibility of data in the database would reinforce efforts to control and surveillance of TB in the world.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Informations

  • Détails : 1 vol. (194 p.)
  • Notes : Reproduction autorisée par le jury
  • Annexes : Bibliogr. p. 170-180

Où se trouve cette thèse ?

  • Bibliothèque : Université des Antilles et de la Guyane (Pointe-à-Pitre, Guadeloupe). Service commun de la documentation. Section Droit-Sciences.
  • Non disponible pour le PEB
  • Cote : TA0673
  • Bibliothèque : Université des Antilles et de la Guyane (Pointe-à-Pitre, Guadeloupe). Service commun de la documentation. Section Droit-Sciences.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.