Analyse du génome et du pan-génome pour classifier les bactéries émergentes

par Aurélia Caputo

Thèse de doctorat en Biologie.Génomique et bioinformatique

Sous la direction de Didier Raoult.

Le président du jury était Pierre Pontarotti.

Le jury était composé de Pierre Pontarotti, Raymond Ruimy, Antoine Andremont.

Les rapporteurs étaient Raymond Ruimy, Antoine Andremont.


  • Résumé

    La bio-informatique est essentielle aujourd'hui dans de nombreux domaines comme par exemple la gestion et l'analyse des données, la génomique avec l'assemblage et l'annotation de génomes, la phylogénie, la métagénomique, la recherche de nouvelles espèces bactériennes et la classification taxonomique. Mon premier travail a porté sur l'assemblage et l'analyse d'un génome bactérien à partir de données de métagénomique. Le génome de Akkermansia muciniphila a pu être assemblé par mapping directement à partir de données issues d'échantillons de selle humaine. En 2012, la culturomics a permis de décrire le plus grand génome d'une bactérie isolée chez l'homme ; Microvirga massiliensis (9.3 Mb). Mon deuxième travail a permis d'assembler ce génome. Par la suite, nous avons essayé de comprendre pourquoi cette bactérie a un génome si grand. En effet, on observe qu'elle possède un plasmide, un nombre important d'ORFans et d'ARNr 16S ainsi que des gènes de grande taille. Elle comporte également un nombre important de transposons. Enfin, la troisième et dernière partie de mon travail se base sur les analyses de pan-génome pour la taxonomie bactérienne. La taxonomie est sujette à de nombreux changements selon les données disponibles et les méthodes utilisées, et suit l'évolution des techniques d'identification des bactéries. Nous avons alors redéfinit la notion d'espèce à l'aide du pan-génome pour le genre Klebsiella. En effet, une différence trop importante entraînant une cassure au niveau du ratio core/pan-génome, révèle l'apparition d'une nouvelle espèce. Cette découverte nous amène à utiliser le pan-génome comme outils novateur pour la taxonomie bactérienne.

  • Titre traduit

    Genome and pan-genome analysis to classify emerging bacteria


  • Résumé

    Since the introduction of DNA sequencing by Sanger and Coulson in 1977, considerable progress has been made. A growing number of data is being generated in several areas and requires more and more advances in computing. Bio-informatics is essential today in many fields such as data management and analysis, genomics with assembly and genome annotation, comparative genomics, phylogeny, metagenomics, research new bacterial species and taxonomic classification. My first work based on assembling and analyzing bacterial genome from metagenomic data. The genome of Akkermansia muciniphila could be assembled by mapping directly from data from human stool sample. In 2012,culturomics allowed to describe the largest genome of a bacterium isolated in human; Microvirga massiliensis (9.3 Mb). My second work allowed to assemble this genome. Subsequently, we tried to understand why this bacterium has such a large genome. Indeed, it is observed that it possesses a plasmid, a large number of ORFans and 16S rRNAs as well as large genes which one is more than 14kb. It also includes a large number of transposasons. Finally, the third and last part of the work concerns pan-genome analyzes for bacterial taxonomy. Taxonomy is a set of many changes based on available data, methods used and evolution of bacterial identification techniques. We have examined the notion of species using the genome at the genus Klebsiella. Indeed, a too large difference leading to a break in the core/pan-genome ratio undoubtedly reveals the appearance of a new species. This discovery leads us to use the pan-genome as an innovative tool for bacterial taxonomy.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université d'Aix-Marseille. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.