Projet de thèse Typautobac - Methode automatique de typage bacterien par "pangenome" et variants alleliques à partir de sequencage à haut debit

par Meryl Vila Nova

Projet de thèse en Microbiologie

Sous la direction de Michel-Yves Mistou.

Thèses en préparation à Paris Est , dans le cadre de École doctorale Agriculture, Alimentation, Biologie, Environnement, Santé (Paris ; 2015-....) , en partenariat avec LSA Laboratoire de Sécurité des Aliments - ANSES (laboratoire) depuis le 01-11-2016 .


  • Résumé

    Ce projet de thèse comporte deux volets. Le premier concerne la construction d'outils automatiques de typage des souches bactériennes à partir de séquences d'ADN produites par des séquenceurs à haut débit, à la fois aux échelles des micro- et des macro-évènements évolutifs des souches. Le deuxième volet, exploratoire, vise à relier ces variations génétiques trouvées lors du typage à des phénotypes d'intérêt. L'analyse de la diversité génétique ou typage sera basée sur l'identification et la hiérarchisation des polymorphismes d'un seul nucléotide (Single Nucleotide Polymorphisms ou SNPs) et d'insertions/délétions de petites tailles (INDELs), combinée aux différences de répertoires en gènes des souches bactériennes. Il est entendu par hiérarchisation, un triage systématique des éléments génétiques caractérisant les lignées identifiées. Cette double approche de typage fournira des outils de classification et d'évaluation de la diversité présente dans les collections, à l'échelle du « core genome » pour détecter les micro-évènements (SNPs et petites INDELs) et du génome accessoire pour les macro-évènements (gains et pertes de gènes). Ce polymorphisme sera analysé dans la deuxième partie du projet dans sa dimension fonctionnelle, pour identifier les variations associées à des phénotypes d'intérêts. Ainsi, nous souhaitons aborder par cette approche sans à priori la relation génotype/profil d'antibiorésistance sur les collections de salmonelles où ce phénotype est particulièrement bien renseigné dans les collections de l'Anses. Plus généralement, la collecte des séquences génomiques de nombreuses souches d'une même espèce constitue un matériel de travail idéal pour observer des micro- et macro-évènements évolutifs, et offre ainsi l'opportunité d'identifier les déterminants génotypiques de l'adaptation d'une bactérie à son environnement et à son hôte.

  • Titre traduit

    Thesis project Typautobac - Automatic method of bacterial typing by "pan-genome" and allelic variants from high-throughput sequencing


  • Résumé

    This PhD project includes two main parts. The first part focuses on the development of automatic bioinformatics tools allowing typing of bacterial genomes at the micro- and macro-event scales based on whole genome sequencing. The second part is exploratory and aims to link these genetic variations to phenotypes of interest. The genetic diversity analysis, or typing, will be based on the identification and ranking of the Single Nucleotide Polymorphisms (SNPs) and small insertion and deletions (INDELs), combined to differences in terms of gene content. This ranking signifies a systematic sorting of genetic elements according to identified lineages in this context. The double typing approach will provide tools to rank and estimate the biodiversity of the bacterial strain collection, at the core genome level for detecting micro-events (i.e. SNPs and small INDELs) and accessory genome for macro-events (i.e. genes gains and losses). This polymorphism will be analyzed during the second part of the PhD project using a functional point of view in order to identify variants involved in phenotypes of interest. We plan to apply this de novo approach on antibiotic resistances of Salmonella because these phenotypes are well documented in Anses collections. More broadly, the collection of genomic sequences of closely related strains from the same species constitutes an ideal biological material to describe the evolutionary micro- and macro-events of the species, and provides the opportunity to identify some of the genetic determinants underlying adaptation of bacteria to their environment or their host.