Évolution des gènes et génomes après duplication complète du génome chez les poissons téléostéens

par Elise Parey

Projet de thèse en Génomique

Sous la direction de Hugues Roest crollius et de Camille Berthelot.

Thèses en préparation à l'Université Paris sciences et lettres , dans le cadre de École doctorale Complexité du vivant , en partenariat avec Institut de Biologie de l'École Normale Supérieure (laboratoire) et de Ecole normale supérieure (établissement opérateur d'inscription) depuis le 01-09-2017 .


  • Résumé

    Les duplications complètes de génome sont des événements majeurs dans l'histoire évolutive des espèces. Elles produisent des copies surnuméraires de gènes qui peuvent acquérir de nouvelles fonctions et ainsi contribuer aux processus d'adaptation et de diversification. Deux duplications complètes de génome ont eu lieu dans la lignée précédant l'ancêtre des Vertébrés, suivies d'une troisième à la base des poissons téléostéens (datée à 320 millions d'années). L'impressionnante diversité du clade téléostéen, représentant plus de la moitié des espèces de Vertébrés actuelles, permet d'explorer un large éventail de questions fonctionnelles et évolutives. De fait, le séquençage récent et en cours de nombreuses espèces de poissons promet de complémenter le modèle bien établi du poisson-zèbre. Néanmoins, leur événement partagé de duplication complète représente un défi pour l'analyse et la comparaison des génomes de poissons. En effet, suite à la duplication, de nombreux gènes demeurent en deux copies dans les génomes, ce qui complexifie la caractérisation des relations d'homologies entre gènes de différentes espèces. Afin de résoudre ce problème, j'ai développé une nouvelle méthodologie spécifique à la reconstruction d'arbres de gènes dans le contexte de duplications complètes de génome, nommée SCORPiOs (Synteny-guided CORrection of Paralogies and Orthologies). L'innovation notable derrière SCORPiOs est l'intégration d'information provenant de l'organisation des gènes dans les génomes (synténie) afin de compléter les méthodes basées sur l'évolution moléculaire des séquences. Je présente comment l'application de cette nouvelle méthode à différents jeux de génomes de poissons améliore notre compréhension de l'évolution et de la structure des génomes de téléostéens. Dans un premier temps, je montre que SCORPiOs met en évidence la contribution des gènes dupliqués aux innovations évolutives des téléostéens. L'identification précise de gènes orthologues et paralogues m'a également permis d'établir la première cartographie à grande échelle des régions dupliquées entre génomes de poissons. Ce second résultat représente une nouvelle ressource qui devrait faciliter l'extrapolation d'annotations fonctionnelles entre espèces modèles et non-modèles. Enfin, je démontre comment l'analyse fine des désaccords de prédictions basées sur la synténie et la séquence permet de préciser les patrons spatio-temporels du retour à l'état diploïde après la duplication complète. Mon travail propose un cadre pour faciliter les analyses comparatives chez les poissons téléostéens et améliore nos connaissances concernant l'évolution des génomes après duplication complète.

  • Titre traduit

    Evolution of genes and genomes after whole genome duplication in teleost fish


  • Résumé

    Whole-genome duplications are major events in the evolutionary history of species. They produce additional gene copies that can acquire new functions and thus contribute to adaptation and diversification processes. Two rounds of whole genome duplications occurred in the lineage leading to the Vertebrate ancestor, followed by a subsequent one at the stem of the teleost fish clade (dated 320 million years ago). The impressive diversity of the teleost clade, accounting for over half of extant vertebrate species, allows us to address a vast panel of functional and evolutionary questions. As such, the recent and on-going sequencing of many fish species promises to neatly complement the well-established zebrafish model. However, their shared whole genome duplication represents an additional layer of complexity that has to be accounted for when comparing fish genomes. Indeed, many genes still remain in two copies after the duplication, which renders the identification of homologous genes across species extremely complex. To tackle this challenge, I have developed a novel method, named SCORPiOs (Synteny-guided CORrection of Paralogies and Orthologies), which reconstructs more accurate phylogenetic gene trees in the context of whole genome duplications. The major innovation behind SCORPiOs is that it integrates information from the genomic organisation of genes (synteny) to complement classical sequence-based methods. I present how the application of SCORPiOs to various fish genomes datasets enhances our understanding of fish genome structure and evolution. First, I show that SCORPiOs links duplicate gene retention to evolutionary novelties in the teleost clade. Further, the precise identification of orthologous and paralogous genes allowed me to establish the first large-scale cartography of WGD-duplicated regions across fish genomes. This second result represents a novel resource that should facilitate the transfer of functional annotations between model and non-model fish species. Last, I demonstrate how the analysis of discordances between sequence and synteny predictions sheds light on the spatio-temporal pattern of rediploidization following the duplication event. My work provides a framework that facilitates comparative analyses across teleost fish genomes and reveals insights into the evolution of genomes following whole genome duplication.