Identification et évolution des séquences orthologues par séquençage massif chez les polyploïdes

par Julien Boutte

Thèse de doctorat en Biologie

Sous la direction de Malika Ainouche et de Armel Salmon.


  • Résumé

    Les nouvelles technologies de séquençage (NTS) offrent de nouvelles opportunités d'explorer les génomes et transcriptomes d'espèces polyploïdes. L'assemblage de transcriptomes et l'identification des copies de gènes dupliqués par allopolyploïdisation (homéologues) constituent cependant un véritable défi C ‘est plus particulièrement le cas dans un contexte de superposition de plusieurs évènements de polyploïdie et en l'absence de génome de référence diploïde. Les Spartines (Poaceae, Chloridoideae) représentent un excellent système pour étudier les conséquences à court terme des évènements d'hybridation et de polyploïdisation. En effet, S. maritima (hexaploïde) s'est hybridée à deux reprises avec S. alterniflora (hexaploïde) suite à son introduction récente en Europe, formant deux hybrides homoploïdes (S. x townsendii et S. x neyrautii). La duplication du génome de S. x townsendii a formé une nouvelle espèce allododécaploïde S. anglica (à la fin du XIXème siècle) qui a depuis envahi les marais salés de plusieurs continents. L'identification des gènes dupliqués au sein de S. anglica et de ses parents est importante pour la compréhension de son succès évolutif. Cependant, leurs niveaux de ploïdie, et l'absence d'espèce diploïde de référence chez les spartines nécessitent le développement d'outils adaptés. Dans ce contexte, nous avons développé et validé différents outils bioinformatiques permettant de détecter des polymorphismes afin d'identifier les différents haplotypes au sein de jeux de données NTS. Ces approches nous ont permis d'étudier l'hétérogénéité des domaines de l'ADN ribosomique 45S de S. maritima. Nous avons mis en évidence la perte de copies homéologues en conséquence de la diploïdisation en cours. Afin de développer les ressources transcriptomiques de ces espèces, cinq nouveaux transcriptomes de référence (110 423 contigs annotés pour les 5 espèces dont 37 867 contigs non-redondants) ont été assemblés et annotés. Les co-alignements des haplotypes parentaux et hybrides/allopolyploïdes nous ont permis d'identifier les homéo-SNPs discriminant les séquences homéologues. De plus, nous avons évalué la divergence entre les copies de gènes, identifié et confirmé les évènements de duplications récents au sein des Spartines. Au cours de cette thèse, nous avons également initié des approches de phylogénomique des spartines, qui permettront de préciser l'origine évolutive des copies dupliquées.

  • Titre traduit

    Identification and evolution of orthologous sequences in polyploid species by next-gen sequencing


  • Résumé

    Next generation sequencing (NGS) technologies offer new opportunities to explore polyploid genomes and their corresponding transcriptomes. However, transcriptome assemblies and identification of homoeologous gene copies (duplicated by polyploidy) remain challenging, particularly in the context of recurrent polyploidy and the absence of diploid reference parents. Spartina species (Poaceae, Chloridoideae) represent an excellent system to study the short term consequences of hybridization and polyploidization in natural populations. The European S. maritima (hexaploid) hybridized twice with the American S. alterniflora (hexaploid) following its recent introduction to Europe, which resulted in the formation of two homoploid hybrids (S. x townsendii and S. x neyrautii). Whole genome duplication of S. x townsendii resulted in the fertile new allododecaploid S. anglica species (during the 19th century) that has now invaded saltmarshes on several continents. Identification of duplicated genes in S. anglica and its parental species is critical to understand its evolutionary success but their high ploidy levels require the development of adapted tools. In this context, we developed and validated different bioinformatics tools to detect polymorphisms and identify the different haplotypes from NGS datasets. These approaches enabled the study of the heterogeneity of the highly repeated 45S rDNA in S. maritima. In order to develop transcriptomic resources for these species, 5 new reference transcriptomes (110 423 annotated contigs for the 5 species with 37 867 non-redundant contigs) were assembled and annotated. Co-alignments of parental and hybrid/allopolyploid haplotypes allowed the identification of homoeoSNPs discriminating homoelogs. The divergence between duplicated genes was used to identify and confirm the recent duplication events in Spartina. Phylogenomic approaches on Spartina were also initiated in this thesis in the perspective of exploring the evolutionary history of the duplicated copies.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Bibliothèque de ressources électroniques en ligne.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.