Etude de l'impact de la dynamique des multiplicités d'ADN sur l'évolution des génomes de moustiques

par Yasmine Mansour

Projet de thèse en Informatique

Sous la direction de Annie Chateau et de Anna Sophie Fiston-lavier.

Thèses en préparation à Montpellier , dans le cadre de I2S - Information, Structures, Systèmes , en partenariat avec Laboratoire d'Informatique, Robotique et Micro-électronique de Montpellier (laboratoire) et de Département Informatique (equipe de recherche) depuis le 01-10-2016 .


  • Résumé

    Les nouvelles données de séquençage permettent d'analyser de façon extensive un nombre croissant de génomes, tant au niveau de leur structure que leur fonctionnement et cela de plus en plus précise. De nombreuses techniques permettent, à partir de ces données de séquençage haut-débit, de produire et d'étudier la séquence génomique d'espèces d'intérêt en santé ou en agronomie. Les récentes et rapides avancées en séquençage des génomes ont permis de révéler l'importance des répétitions d'ADN en nombre mais aussi en terme d'impact sur la structure et l'évolution des génomes. On peut maintenant dire que tous les génomes sont pourvus de répétitions d'ADN et qu'il en existe une très grande diversité. On peut classer les répétitions d'ADN en trois grandes catégories : (1) les duplications, (2) les éléments transposables et (3) les satellites. Les éléments transposables (ET) sont des éléments mobiles des génomes connus pour être très actifs dans certaines espèces. Ils peuvent se déplacer d'un endroit à un autre du génome. En se déplaçant, ils peuvent induire une cassure d'ADN du site dit « donneur ». La cassure sera ensuite réparée. Et dans certain cas, la réparation pourra conduire à la duplication d'une autre copie d'ET au site « donneur ». L'élément en déplacement viendra lui s'insérer à un site dit « accepteur » (site cible d'insertion). La séquence de ce site « accepteur » varie selon le type d'ET. Il existe une très grande diversité d'ET. On les classe par groupe, superfamille, famille et sous-famille selon leur homologie de séquence et mécanisme supposé.Dans ce projet, nous nous intéressons aux génomes de moustiques, notamment aux génomes Aedes aegypti (1,3Gb), Anopheles Gambiae (278Mb) et Culex Pipiens (579Mb) très récemment assemblés ou mis à jour (Voir Figure ; Dudchenko et al 2017). Ces espèces proches mais présentant une grande variabilité en taille de génome, renferment une quantité importante de séquences répétées (20-50%) et ont montré de nombreuses capacités d'adaptation impliquant des ET. Nous nous proposons d'étudier dans ce projet de thèse la dynamique et l'impact des ET sur l'évolution des génomes via le développement d'approches mathématiques/informatiques et via l'analyse de données génomiques issues de séquençage à haut-débit. L'ensemble des ressources et outils développés seront partagés avec la communauté à travers des interfaces web.

  • Titre traduit

    Study of the impact of the dynamics of DNA multiplicities on the evolution of mosquitos genomes


  • Résumé

    The new sequencing data make it possible to extensively analyze an increasing number of genomes, both in terms of their structure and their functions, and this is becoming more and more precise. From these next-generation sequencing data, numerous techniques allow to produce and study the genomic sequences of species for interest in health or agronomy. Recent and rapid advances in genome sequencing have revealed the importance of DNA repeats in number but also in terms of impact on the structure And the evolution of genomes. It can now be said that all genomes are provided with repetitions of DNA and that there is a great diversity. DNA repeats can be classified into three broad categories: (1) duplications, (2) transposable elements, and (3) satellites. Transposable elements (TEs) are mobile elements of genomes known to be very active in certain species. They can move from one place to another in the genome. By moving, they can induce a DNA break from the so-called "donor" site. The break will then be repaired. And in some cases, the repair may lead to duplicating another copy of TEs to the "donor" site. The moving element will be inserted into a so-called "acceptor" site (target insertion site). The sequence of this "acceptor" site varies according to the type of TE. There is a great diversity of TEs. They are classified by group, superfamily, family and subfamily according to their sequence homology and supposed mechanism. In this project we are interested in mosquito genomes, in particular the genomes Aedes aegypti (1,3Gb), Anopheles Gambiae (278Mb) And Culex Pipiens (579Mb) very recently assembled or updated (see Figure; Dudchenko et al. 2017). These closely related species with high variability in genome size contain a significant amount of repeat sequences (20-50%) and have shown many adaptive capacities involving TEs. We propose to study in this thesis the dynamics and the impact of the ET on the evolution of the genomes via the development of mathematical / computational approaches and via the analysis of genomic data resulting from next-generation sequencing. All the resources and tools developed will be shared with the community through web interfaces.