Déterminants moléculaires et rôle du ciblage des transposons par Polycomb

par Tamara Yehouessi

Projet de thèse en Génétique

Sous la direction de Angélique Deleris.

Thèses en préparation à université Paris-Saclay , dans le cadre de École doctorale Sciences du Végétal : du gène à l'écosystème , en partenariat avec Institut de Biologie Intégrative de la Cellule (laboratoire) et de Faculté des sciences d'Orsay (référent) depuis le 01-10-2020 .


  • Résumé

    Les éléments transposables (ou transposons) sont des séquences répétées pouvant potentiellement se déplacer et se multiplier au sein du génome. La transposition peut être délétère et est réprimée par le génome hôte. Cependant, la mobilité des transposons est un atout évolutif et adaptatif dans de divers organismes, en particulier en donnant aux gènes environnants des éléments de régulation génétique ou épigénétiques pouvant impacter leur transcription (1). L'étude de leur régulation est donc essentielle pour comprendre, d'une part, les conditions de leur transposition et d'autre part, leur influence sur des gènes voisins, et donc, leur potentiel adaptatif. La méthylation de l'ADN (5-methylcytosine) est une marque caractéristique des transposons dans de nombreux organismes, y compris les plantes, qui réprime l'expression des transposons. La méthylation de l'ADN n'est généralement pas impliquée dans la répression des gènes codant des protéines. D'autre part, dans la plupart des organismes modèles, les protéines du groupe polycomb (PcG), dont celles du complexe Polycomb Repressive Complex 2 (PRC2), déposent un groupe trimethyl sur la lysine 27 de l'histone 3 (H3K27me3). Ce mécanisme est une marque de la répression de la transcription des gènes codants des protéines impliquées dans le développement. Par conséquent, H3K27me3 et la méthylation de l'ADN ont été considérées comme des marques épigénétiques mutellement exclusives et spécialisées respectivement dans la repression transcriptionnelle des gènes et des transposons. Cependant, les exemples de liens mécanistiques et fonctionnels entre les deux marques s'accumulent. Notamment, chez les plantes et les mammifères, certains transposons gagnent la marque H3K27me3 suite à la perte de la marque de methylation d'ADN, en particulier dans les mutants ADN-hypométhylés et chez les cellules cancereuses (2). Ces observations impliquent que le groupe Polycomb pourrait servir de système de répression transcriptionnelle de secours pour les transposons ADN-hypométhylés. Ces observations ont aussi des implications mécanistiques : PRC2 peut être recruté par les transposons quand la methylation de l'ADN ne l'exclue pas. De plus, dans les feuilles de plantes sauvages, nous avons aussi identifié des transposons marqués par H3K27me3 (3). Dans ce projet, nous voulons comprendre quels sont les déterminants moléculaires et les contextes biologiques qui favorisent le recrutement de PRC2 par les transposons _ parfois même au détriment de la machinerie de méthylation de l'ADN_ ainsi que les conséquences fonctionnelles de ce recrutement, et ce chez la plante à fleur Arabidopsis thaliana, un modèle pertinent pour étudier la régulation épigénétique des transposons. Dans le cadre de nos travaux précédents, nous avons voulu comprendre le role de Polycomb au niveau des ETs en l'absence de methylation de l'ADN à travers l'étude épigénomique du double mutant ddm1-clf, défecteux pour la mainteance de la methylation de l'ADN et pour la déposition de H3K27me3. Ce Cependant, l'analyse du double mutant s'est révélée plus complexe que nous l'avions anticipée puisque nous avons observé une reméthylation globale de l'ADN dans ce fonds génétique qui masquait tout effet potentiel de la perte de H3K27me3 sur le silencing des TEs, possiblement due à des effets pleiotropes (4). Par conséquent, de nouvelles approches demandent à être mises en oeuvre pour répondre à notre question initiale du rôle de Polycomb sur les TEs. 1) D'une part, nous mettrons en oeuvre la technique d'”epigenome-editing“ par CRISPR (dCas9 fusionnée a une DNA demethylase(5)) ” pour déméthyler specifiquement des TEs candidats dans fonds mutant Polycomb. 2) En parallèle, nous analyserons le statut épigénétique de versions transgéniques de ces candidats transposons (marques H3K27me3 et la méthylation de l'ADN), juste après leur intégration dans le génome de plantes sauvages (contexte biologique où les transgènes/TEs sont naturellement ADN-hypométhylés) ou de mutants de méthylation de l'ADN. Tout d'abord, ceci nous permettra de déterminer si le recrutement de PcG au niveau de ces TEs se produit via un mécanisme instructif (recrutement « en cis ») ou si il est dépendant d'effets de position (« spreading » à partir de gènes voisins et ciblés par Polycomb), et de déterminer les bases moléculaires de ce recrutement. De plus, cette approche va nous permettre de tester une compétition entre H3K27me3 et la méthylation de l'ADN suite à l'intégration des transgènes dans le génome. Enfin, pour les TEs qui ont conservé leur capacité à transposer, ces transgènes pourront modéliser des néoinsertions de TE (6) et nous permettra d'étudier leur resilencing suite à leur transposition. Dans ce contexte, les TE transgeniques nous serviront à étudier la participation de PcG dans le resilencing des TE après leur intégration. La répression des transposons dans ce contexte particulier est essentielle pour l'intégrité du génome et éviter la propagation des transposons, mais les bases moléculaires de ce phénomène ne sont pas encore bien comprises. D'autre part, dans ce même but, nous utiliserons aussi les EpiRILS (Epigenetic Recombinant Inbred Lines) qui arborent une mosaique d'épigénomes et la transposition d'une douzaine de transposons, mais qui sont proches genetiquement des lignées sauvages, autorisant la (re)methylation de l'ADN et le « resilencing » de certains de ces transposons . Le projet peut être divisé en cinq tâches : Tâche 1 : Epigenome editing de candidats TE candidats endogènes (Fonction de H3K27me3 sur les TEs) La demethylation de trois candidats TE (cibles de PcG en l'absence de methylation de l'ADN) sera conduit comme dans (5). Tâche 2 : Analyse du statut épigénétique des transposons au cours de plusieurs générations et dans différents mutants (Détermination des bases moléculaires du recrutement de Polycomb sur les TEs et compétition avec la méthylation de l'ADN – Rôle dans le silencing des TE transgéniques ) Tâche 3 : Importance de la méthylation de l'ADN dans le processus de recrutement du groupe Polycomb Nous testerons l'hypothèse que la déméthylation active de l‘ADN favorise l'action du groupe Polycomb pour les transposons transgéniques et les transposons endogènes dans les mutants rdd où les principales DNA demethylases sont désactivées. Tâche 4 : Mechanisme de repression de novo des transposons dans les EpiRILS Nous déterminerons les profils de méthylation de l'ADN et de H3K27me3 de deux transposons actifs après leur transposition, dans les EpiRILs et sur plusieurs générations. Si H3K27me3 est retrouvée sur ces deux transposons, nous les analyserons dans des lignées individuelles en correlation avec le statut d'expression des transposons. L' épigénome-editing pourra eventuellement mis en œuvre dans ces lignées pour confirmer ce rôle. Tâche 5 (tout au long du projet) : Création d'un rapporteur de expression de TE basé sur la GFP Les séquences des transposons ont étés clonées dans un vecteur exprimant la GFP pour exploiter les propriétés répressives d'H3K27me3, une fois nucléé sur la GFP. C'est cette approche qui a permis de valider l'hypothèse de “PREs”, c'est-à-dire des séquences minimales nécessaires et suffisantes pour recruter PRC2 (7). Ainsi, les plantes transformées avec nos constructions devraient constituer des rapporteurs potentiels de la “déposition du groupe Polycomb aux transposons”, ce que nous vérifierons pour selectionner et caractériser en détail les lignées individuelles pour créer une lignée rapporteuse idéale qui sera utilisé pour d'autres approches génétiques dans le futur.

  • Titre traduit

    Molecular determinants and role of transposon targeting by Polycomb-group proteins


  • Résumé

    Transposable Elements (TEs) are repeated sequences that can potentially move and multiply in the genome. Transposition can be deleterious and is negatively controlled by host genomes; on the other hand, TE mobilization has been recognized as a driving force of evolution and adaptation in various organisms, in particular by providing nearby genes with genetic or epigenetic regulatory modules that can impact transcriptional programs (1). Therefore, the study of TE regulation is essential to understand both the conditions for their transposition and their influence on nearby genes, thus their potential for adaptation. DNA methylation (5-methylcytosine) is a hallmark of TEs in many organisms, including plants, which negatively controls TE expression; typically, DNA methylation is not involved in silencing protein coding genes. Inversely, in most model organisms, the highly conserved Polycomb Group (PcG) proteins, namely Polycomb Repressive Complex 2 (PRC2), which deposits histone H3 Lysine 27 trimethylation (H3K27me3), are a hallmark of transcriptional repression associated with protein-coding genes involved, in particular, in development. Thus, PcG and DNA methylation have been generally considered as mutually exclusive, specialized systems for the transcriptional silencing of genes and TEs respectively, in plants and mammals. Nevertheless, there is a growing body of evidence for a mechanistic and functional interplay between these pathways. Notably in plants and mammals, many TE sequences gain H3K27me3 upon their loss of DNA methylation, in particular in hypomethylated mutants and cancer cells (2). These observations imply that PcG could serve as a back-up control silencing system for hypomethylated TEs. It has also mechanistic implications: that PcG can be recruited to TEs and that DNA methylation can exclude H3K27me3 deposition. Further increasing the complexity, in wild-type leaves, we have identified TEs marked by H3K27me3 (2). In this project, we want to understand what underlies PRC2 recruitment at TEs and what molecular determinants and biological contexts could favor it, sometimes, over DNA methylation. We also want to address the functional role of H3K27me3 at endogenous TEs including upon their transposition when they are active. We will answer these questions in the flowering plant Arabidopsis thaliana, a powerful model to study epigenetic TE regulation with an actual relevance to adaptation. Our previous work attempted to address the role of Polycomb at TEs in the absence of DNA methylation through an epigenomic analysis of the ddm1-clf mutant in which both maintenance of DNA methylation and H3K27me3 were impaired. However, the analysis of this double mutant proved to be more complex than anticipated since we unexpectedly observed a global phenomenon of DNA remethylation in this background that masked any potential effect of loss of H3K27me3 on the silencing of TEs. Besides, ddm1-clf mutants are partially sterile and likely display many pleiotropic effects (3). Thus, alternative approaches now need to be implemented. 1) We will use CRISPR/dCAs9-based epigenome-editing to specifically DNA demethylate individual candidates TEs in a Polycomb mutant (clf).( This technique has recently been set-up in S. Jacobsen lab (4)) 2) In parallel, we will analyze the epigenetic status (DNA methylation and H3K27me3) of transgenic versions of these TEs upon their integration into wild-type plants (biological context where they are naturally hypomethylated) or in DNA methylation mutants. First, this will enable us to determine whether PcG recruitment to these TEs occurs through an instructive mechanism (cis-recruitment) or whether it is dependent on position effects (spreading of H3K27me3 marks from adjacent genic PcG targets), and to determine the molecular determinants of PcG recruitment. In addition, this approach will enable us to test for a competition of H3K27me3 and DNA methylation upon integration of the TE transgene in the genome. Third, for the TEs that are still active, TE transgenes can model TE neoinsertions (5) and will enable the study of their resilencing upon transposition . This phenomenon is crucial for genome integrity to avoid further TE propagation but its molecular bases have remained elusive. In this regard TE transgenes will serve to study the participation of PcG in resilencing TEs after their integration. On the other hand, we will use Epigenetic Recombinant Inbred Lines (EpiRILs) which display mosaic epigenomes and transposition of a dozen of TEs, but are nearly genetically identical to wild-type plants allowing resilencing to occur. The project can be divided into five tasks: Task 1 Epigenome editing of individual TE candidates (Function of PcG recruitment to TEs) Demethylation of three TE targetted by PcG (in the absence of DNA methylation) will be achieved as described in (4) in clf mutants. Task 2: Analysis of transgenic TE epigenetic status in various generations and mutants (Molecular determinants of Pcg recruitment to TEs and competition with DNA methylation- Role in transgene silencing) Task 3: Importance of DNA demethylation in the process of recruiting PcG (Reverse-genetics) We will test the hypothesis that active DNA demethylation favors PcG at transgenic TEs and endogenous TEs in rdd mutants where the main active DNA demethylases have been desactivated. Task 4: TE resilencing mecanisms in EpiRILs We will determine the DNA and H3K27me3 profiles of two active TEs after their transposition, in bulks of EpiRILS, across several available generations. If H3K27me3 is found at these two TEs, analyses will be performed in individual lines in correlation with the TE expression status; in this case, epigenome-editing could be further performed to confirm a role in TE silencing. Task 5 (throughout the project): Set-up a GFP-based reporter of TE expression The TE sequences have been cloned in a GFP-based vector to exploit the property of H3K27me3, once nucleated, to result in GFP silencing. This approach has been successfully used to validate putative “PREs”; i.e. minimal sequences necessary and sufficient to recruit PRC2 at genes (6). Thus, the plants transformed with the various constructs should constitute potent reporters of “PcG deposition at TEs” which we will verify; we will select and characterize in detail individual lines to set-up an ideal reporter line for future endeavours.