Etude du complexe impliqué dans l'élimination programmée d'ADN pendant la différenciation du noyau somatique chez Paramecium tetraurelia

par Mélanie Bazin

Projet de thèse en Biologie moléculaire et cellulaire

Sous la direction de Mireille BÉtermier.

Thèses en préparation à université Paris-Saclay , dans le cadre de École doctorale Structure et Dynamique des Systèmes Vivants , en partenariat avec I2BC - Institut de Biologie Intégrative de la Cellule (laboratoire) et de Faculté des sciences d'Orsay (référent) depuis le 30-09-2019 .


  • Résumé

    INTRODUCTION – CONTEXTE SCIENTIFIQUE De nombreuses espèces de métazoaires (nématodes, insectes, crustacés, poissons, oiseaux et même quelques mammifères) présentent la particularité de renfermer dans leurs cellules somatiques un contenu génomique différent de celui de leurs cellules germinales [1]. Cette propriété surprenante est due à un phénomène massif d'élimination programmée d'ADN, survenant dans les précurseurs des cellules somatiques aux stades précoces du développement embryonnaire. La fraction d'ADN éliminée peut représenter jusqu'à 90% du génome chez certaines espèces, mais le rôle de ces réarrangements programmés et les mécanismes moléculaires mis en jeu sont encore mal connus. Les ciliés sont les seuls unicellulaires chez qui de tels réarrangements ont été décrits, en lien avec leur étonnant dimorphisme nucléaire [2]. En effet, les ciliés possèdent deux types de noyaux qui coexistent dans leur cytoplasme : le micronoyau germinal (MIC, 2n) et le macronoyau somatique (MAC, fortement polyploide). A chaque cycle sexuel, le MIC transmet l'information génétique à la descendance à travers la méiose et la fécondation, tandis que le MAC, siège de l'expression génique, est détruit. Les MAC de la nouvelle génération sexuelle sont formés à partir du noyau zygotique, dérivé du MIC, qui renferme toute l'information du génome germinal. Le développement du nouveau MAC, essentiel pour la survie de la descendance, présente des analogies avec le développement embryonnaire des métazoaires : il débute par l'endoduplication du génome (sans division nucléaire) puis, à un niveau de ploïdie intermédiaire, se produit l'élimination programmée d'une fraction d'ADN germinal conduisant à l'assemblage du génome somatique (Figure 1). L'endoduplication se poursuit pendant et après les réarrangements jusqu'à l'obtention de la ploidie finale du MAC. L'équipe « Réarrangements programmés du génome » utilise la paramécie (Paramecium tetraurelia) comme modèle pour étudier les mécanismes impliqués dans l'élimination programmée d'ADN. Chez ce cilié, deux types de séquences germinales, représentant environ 30 Mbp (~30% du génome germinal), sont éliminées pendant le développement du MAC [3] : (i) des séquences répétées (transposons, minisatellites) sont éliminées de façon hétérogène, en association avec la fragmentation des chromosomes ; (ii) environ 45 000 courtes séquences, les IES ou Internal Eliminated Sequences, interrompant 47% des gènes dans le MIC, sont excisées précisément au nucléotide près, permettant ainsi l'assemblage de phases de lecture fonctionnelles dans le MAC. Les IES de P. tetraurelia sont systématiquement encadrées par un dinucléotide TA à chaque borne. Au moins une partie d'entre elles dérivent d'éléments transposables (ET) ancestraux de la famille Tc/mariner qui ont progressivement diminué en taille et perdu leur capacité codante au cours de l'évolution [4]. PROJET DE THESE Les travau x antérieurs de l'équipe ont identifié la protéine PiggyMac (Pgm) comme un acteur-clé des réarrangements, responsable de l'introduction de cassures double-brin programmées de l'ADN aux bornes des IES [5]. Pgm est une transposase domestiquée à partir d'un transposon de la famille piggyBac, une famille d'ET qui se distinguent par la grande précision avec laquelle ils s'excisent de leur site donneur avant de transposer vers un site cible [6]. Pgm possède une triade d'acides aspartiques (DDD) caractéristique des transposases PiggyBac (PB), dont nous avons confirmé le rôle essentiel pour son activité catalytique [7]. Pgm n'agit pas seule pour réaliser l'excision des IES. Cinq autres groupes de transposases PB domestiquées (PgmL1 à PgmL5), probablement dépourvues d'activité catalytique, sont indispensables pour l'excision des IES in vivo [8]. Après l'introduction des cassures, chaque site d'excision est réparé de façon extrêmement précise par la voie du Non-Homologous End Joining (NHEJ) [ 9]. De façon surprenante, la présence d'une forme spécialisée de l'hétérodimère Ku70/Ku80, l'un des acteurs principaux du NHEJ, est requise pour que les coupures induites par Pgm puissent avoir lieu, signe d'un couplage très étroit entre coupure et réparation de l'ADN pendant les réarrangements programmés chez la paramécie [10]. Objectif 1 : Hiérarchie d'assemblage du complexe d'excision des IES in vivo Les PgmLs et l'hétérodimère Ku étant capables de s'associer avec Pgm [8,10], notre modèle de travail est que la coupure de l'ADN aux bornes des IES s'effectue au sein d'un complexe multiprotéique comprenant au moins deux sous-unités catalytiques (Pgm), plusieurs sous-unités inactives (PgmLs) et les protéines Ku70/Ku80 (Figure 2). L'interdépendance des différents composants lors de l'assemblage du complexe et leur rôle fonctionnel dans l'activation de Pgm restent à préciser. De premiers résultats obtenus par l'équipe indiquent que les PgmLs ou l'hétérodimère Ku ne sont pas indis pensables pour l'expression de Pgm in vivo, ni pour son import dans le nouveau MAC en développement [8] (Abello et coll, en préparation). En revanche, chacun de ces partenaires est essentiel pour que Pgm s'associe de façon stable au MAC en développement. Notre hypothèse est qu'ils favorisent l'assemblage d'un complexe fonctionnel stabilisant l'interaction de Pgm avec ses cibles chromatiniennes. Le premier objectif de la thèse sera de disséquer les relations de dépendance mutuelle entre les différents composants du complexe pour leur localisation stable dans le MAC en développement. L'approche expérimentale consistera à : (i) inactiver l'expression de chaque composant du complexe par ARN interférence (ARNi), une technique utilisée en routine chez la paramécie [11] (ii) observer la localisation des autres sous-unités en utilisant des approches d'immunomarquage sur cellules fixées. Des anticorps spécifiques dirigés contre Pgm et certaines PgmLs et déjà testés en immunofluoresc ence sont disponibles [7,8]. D'autres ont été obtenus mais leur spécificité devra être vérifiée par l'étudiant.e. En cas de difficulté, des constructions exprimant les protéines fusionnées à une étiquette 3xFlag ou GFP pourront être utilisées [8,10]. Des résultats préliminaires de l'équipe suggèrent qu'une hiérarchie d'interdépendance existe bien entre les PgmLs pour leur localisation dans le nouveau MAC (V Régnier et J Bischerour, données non publiées), ce qui indique la faisabilité de cette approche. (iii) réaliser l'analyse quantitative des images obtenues en microscopie à fluorescence. Objectif 2 : Interaction de Pgm avec la chromatine La participation de transposases PB domestiquées dans les réarrangements programmés du génome soulève la question de la spécificité de la reconnaissance des IES par la machinerie d'élimination. En effet, les transposases reconnaissent généralement des séquences spécifiques aux extrémités de leur ET d'origine [12], mais les IES de P. tetra urelia ne sont pas apparentées à des transposons piggyBac et ne portent pas non plus de séquence conservée susceptible de constituer un signal spécifique de reconnaissance. Le dinucléotide TA conservé à leurs bornes fait partie intégrante du site de coupure par Pgm [13] et est inclus dans un consensus dégénéré de 8 bp (5' TAYAGYNR 3') retrouvé en répétition inversée aux extrémités des IES [4,14]. Cependant, ni la présence de TA dans le génome germinal ni celle de séquences conformes au consensus ne suffisent à spécifier des bornes d'excision. La reconnaissance des IES semble être contrôlée, au moins en partie, par des molécules d'ARN non codant (ARNnc) qui permettent de reproduire dans le nouveau MAC le profil des réarrangements de la génération précédente [15]. Les ARNnc pourraient guider le dépôt de marques épigénétiques sur la chromatine dans le nouveau MAC en développement qui seraient reconnues par Pgm ou l'un de ses partenaires. Cependant, toutes les IES ne dépendent pas des A RNnc pour leur excision. Le deuxième objectif de la thèse sera de mettre au point les conditions d'immunoprécipitation de la chromatine (ChIP) associée à Pgm, en vue d'étudier l'effet d'une déplétion des partenaires de Pgm sur son interaction avec les séquences germinales éliminées dans le nouveau MAC (IES et ET connus [16]). Cette partie du projet sera organisée en trois étapes : (i) test de l'efficacité des anticorps anti-Pgm disponibles au laboratoire pour le ChIP. En parallèle, l'étudiant.e testera la fonctionnalité d'une construction exprimant Pgm fusionnée à une étiquette 3xFlag et exprimée à partir d'un transgène introduit par micro-injection. Cette deuxième approche, bien que plus délicate à mettre en œuvre, présenterait l'avantage de pouvoir utiliser des anticorps anti-Flag commerciaux pour les expériences de ChIP. (ii) contrôle de l'enrichissement de la chromatine immunoprécipitée en IES et/ou ET, d'abord par PCR quantitative (qPCR), puis par séquençage haut-débit (ChIP-seq) par la plate-forme de séquençage de l'I2BC. L'analyse des données de ChIP-seq sera conduite avec l'aide d'O Arnaiz. Si besoin, l'étudiant.e pourra suivre une formation en bioinformatique pour acquérir les compétences nécessaires. (iii) enfin, les expériences de ChIP seront réalisées en conditions d'interférence contre les gènes de certains partenaires de Pgm suspectés de participer à la spécificité de reconnaissance des IES. Une attention particulière sera prêtée à PgmL1/PgmL3 [8] et mtGa, une protéine à doigt de zinc découverte récemment par l'un de nos collaborateurs (E Meyer, IBENS Paris) et nécessaire pour l'excision d'une catégorie particulière d'IES [17]. Retombées attendues du projet Le projet de thèse proposé apportera de nouvelles informations sur le rôle des différentes sous-unités du complexe impliqué dans les réarrangements programmés du génome somatique chez la paramécie. S'il s'appuie sur des techniques déjà disponibles dans l'équipe (maîtrise du m odèle paramécie, immunofluorescence), il devrait également conduire à la mise en place de nouvelles approches expérimentales dans l'équipe (ChIP). Au-delà de la biologie si particulière de la paramécie, cette étude pourrait présenter un intérêt plus général pour la compréhension du rôle des transposases domestiquées chez les mammifères. En effet, la domestication de transposases PB a été un phénomène récurrent au cours de l'évolution des eucaryotes : des gènes codant pour cinq protéines apparentées à des transposases PB (PGBD1 à PGBD5) ont été identifiés chez l'homme et la souris [18,19]. Toutes les PGBD ne possèdent pas de site catalytique fonctionnel et leur rôle physiologique demeure encore obscur. Les recherches effectuées sur la paramécie pourraient fournir de nouvelles hypothèses sur leur participation concertée à des remaniements du génome qui resteraient à identifier pendant le développement ou la différenciation cellulaire.

  • Titre traduit

    Study of the complex involved in programmed DNA elimination during the differentiation of the somatic nucleus in Paramecium tetraurelia


  • Résumé

    INTRODUCTION – SCIENTIFIC CONTEXT Among metazoans, a growing number of species (including nematodes, insects, crustaceans, fishes, birds and even mammals) have been reported to harbor a different genomic content in their somatic cells relative to their germline [1]. This intriguing feature is the consequence of massive and programmed DNA elimination that takes place in the precursors of somatic cells during early stages of embryonic development. The fraction of eliminated DNA can reach 90% of the genome in some species, but the role of programmed rearrangements and the molecular mechanisms involved have remained elusive for most species. Ciliates are the only unicellular organisms, in which such rearrangements have been described, in association with their remarkable nuclear dimorphism [2]. Indeed, two types of nuclei coexist in the cytoplasm of ciliates: a germline micronucleus (MIC, 2n) and a somatic macronucleus (MAC, highly pol yploid). At each sexual cycle, the MIC transmits all genetic information to the progeny through meiosis and fertilization, while the MAC, in which gene expression takes place, is destroyed. In the following sexual generation, new MACs are formed from the zygotic nucleus, which derives from the MIC and contains the germline genome. The development of the new MAC, essential for progeny survival, shares common features with embryonic development in metazoans: first, several rounds of genome endoduplication take place (without nuclear division) and, once an intermediate ploidy level has been reached, programmed elimination of a fraction of germline DNA drives the assembly of the somatic genome (Figure 1). Genome endoduplication goes on during and after the rearrangements until the MAC reaches its final ploidy. The team “Programmed genome rearrangements” uses Paramecium tetraurelia as a model to study the molecular mechanisms involved in programmed DNA elimination. In this ciliate, two types of germline sequences, representing around 30 Mbp (~30% of the germline genome), are removed from the developing MAC [3]: (i) repeated sequences (transposons, minisatellites) are eliminated in a heterogeneous manner in association with chromosome fragmentation; (ii) around 45,000 short Internal Eliminated Sequences (IES), which interrupt 47% of all open reading frames in the MIC, are precisely excised at the nucleotide level, therefore allowing the assembly of functional open reading frames in the MAC. P. tetraurelia IESs are systematically flanked by one TA dinucleotide at each boundary. At least part of them are remnants of ancestral transposable elements (TEs) from the Tc/mariner family that have progressively shortened in size and lost their coding capacity throughout evolution [4]. PhD PROJECT Previous work of our team have identified the PiggyMac protein (Pgm) as a key player of genome rearrangements, responsible for the introduction of programmed DNA double-stran d breaks at IES boundaries [5]. Pgm is a domesticated transposase originating from a transposon of the piggyBac family, a family of TEs characterized by their remarkably precise excision from their donor site before they transpose to a target locus [6]. Pgm harbors a triad of aspartic acids (DDD) typical of PiggyBac transposases (PB), which we confirmed is essential for Pgm catalytic activity [7]. Pgm does not work alone to carry out IES excision. Five other groups of domesticated PB transposases (PgmL1 to PgmL5) were shown to be essential for IES excision in vivo, even though they have probably lost their catalytic activity [8]. After double-strand breaks are introduced, each excision site is repaired in an exquisitely precise manner by the Non-Homologous End Joining (NHEJ) pathway [9]. Surprisingly, a specialized version of the Ku70/Ku80 heterodimer, one of the main actors of NHEJ, is essential to license Pgm-mediated DNA cleavage, indicating that DNA cleavage and repair are very tightly coupled during programmed rearrangements in Paramecium [10]. Objective 1 : Hierarchy of assembly within the IES excision complex in vivo Because PgmLs and the Ku heterodimer are able to interact with Pgm [8,10], our working model is that DNA cleavage at IES boundaries is carried out within a multiprotein complex including at least two catalytic subunits (Pgm), several non-catalytic subunits (PgmLs) and the Ku70/Ku80 proteins (Figure 2). Whether and how the different components depend upon each other during assembly of the complex and their functional role in Pgm activation have to be clarified. Preliminary data obtained by our team indicate that PgmLs or the Ku heterodimer are not required for Pgm expression in vivo, neither are they for the import of Pgm into the new developing MAC [8] (Abello et al, in preparation). In contrast, each partner is essential for the stable association of Pgm with the developing MAC. Our hypothesis is that Pgm partners favor the assembly of a functional complex, which stabilizes Pgm interaction with its chromatin targets. The first objective of the PhD project will be to dissect the mutual dependence relationships that have been established between the different components of the complex to allow their stable localization in the developing MAC. The experimental strategy will be to: (i) knock down the expression of each component of the complex using RNA interference (RNAi), a technique that is routinely used in Paramecium [11] (ii) monitor the localization of other subunits using immunolabeling of fixed cells. Specific antibodies raised against Pgm and some PgmLs are available and have already been tested for immunofluorescence experiments [7,8]. Other antibodies are also available, but the student will have to check their specificity. In case one antibody turns out to be non-specific, constructs expressing 3x-Flag tagged proteins will be used to visualize their localization [8,10]. Preliminary data from ou r team suggest that a hierarchy of mutual dependence exists among PgmLs and drives their stable localization in the new MAC (V Régnier and J Bischerour, unpublished data). This shows the feasibility of the proposed strategy. (iii) perform the quantitative analysis of all immunofluorescence microscopy imaging data from the above experiments. Objective 2: Interaction of Pgm with chromatin The contribution of domesticated PB transposases raises the question of how IESs are specifically recognized by their elimination machinery. Indeed, transposases generally recognize specific sequences at the ends of their cognate TE [12], but P. tetraurelia IESs are not related to piggyBac transposons and do not carry any conserved sequence that may constitute a specific recognition signal. The conserved TA dinucleotide at their ends is included within the Pgm cleavage site [13] and is part of a degenerate 8-bp consensus (5' TAYAGYNR 3') that is found as an inverted repeat at IES ends [4,14 ]. However, neither the presence of a TA in the germline genome nor that of consensus-like motifs are sufficient to specify excision boundaries. IES recognition seems to be, at least in part, under the control of non-coding RNA molecules (ncRNA) that ensure that the rearrangements that took place in the old MAC are reproduced in the MAC of the next generation [15]. In the new developing MAC, ncRNAs may guide the deposition of epigenetic chromatin marks that will be recognized by Pgm or one of its partners. However, not all IESs depend upon ncRNAs for their correct and efficient excision. The second objective of the PhD project will be to setup a protocol for the immunoprecipitation of Pgm-associated chromatin (ChIP), in order to investigate the effect of depleting Pgm partners on its interaction with germline eliminated sequences in the new MAC (IESs and know TEs [16]). This part of the project will be organized in three steps: (i) Test of the efficiency of available anti-Pgm antibodies in ChIP experiments. In parallel, the student will check the functionality of a construct expressing a 3xFlag-Pgm fusion from a micro-injected transgene. If the fusion is functional, the latter approach, even though more complex than directly targeting endogenous Pgm, will allow the student to use commercial anti Flag antibodies for subsequent ChIP experiments. (ii) Control of the enrichment for IESs and/or TEs in the precipitated chromatin, using quantitative PCR (qPCR) in a first step, followed by high throughput sequencing performed with the support of the I2BC sequencing platform. ChIP-seq data will be analyzed with the help of O Arnaiz. If needed, the student will be trained in bioinformatics to acquire all necessary skills. (iii) Finally, ChIP experiments will be performed under RNAi conditions to knock down the expression of Pgm partners that may participate in IES recognition. Particular attention will be focused on PgmL1/PgmL3 [8] and mtGa, a zinc-finger pr otein that was recently shown by one of our collaborators (E Meyer, IBENS Paris) to specify excision of a particular IES subset [17]. Expected impact of the project The present PhD project will provide new information on the role played by the different subunits of the complex involved in the programmed somatic genome rearrangements in Paramecium. While some experimental approaches are already mastered by our team (knowledge of the Paramecium model, quantitative fluorescence microscopy), the project should lead to the setup of new ChIP approaches in our team. Beyond the peculiar biology of Paramecium, the proposed study might broaden our understanding of the role played by domesticated transposases in mammals. Indeed, PB transposases have been repeatedly domesticated during eukaryote evolution: in particular, five genes encoding distinct PB-related proteins (PGBD1 to PGBD5) have been reported in humans and mice [18,19]. Not all PGBDs carry a functional catalytic site and their physiological role is still unclear. The work performed in Paramecium may lead to consider the possibility that all PGBDs together participate in some genome rearrangements during development or cell differentiation.