Analyse bioinformatique du contrôle des éléments transposables par les siARN chez Arabidopsis thaliana

par Alexis Sarazin

Thèse de doctorat en Biologie

Sous la direction de Martine Boccara et de Vincent Colot.


  • Résumé

    De nombreux mécanismes contrôlent et limitent la prolifération des éléments transposables (ET) dans les génomes dont ils menacent l'intégrité structurale et fonctionnelle. Chez les plantes l'interférence ARN (ARNi) joue un rôle important dans ces contrôles via des petits ARN d'environ 20nt qui guident la régulation de l'expression de séquences endogènes ou exogènes par deux types de mécanismes. Un premier mécanisme, partagé par de nombreux organismes eucaryotes, inhibe l'activité d'ARNm par un contrôle post-transcriptionnel. Un deuxième type de régulation, permet un contrôle transcriptionnel de l'activité des ET via un mécanisme appelé RNA directed DNA Methylation (RdDM) qui implique des siARN («  short-interfering RNA ») de 24nt qui guident la méthylation de l'ADN spécifiquement au niveau des séquences d'ET. Les siARN sont impliqués également dans la restauration progressive de la méthylation de l'ADN après une perte induite par la mutation du gène DDM1 (Decrease in DNA Methylation 1). L'objectif de cette thèse est de tirer avantage des technologies de séquençage à haut débit pour caractériser le contrôle des ET par les siARN chez la plante modèle Arabidopsis thaliana.Dans un premier temps, j'ai développé des méthodes et outils bioinformatiques afin de gérer efficacement les données de séquençage à haut débit de banques de petit ARN. Ces outils, regroupés en pipeline, visent à permettre l'étude de l'accumulation des siARN correspondant aux séquences d'ET ou de familles d'ET ainsi que leur visualisation de manière globale ou détaillée.Ces outils ont ensuite été appliqués pour caractériser, dans un contexte sauvage, l'association entre les siARN et les ET afin de déterminer des facteurs pouvant expliquer les différences d'abondance en siARN observées. Ces analyses, réalisées en tenant compte de l'état de méthylation de l'ADN et du contexte génomique des ET apportent une vue statique du contrôle des ET par les siARN et de leur impact sur les gènes situés à proximité.L'analyse de banques de petits ARN de mutants de la voie de l'ARNi a ensuite été réalisée afin mieux caractériser l'impact de la perte de méthylation de l'ADN sur les populations de siARN et notamment définir les mécanismes impliqués dans la production des siARN de 21nt induite dans le mutant ddm1. Ces analyses comparatives du contrôle des ET lors d'une perte de la méthylation de l'ADN ont permis de mettre en évidence une production de siARN de 24nt indépendante de la voie classique du RdDM et de proposer un modèle permettant d'expliquer la production de siARN de 21nt dans le mutant ddm1.Dans un dernier temps, j'ai cherché à mieux définir l'implication des siARN dans la restauration des états de méthylation de l'ADN. Les variations de méthylation de l'ADN induites par la mutation ddm1 ont été caractérisées ainsi que leur stabilité transgénérationnelle au sein d'une population d'epiRIL. La stabilité de l'hypométhylation de l'ADN a été étudiée, au regard de données de séquençage à haut débit de banques de petits ARN de lignées WT, ddm1 ainsi que pour 4 lignées epiRIL, afin d'apporter une notion temporelle à l'étude du contrôle des ET par les siARN.Les résultats soulignent le rôle majeur des petits ARN pour le contrôle des éléments transposables afin de préserver l'intégrité structurale et fonctionnelle du génome et ce, via des mécanismes variés en fonction des ET. Ce travail ouvre la voie vers une analyse du contrôle des ET par les siARN basée sur une approche regroupant les ET en réseaux en fonction des séquences de siARN qu'ils partagent. Cela permettrait d'étudier les « connections-siARN » entre ET afin de, par exemple, explorer l'action en trans des siARN pour la restauration de la méthylation de l'ADN.

  • Titre traduit

    Bioinformatic analysis of siRNA control on transposable elements in Arabidopsis thaliana


  • Résumé

    Many mechanisms control and limit the proliferation of transposable elements (TEs) which could otherwise threaten the structural and functional integrity of the genome. In plants RNA interference (RNAi) plays an important role in this control through small RNAs that guide the expression regulation of endogenous or exogenous sequences by two types of mechanisms. The first such mechanism, shared by many eukaryotic organisms, acts at the post-transcriptionnal level to inhibit the activity of mRNA. A second type of regulation allows the transcriptional control of TEs activity through a mechanism called RNA directed DNA methylation (RdDM) which involves 24nt long siRNA ("short-interfering RNA") that guide DNA methylation specifically on TEs sequences. Furthermore, siRNAs are also involved in the progressive restoration of DNA methylation after a loss induced by mutation of the DDM1 gene (Decrease in DNA Methylation 1). The aim of this thesis is to take advantage of high-throughput sequencing technologies to characterize these TEs controls mechanisms by siRNA in the model plant Arabidopsis thaliana .At first, I developed methods and bioinformatics tools to effectively manage data produced by high-throughput sequencing of small RNA libraries. These tools, combined in a pipeline, are designed to allow the study the accumulation of siRNA corresponding to TE sequences or TE families as well as their global or detailed visualization.These tools were applied to characterize, in a wild type background, the association between siRNA and TEs in order to define factors that may explain the observed differences in siRNA abundance . These analyses were performed by taking into account both DNA methylation states and genomic context. It provides a static view of siRNA control of TEs and their impact on nearby genes. Then, analysis of small RNA libraries from mutants of the RNAi pathway was performed to better characterize the impact of DNA methylation loss on siRNA populations and to define the mechanisms involved in the production of 21nt siRNA induced in the ddm1 mutant. These comparative analyses of the TE control after loss of DNA methylation allow us to highlight the production of 24nt siRNA independently of the classical RdDM pathway and to propose a model explaining the production of 21nt siRNA in the ddm1 mutant. At last, I tried to clarify the involvement of siRNA in the restoration of DNA methylation. Changes in DNA methylation induced by ddm1 mutation were characterized as well as their transgenerational stability in an epiRIL population. The stability of DNA hypomethylation has been studied in relation to high-throughput sequencing of small RNAs data from WT, ddm1 and 4 epiRIL lines. It provides a temporal view of the TE control by siRNA. The results highlight the important role of small RNAs in the control of transposable elements in order to preserve structural and functional integrity of the genome through a variety of mechanisms depending on TE sequences. This work opens the way to the analysis of the siRNA control on TEs based on approaches that combine TEs in networks based on their shared siRNA sequences. It would allow to study "siRNA-connections" between TEs in order to explore, for example, the action in trans of siRNA in the restoration of DNA methylation defect.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.