Le HRS-Seq : une nouvelle méthode d'analyse à haut-débit des séquences génomiques associées aux compartiments nucléaires

par Marie-Odile Baudement

Thèse de doctorat en Biologie Santé

Sous la direction de Thierry Forne.


  • Résumé

    Chez les organismes complexes, comme les mammifères, les séquences de régulation génomique, dispersées sur les chromosomes, peuvent interagir à l'intérieur de l'espace nucléaire pour effectuer des actions coordonnées de régulations géniques. La méthylation de l'ADN et les modifications post-traductionnelles des histones, en combinaison avec des séquences de régulation, des facteurs protéiques et des ARNs non codants, conduisent à une organisation supérieure de la chromatine spécifique du type cellulaire. Cependant, l'organisation et la dynamique de la chromatine in vivo à l'échelle supérieure à celle du nucléosome reste encore largement méconnues. L'objectif général des travaux de notre équipe est d'élucider l'organisation de la chromatine à l'échelle supranucléosomale et sa dynamique in vivo, dans différents contextes physiologiques ou pathologiques, afin de comprendre leurs participations au contrôle et à la coordination de l'expression des gènes chez les mammifères. Notre hypothèse de travail est que certains compartiments nucléaires permettent un confinement de contacts chromatiniens spécifiques facilitant les régulations génomiques. L'objectif principal de mon travail de thèse était de développer une nouvelle méthode, simple et directe, permettant de cartographier et d'analyser les régions du génome murin qui sont associées aux compartiments nucléaires importants pour la régulation de l'expression des gènes (lamine nucléaire, les nucléoles, usines à transcription ou corps de Cajal). Le principe de notre méthode repose sur des traitements à haut sel de noyaux cellulaires transcriptionnellement actifs. Des séquençages à haut-débit permettent ensuite d'identifier les régions génomiques retenues dans les complexes nucléaires ainsi rendus d'insolubles. Elle a donc été appelée HRS-Seq : High-salt Recovered Sequences-sequencing (séquençage de séquences récupérées à haut-sel). Mon programme de travail s'est déroulé en 4 étapes distinctes : 1- la mise en œuvre et l'amélioration de la partie expérimentale (test HRS), 2- l'adaptation des techniques de séquençage à haut-débit à notre méthode (collaboration avec L. Journot, H. Parrinello, E. Dubois), 3 – l'application d'une analyse statistiques adéquate afin d'identifier les HRS (collaboration avec C. Reynes et R. Sabatier, statisticiens) et 4- l'analyse bio-informatique de ces régions destinée à les cartographier et à les caractériser (collaboration avec J. Mozziconacci et A. Cournac).Dans un premier temps, nous avons utilisé la méthode HRS-seq sur des noyaux de cellules de foie de souris. L'analyse bioinformatique des HRS nous a permis de réaliser la toute première cartographie de ces régions chez la souris et de découvrir leurs principales caractéristiques. Les régions HRS peuvent être classées en deux catégories distinctes : Les HRS riches en AT sont fortement associées à la lamine nucléaire, tandis que celles riches en GC sont associées aux régions géniques. La présence exceptionnelle, parmi cette dernière catégorie, des gènes codant pour les protéines d'histones, indique que le test HRS permet la rétention des Corps des Loci d'Histones (HLB – Histone Locus Body), un type spécifique de corps de Cajal. De plus, grâce à une analyse croisée avec des données de Hi-C disponibles dans la littérature, nous avons pu montrer que les HRS présentent entre-elles une haute probabilité de contact dans l'espace tridimensionnel du noyau, et qu'elles sont fortement enrichies en certaines séquences répétées (gènes des ARNt). L'ensemble de ces résultats nous permet de valider expérimentalement notre méthode. Dans un second temps, nous avons appliqué cette méthode à 3 autres types cellulaires : des cellules souches embryonnaires, des cellules progénitrices neurales et des neurones (collaboration avec T. Bouschet). Le but de ce travail est de déterminer comment les régions HRS évoluent au cours de la différentiation cellulaire. Les analyses statistiques et bioinformatiques sont en cours.

  • Titre traduit

    The HRS-seq : a new method for genome-wide profiling of nuclear compartment-associated sequences


  • Résumé

    In complex organisms like mammals, regulatory sequences, dispersed on the chromosomes, can interact together within the nuclear space to tightly coordinate gene expression. DNA methylation and post-translational histone modifications combine with regulatory sequences, proteic factors and non-coding RNA, to provide cell-type specific patterns of higher-order chromatin organization. However, the in vivo organization of the mammalian chromatin beyond the simple nucleosomal array remains largely enigmatic. The general objective of our group is to elucidate the in vivo organization and dynamic of the chromatin at the supranucleosomal scale in diverse physiological and pathological contexts, in order to better understand how they are involved in the maintenance and coordination of gene expression in mammals. Our working hypothesis is that some nuclear compartments are confining specific chromatin contacts in order to facilitate genomic regulations. The principal objective of my thesis was to develop a novel straightforward method to map and to characterize genomic regions that are associated, in the mouse, with nuclear compartments that are important for gene regulation (nuclear lamina, nucleolus, transcription factories, Cajal bodies). The principle of our method is based on high-salt treatments of transcriptionally active cell nuclei. High-throughput sequencings then allow to identify the genomic regions that are retained in the resulting insoluble nuclear complexes. We thus named this method the HRS-seq (High-salt Recovered Sequences-sequencing). My working program was divided into 4 steps: 1- the improvement of the experimental procedure (HRS assay), 2- the adaptation of the NGS techniques to our method (collaboration with L. Journot, H. Parrinello, E. Dubois), 3- the use of an adequate statistical analysis in order to identify the HRS (Collaboration with C. Reynes and R. Sabatier, statisticians), 4- the bioinformatics analysis of these regions in order to map and to characterize them (collaboration with J. Mozziconacci and A. Cournac). We first used the HRS-seq method on mouse liver cells. The bioinformatics analysis allowed us to obtain the first global profiling of HRS in the mouse and to discover their essential characteristics. The HRS can be classified into two categories: the AT-rich HRS are linked to lamina associated domains, while GC-rich HRS are strongly associated to genes. The presence of histone genes amongst this latter category suggests that the Histone Locus Bodies (HLBs), a specific type of Cajal's body, is retained in the HRS assay. Furthermore, thanks to a cross-analysis with Hi-C data available in international databases, we have shown that the HRS display a high contact probability in the tri-dimensional space of the nucleus and that they are highly enriched in some specific repeat sequences (tRNA genes). Globally, these results allow us to validate the experimental approach used in the HRS-seq method. In a second time, we have applied this method to 3 other cell types: mouse embryonic stem cells, neural progenitor cells and neurons (collaboration with T. Bouschet). The aim of this work is to determine how the HRS regions are regulated during cell differentiation. Statistical and bio-informatics analyses are in progress.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Bibliothèque interuniversitaire. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.