Thèse soutenue

Etudes des éléments cis-régulateurs : identification et caractérisation

FR  |  
EN
Auteur / Autrice : Jeanne Chèneby
Direction : Christine BrunBenoît Ballester
Type : Thèse de doctorat
Discipline(s) : Génomique et Bioinformatique
Date : Soutenance le 19/12/2019
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : Ecole Doctorale Sciences de la Vie et de la Santé (Marseille)
Partenaire(s) de recherche : Laboratoire : TAGC. Technological advances for genomics and clinics (marseille)
Jury : Président / Présidente : François Parcy
Examinateurs / Examinatrices : Delphine Potier, Andrew Saurin
Rapporteurs / Rapporteuses : Morgane Thomas-Chollier, Philipp Bücher

Résumé

FR  |  
EN

Le processus de régulation de la transcription des gènes repose très largement sur l’existence de séquences d’ADN non codantes dans le génome. Ces séquences d’ADN, appelées “éléments cis-régulateurs”, ont la particularité de recruter de nombreuses protéines capables de réguler le niveau de transcription des gènes. La fixation directe ou indirecte de ces protéines régulatrices sur les éléments cis-régulateurs permettent une régulation des gènes dans l’espace et dans le temps. L'accumulation massive des données de séquençage dans les banques de données publiques permet l'intégration de nombreuses expériences capturant les interactions entre les protéines régulatrice et l’ADN par des moyens bioinformatiques. Le but de mon doctorat a été d’annoter et traiter de façon uniforme les données brutes issues d’expériences de séquençage dont l’objectif est d’identifier les régions de fixation des protéines régulatrices pour l’Homme puis chez Arabidopsis Thaliana. Nous avons traité des données de ChIP-seq, ChIP-exo et DAP-seq afin d'élaborer plusieurs catalogues de régions régulatrices. Toutes ces données sont disponibles au sein du projet ReMap. Pour effectuer ces analyses nous avons développé des workflows reproductibles, scalables et portables sur des architectures différentes. Ces données ont aussi été utilisées pour identifier les sites de fixations reconnus par les facteurs de transcription et pour consolider la base de données JASPAR. Enfin, ce catalogue a été utilisé dans le développement d’une nouvelle méthode permettant de différencier les événements de fixations directes et indirectes par les protéines dans les résultats de ChIP-seq.