La construction du réseau de régulation transcriptionnelle

par Islam Sultan

Thèse de doctorat en Sciences de la vie et de la santé

Sous la direction de Sophie Schbath et de Pierre Nicolas.

Le président du jury était Stéphane Robin.

Le jury était composé de Sophie Schbath, Pierre Nicolas, Stéphane Robin, Grégory Nuel, Denis Thieffry, Juliette Martin.

Les rapporteurs étaient Grégory Nuel, Denis Thieffry.


  • Résumé

    Une part prépondérante de la régulation au niveau transcriptionnel passe par la modulation du taux d’initiation de la transcription. Chez les bactéries,l’initiation de la transcription implique la reconnaissance par le facteur sigma de l’ANR polymérase d’un motif de séquence particulier localisé approximativement10 bp en amont du site d’initiation de la transcription(TSS). Elle est modulée par la fixation de facteurs de transcription qui reconnaissent d’autres motifs à proximité. La technologie RNA-Seq donne accès au répertoire des TSS et des unités de transcriptions et offre donc des perspectives renouvelées pour s’attaquer au problème de l’identification des motifs de fixation des facteurs de transcription. Ce travail de thèse a visé à évaluer les outils existants et à développer de nouvelles méthodes pour la prédiction des sites de fixation des facteurs de transcription en combinant l’information des profils d’expression et des positions des TSS. Plusieurs approches fondées sur les modèles de matrices poids-position (PWM) vont être explorées pour étendre le modèle de mélange classiquement utilisé en relâchant l’hypothèse selon laquelle les motifs correspondants aux différents sites de fixations apparaissent indépendamment dans les différentes régions promotrices. Dans les nouveaux modèles, nous prendrons explicitement en compte une probabilité supérieure d’apparition d’un même motif dans des promoteurs dont les profils d’activité sont similaires. Une attention particulière sera aussi portée à la position du motif par rapport au TSS et au site de fixation du facteur sigma. En parallèle des développements méthodologiques nous travaillerons aussi sur l’utilisation de ces approches pour reconstruire le réseau des régulations transcriptionnelles chez L. monocytogenes en s’appuyant sur les données de la littérature et du projet List MAPS. Enfin,nous envisageons d’utiliser l’information sur le réseau de régulation pour étudier un point particulier qui serait pertinent.

  • Titre traduit

    Transcriptional regulatory network construction


  • Résumé

    This PhD project takes place in List MAPS, a Horizon 2020-funded Marie Curie Actions InnovativeTraining Network (ITN) with the goal of understandingof the ecology of Listeria monocytogenesthrough the combination of high throughput Epigenetics, Deep sequencing of transcripts, Proteomics, Bioinformatics, Mathematics and Microbiology. Acentralobjective of the ITN is to decipher the mechanismsunderlying adaptation and virulence of L. monocytogenes“from farm to fork”.This PhD project (subproject9) aims to tackle the task of transcription regulatorynetwork construction. A significant part of regulationat the transcriptional level is achieved by modulationof transcription initiation rate. In bacteria, transcriptioninitiation relies on recognition of particular sequencemotif by a Sigma-factor approximately 10 bpupstream of the transcription start site (TSS) and ismodulated by the binding of transcription factors recognizingother sequence motifs located nearby. RNASeqtranscriptomics provides direct information on therepertoire of TSSs and transcription units and therebyoffers renewed perspectives to address the problemof transcription factor binding sites identification. Thegoal of this PhD project is to assess existing toolsand to develop new methods for prediction of TF bindingsites by combining expression profiles and preciseinformation on the location of the TSSs. Severalapproaches based on position weight matrix (PWM)models will be investigated to extend the classicalmixture model by relaxing the hypothesis that motifscorresponding to different TF binding sites occur independentlybetween TSS regions.In the new model,we will explicitly account for the increased probabilityof occurrence of a same motif in two promoters whentheir profiles of activity across conditions are similar. A particular attention will also be paid to the positionof the motif with respect to the TSS and the sigmafactor binding site. In parallel to the methodologicaldevelopments we will also work on the use of theseapproaches to build the transcription regulatory networkof L. monocytogenes based on data form theliterature and from the List MAPS project. Finally, wewish to use the information on the regulatory networkto tackle a particular point relevant for the List MAPSproject using a dedicated model.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris-Sud. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.