Identification de gènes co-exprimés et co-localisés par des analyses multivariées : analyse des groupes de gènes co-exprimés en fonction des interactions physiques à l’échelle du génome
Auteur / Autrice : | Marion Ouedraogo |
Direction : | Christian Diot, Frédéric Lecerf |
Type : | Thèse de doctorat |
Discipline(s) : | Biologie et Agronomie |
Date : | Soutenance en 2013 |
Etablissement(s) : | Rennes, Agrocampus Ouest |
Ecole(s) doctorale(s) : | École doctorale Vie-Agro-Santé (Rennes) |
Mots clés
Mots clés contrôlés
Résumé
De nombreuses études ont montré que l’architecture des génomes et les interactions entre les chromosomes jouent un rôle majeur dans la régulation de l’expression des gènes. Par exemple chez les eucaryotes, les chromosomes sont organisés en territoires chromosomiques à l’interface desquels des interactions physiques activent ou inhibent l’expression des gènes. De plus, les gènes sont fortement transcrits dans des zones particulières du noyau appelées usines de transcription. Récemment, de nouvelles méthodes de biologie moléculaire ont permis de cartographier les interactions physiques d’un génome et d’apporter de nouvelles informations sur l’organisation des génomes. Dans ce contexte, l’objectif de cette thèse était d’apporter de nouveaux éléments de compréhension de la régulation de l’expression des gènes en regard de l’organisation du génome. Pour cela, nous avons entrepris une approche in silico basée sur l'hypothèse suivante : l’organisation du génome dans le noyau affectant l’expression des gènes, l’expression des gènes doit refléter au moins en partie cette organisation. Nous avons alors développé une méthode, appelée « CoCoMap » pour Co-expression and Co-location Mapping, basée sur les statistiques multivariées et permettant d'explorer la co-expression entre gènes en prenant en compte la dimension spatiale par leur localisation chromosomique. Cette méthode nécessite des données d’expressions associées à la localisation génomique des gènes exprimés. Elle renvoie un ensemble de groupes de gènes voisins et co-exprimés ainsi que les liens de co-expressions entre l’ensemble des groupes identifiés. L’analyse des groupes identifiés par notre méthode par rapport à des données d’interaction physique a conforté notre hypothèse en identifiant de possibles relations entre organisation du génome et co-expression des gènes. De plus, cette méthode permet d’analyser sous un nouvel angle les données biologiques associées à l’expression des gènes en prenant en compte l’aspect spatial de la régulation de leur expression