Les réseaux bayésiens : classification et recherche de réseaux locaux en cancérologie

par Emmanuel Prestat

Thèse de doctorat en Bioinformatique

Sous la direction de Christian Gautier.

Soutenue le 25-05-2010

à Lyon 1 , dans le cadre de École Doctorale Evolution Ecosystèmes Microbiologie Modélisation , en partenariat avec Laboratoire de Biométrie et Biologie Evolutive (laboratoire) .

Le président du jury était Marie-France Sagot.

Le jury était composé de Alexandre Aussem, Pascale Cohen.

Les rapporteurs étaient Philippe Dessen, Philippe Leray.


  • Résumé

    En cancérologie, les puces à ADN mesurant le transcriptome sont devenues un outil commun pour chercher à caractériser plus finement les pathologies, dans l’espoir de trouver au travers des expressions géniques : des mécanismes,des classes, des associations entre molécules, des réseaux d’interactions cellulaires. Ces réseaux d’interactions sont très intéressants d’un point de vue biologique car ils concentrent un grand nombre de connaissances sur le fonctionnement cellulaire. Ce travail de thèse a pour but, à partir de ces mêmes données d’expression, d’extraire des structures pouvant s’apparenter à des réseaux d’interactions génétiques. Le cadre méthodologique choisi pour appréhender cette problématique est les « Réseaux Bayésiens », c’est-à-dire une méthode à la fois graphique et probabiliste permettant de modéliser des systèmes pourtant statiques (ici le réseau d’expression génétique) à l’aide d’indépendances conditionnelles sous forme d’un réseau. L’adaptation de cette méthode à des données dont la dimension des variables (ici l’expression des gènes, dont l’ordre de grandeur est 105) est très supérieure à la dimension des échantillons (ordre102 en cancérologie) pose des problèmes statistiques (de faux positifs et négatifs) et combinatoires (avec seulement 10gènes on a 4×1018 graphes orientés sans circuit possibles). A partir de plusieurs problématiques de cancers (leucémies et cancers du sein), ce projet propose une stratégie d’accélération de recherche de réseaux d’expression à l’aide de Réseaux Bayésiens, ainsi que des mises en œuvre de cette méthode pour classer des tumeurs, sélectionner un ensemble de gènes d’intérêt reliés à une condition biologique particulière, rechercher des réseaux locaux autour d’un gène d’intérêt.On propose parallèlement de modéliser un Réseau Bayésien à partir d’un réseau biologique connu, utile pour simuler des échantillons et tester des méthodes de reconstruction de graphes à partir de données contrôlées.

  • Titre traduit

    Classification and capture of regulation networks with bayesian networks in oncology


  • Résumé

    In oncology, microarrays have become a classical tool to search and characterize pathologies at a deeper level than previous methods, using genetic expression to find the mechanisms, classes, molecular associations, and cellular interaction networks of different cancers. From a biological point of view, these cellular networks are interesting because they concentrate a large amount of knowledge about cellular processes. The goal of this PhD thesis project is to extract structures that could correspond to genetic interaction networks from the expression data. "Bayesian Networks", i.e. a graphic and probabilistic method that models even static systems (like the expression network) with conditional independences, are used as the framework to investigate this problem. The adaptation of this method to data where the dimension of the variables (about 105 for gene expression) is much greater than the dimension of the samples (about 102 in oncology) aggravates some statistical and combinatorial problems. For several cancer problematics, this project proposes an acceleration strategy for capturing expression networks with Bayesian Networks and some methods to classify tumors, finding gene signatures of particular biological conditions by searching for local networks in the neighborhood of a gene of interest. In parallel, we propose to model a Bayesian Network from a known biological network, which is useful to simulate samples and to test these methods to reconstruct graphs from


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université Claude Bernard. Service commun de la documentation. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.