Proposition d’une stratégie d’analyse statistique des données de puces à ADN décrivant une cinétique d’expression génique

par Sébastien Tourlet

Thèse de doctorat en Sciences de la Vie et de la Santé

Sous la direction de Bruno Giraudeau.

Soutenue le 18-12-2009

à Tours , dans le cadre de Ecole doctorale Santé, sciences, technologies (Tours) , en partenariat avec SST/08/C/U INSERM 930 - Imagerie et Cerveau (équipe de recherche) .

Le président du jury était Christian Andres.

Le jury était composé de Jean-Louis Dacheux, Gaëlle Lelandais.

Les rapporteurs étaient Alexandre De Brevern, Philippe Dessen.


  • Résumé

    Les résultats d’expériences de microarray furent décriés par le manque de concordance inter-expériences. Les listes immenses de gènes résultant de filtrages statistiques sont difficiles à exploiter. La Food and Drug Administration a montré que le choix d’indicateurs de filtrage de gènes était la source d’une grande disparité entre expériences de microarray issus de laboratoires indépendants. Dans ce contexte, nous avons développé une méthode de sélection basée sur la modélisation de l’allure de la courbe d’expression avec le Log2 du « fold-change » entre les points de cinétique. En effet, des gènes co-régulés au cours d’une cinétique temporelle présentent des courbes d’expression d’allure similaire alors que leur niveau d’expression peut être différent. Nous avons validé la méthode grâce à 2 expériences indépendantes de microar-ray étudiant la différenciation des ovaires d’embryons de souris. Ainsi, nous avons obtenu une liste réduite et pertinente de gènes exprimés. Puis, une analyse de ces résultats dans le cas de la différenciation ovarienne nous a permis d’identifier 9 nouveaux gènes candidats validés in silico et restant à être testés biologiquement.

  • Titre traduit

    Proposition of a statistical strategy to analyse DNA microarray data describing a gene expression kinetics


  • Résumé

    Microarray results were blamed because of their lack of concordance. Moreover, the huge candidate gene lists from statistical filterings are not useful for biologists. FDA proved that the lack of reliability between microarray experiments came from the choice of gene filtering indicators. In this context, a filtering method was developed based on expression curve shape modelling with the use of Log 2 of fold-change between kinetic points. Actually, the co-regulated genes display similar expression shape but with heterogeneous expression level.Our method was developed and validated thanks to two independent microarray experiments (Affymetric®) from mouse embryonic ovaries. Therefore, a short and relevant list of genes was obtained. Thus, a study of results linked to ovarian differentiation permitted to identify nine new candidate genes that were in silico validated. These genes might be biologically tested (i.e. RT PCR) by the scientific community.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université François Rabelais. Service commun de la documentation. Bibliothèque de ressources en ligne.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.