Analyse statistique des données issues des biopuces à ADN

par Julie Peyre

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Anestis Antoniadis et de Marie Dutreix.

Soutenue en 2005

à l'Université Joseph Fourier (Grenoble) .

    mots clés mots clés


  • Résumé

    Cette thèse est consacrée à l'analyse statistique des données issues des biopuces à ADN. Nous nous intéressons ici à trois problématiques liées aux données du transcriptôme. Dans un premier chapitre, nous étudions le problème de la normalisation des données dont l'objectif est d'éliminer les variations parasites entre les échantillons des populations pour ne conserver que les variations expliquées par les phénomènes biologiques. Nous présentons plusieurs méthodes existantes pour lesquelles nous proposons des améliorations. Pour guider le choix d'une méthode de normalisation, une méthode de simulation de données de biopuces est mise au point. Dans un deuxième chapitre, nous abordons le problème de la détection de gènes différentiellement exprimés entre deux séries d'expériences. On se ramène ici à un problème de test d'hypothèses multiples. Plusieurs approches sont envisagées: sélection de modèles et pénalisation, méthode FDR basée sur une décomposition en ondelettes des statistiques de test ou encore seuillage bayésien. Dans le dernier chapitre, nous considérons les problèmes de classification supervisée pour les données de biopuces. Pour remédier au problème du " fléau de la dimension ", nous avons développé une méthode semi-paramétrique de réduction de dimension, basée sur la maximisation d'un critère de vraisemblance locale dans les modèles linéaires généralisés en indice simple. L'étape de réduction de dimension est alors suivie d'une étape de régression par polynômes locaux pour effectuer la classification supervisée des individus considérés.


  • Pas de résumé disponible.

  • Titre traduit

    Statistical analysis of microarray data


  • Résumé

    This dissertation is dedicated to the statistical analysis of microarray data. We consider three issues linked to the transcriptome data. Ln the first chapter, we study the problem of data normalisation ; its purpose is to eliminate the parasite differences between samples, in order to retain only those variations that are due to biological phenomena. We present several existing normalisation methods and, for sorne of them, we propose improvements. Furthermore, in order to guide the choice among those methods, we develop a procedure to simulate microarray data. Ln the second chapter, we deal with the detection of differentially expressed genes between two series of experiments, an issue that we assimilate to a multiple-hypothesis testing problem. Several approaches are studied: model selection and penalty, FOR method based on a wavelet decomposition of the test statistics and Bayesian thresholding. Ln the last chapter, we consider the problem of supervised classification of microarray data. To cope with the high-dimensionality problem, we develor a semi-parametric method for dimension reduction, based on the maximisation of a locallikelihood criterion in generalized linear single-index model. The dimension reduction step is then followed by a local polynomial regression step, in order to perform the supervised classification of the given individuals.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (211 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 207-211

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS05/GRE1/0129
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS05/GRE1/0129/D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.