Analyse discriminante des spectres en protéomique dans un but diagnostic et thérapeutique : application au cancer du sein

par Nadège Dossat

Thèse de doctorat en Biostatistique. Information, structures, systèmes

Sous la direction de Jean-Pierre Daurès et de Nicolas Molinari.

Soutenue en 2009

à Montpellier 1 , en partenariat avec Université de Montpellier I. Faculté de médecine (autre partenaire) .


  • Résumé

    La protéomique est un outil essentiel dans la compréhension de maladies, tel que le cancer. Le profilage des protéines fournit une vue globale des processus de la maladie au niveau des protéines. La spectrométrie de masse SELDI-TOF est l'un des outils de laboratoire utilisés pour trouver les modèles protéiques associés à la maladie. Un spectre de masse contient l'information sur les protéines et leurs fragments. Un pic c. -à-d. Un maximum local du spectre de masse représente une protéine ou un fragment de prote��ine. L'objectif est de trouver des biomarqueurs discriminants, c. -à-d. Des pics présents dans les groupes cancer du sein et témond sains mais avec des intensités spécifiques à chaque groupe ou encore des pics présents dans un seul des deux groupes. Le problème de cette technique de spectrométrie de masse est la variablilité sur l'abscisse (masse/charge) et sur l'ordonnée (intensité). La variabilité sur l'abscisse rend difficile l'identification des pics statistiquement "identiques" en abscisse. La variabilté sur l'ordonnée conduit à des problèmes de classification des spectres de masse. Un premier objectif était donc d'identifier les pics en tenant compte de la double variablité de ceux-ci. Le principe est de modéliser la variabilité des pics en abscisse et sur l'ordonnée par une distribution normale bivariée. Ainsi, la distribution de la totalité des spectres de masse par groupe (cancer/témoin) est modélisée par un mélange normal bivarié. L'estimation des paramétres de mélange de modèles est faite en employant l'algorithme EM contraint. Après cette identification des pics, les biomarqueurspeuvent être sélectionnés en utilisant des tests statistiques. Pour nous assurer de la réalité de la non présencede certains pics dans un seul des deux groupes, une améloration des méthodes de débruitage des spectres de masse par les transformés en ondulettes invariantes en translation a été étudiée. Le bruit des spectres est influencé par la matrice chimique utiliséé dans la technique de spectrométrie SELDI-TOF, ce qui donne un bruit avec une variance qui décroît continûment en fonction de l'abscisse. Cette deuxième partie a consisté à adapté le seuillage des coefficients d'ondelettes au bruit spécifique des spectres de masse SELDI-TOF. Des adaptations de l'algorrithme EM contraint sont alors nécessaires pour identifier de nouveaus pics par rapport aux groupes de méthodes développés dans la premire partie

  • Titre traduit

    Discriminant analysis of mass spectra in proteomic for diagnosis and therapeutics purposes : application to the breast cancer


  • Résumé

    The proteomic is an essential tool in tehe diseases comprehension, such as cancer. The proteins profiling provides an integrated of the disease pocesses at the protein level. The SELDI-TOF mas spectrometry is one of the laboratory tolls employed to find the disease-related proteomic patterns. A mass spectrum contains information on proteind and their fragments. One peak i. E. One local maximum of the mass spectrum represents a protein or a protein fragment. The objective is to seek discriminating biomarkers i. E. The peaks present in the breast cancer and the healthy control groups but with intensities specific to each or the peaks present in only one of the two groups. The problem of this mass spectrompetrytechnique is variability on the X-coordinate (m/z) and Y-coordinate (intensity). La [i. E. The] variability on the X-coodinate makes difficult the identification of the peaks statistically "identical" on the X-coordinate. The variability on the Y-coordinate leads to problems in the mass spectra classification. A prime objectif was to identify the peaks by taking account of the double variability of those. The principle is to model the peak variability on the X-coordinate and on the Y-coordinate by a bivariate normal distribution. Thus, the distribution of the whole of the mass spectra for one group (cancer/control) is modelled by a bivariate normal mixture. The estimation of mixture model parameters is done by using constrained EM algoritm. After the peak identification, the biomarkers can by identified using statistical tests. For ensure us of the reality of the non presence of certain peaks in only one or the two groups, an improvement of the denoising methods of the mass spectra by the wavelts transforms invariant in translation was studied. The noise of the spectra is influenced by chemical process used in technique of spectrometry SELDI-TOF, which gives a noise with a variance which decrease continuously to the X-coordinate. The second part consisted in adapting the thresholding of the wavelets to the specific noise in the mass spectra SELDI-TOF. Adatations of constrained algorithm EM are then necessary to identify new peaks to compare them with those obtained by the groups of methodes developed in the first part

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (197 f.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. 193-196 (50 réf.)

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque interuniversitaire. Section Médecine-Unité pédagogique médicale.
  • Disponible pour le PEB
  • Cote : TU 2009.MON-9
  • Bibliothèque : Bibliothèque interuniversitaire. Bibliothèque Universitaire Historique de Médecine.
  • Non disponible pour le PEB
  • Cote : TU 2009.MON-9
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.