Thèse soutenue

Analyse discriminante des spectres en protéomique dans un but diagnostic et thérapeutique : application au cancer du sein

FR  |  
EN
Auteur / Autrice : Nadège Dossat
Direction : Jean-Pierre DaurèsNicolas Molinari
Type : Thèse de doctorat
Discipline(s) : Biostatistique. Information, structures, systèmes
Date : Soutenance en 2009
Etablissement(s) : Montpellier 1
Partenaire(s) de recherche : autre partenaire : Université de Montpellier I. Faculté de médecine (1896-2014)

Résumé

FR  |  
EN

"La protéomique est un outil essentiel dans la compréhension de maladies, tel que le cancer. Le profilage des protéines fournit une vue globale des processus de la maladie au niveau des protéines. La spectrométrie de masse SELDI-TOF est l'un des outils de laboratoire utilisés pour trouver les modèles protéiques associés à la maladie. Un spectre de masse contient l'information sur les protéines et leurs fragments. Un pic c. -à-d. Un maximum local du spectre de masse représente une protéine ou un fragment de protéine. L'objectif est de trouver des biomarqueurs discriminants, c. -à-d. Des pics présents dans les groupes cancer du sein et témond sains mais avec des intensités spécifiques à chaque groupe ou encore des pics présents dans un seul des deux groupes. Le problème de cette technique de spectrométrie de masse est la variablilité sur l'abscisse (masse/charge) et sur l'ordonnée (intensité). La variabilité sur l'abscisse rend difficile l'identification des pics statistiquement "identiques" en abscisse. La variabilté sur l'ordonnée conduit à des problèmes de classification des spectres de masse. Un premier objectif était donc d'identifier les pics en tenant compte de la double variablité de ceux-ci. Le principe est de modéliser la variabilité des pics en abscisse et sur l'ordonnée par une distribution normale bivariée. Ainsi, la distribution de la totalité des spectres de masse par groupe (cancer/témoin) est modélisée par un mélange normal bivarié. L'estimation des paramétres de mélange de modèles est faite en employant l'algorithme EM contraint. Après cette identification des pics, les biomarqueurspeuvent être sélectionnés en utilisant des tests statistiques. Pour nous assurer de la réalité de la non présencede certains pics dans un seul des deux groupes, une améloration des méthodes de débruitage des spectres de masse par les transformés en ondulettes invariantes en translation a été étudiée. Le bruit des spectres est influencé par la matrice chimique utiliséé dans la technique de spectrométrie SELDI-TOF, ce qui donne un bruit avec une variance qui décroît continûment en fonction de l'abscisse. Cette deuxième partie a consisté à adapté le seuillage des coefficients d'ondelettes au bruit spécifique des spectres de masse SELDI-TOF. Des adaptations de l'algorrithme EM contraint sont alors nécessaires pour identifier de nouveaus pics par rapport aux groupes de méthodes développés dans la premire partie"