Pronostic mol?culaire bas? sur l'ordre des g?nes et d?couverte de biomarqueurs guid? par des r?seaux pour le cancer du sein

par Yunlong Jiao

Thèse de doctorat en Bio-informatique

Sous la direction de Jean-Philippe Vert.

Soutenue le 11-09-2017

à Paris Sciences et Lettres , dans le cadre de ?cole doctorale Sciences des m?tiers de l'ing?nieur (Paris) , en partenariat avec Centre de bio-informatique (Fontainebleau, Seine et Marne) (laboratoire) et de ?cole nationale sup?rieure des mines (Paris) (?tablissement de pr?paration de la th?se) .

Le président du jury était Francis Bach.

Le jury était composé de Jean-Philippe Vert, Joaqu?n Dopazo, Chlo?-Agathe Azencott.

Les rapporteurs étaient St?phan Cl?men?on, Risi Kondor.


  • Résumé

    Le cancer du sein est le deuxi?me cancer le plus r?pandu dans le monde et la principale cause de d?c?s due ? un cancer chez les femmes. L'am?lioration du pronostic du cancer a ?t? l'une des principales pr?occupations afin de permettre une meilleure gestion et un meilleur traitement clinique des patients. Avec l'avancement rapide des technologies de profilage g?nomique durant ces derni?res d?cennies, la disponibilit? ais?e d'une grande quantit? de donn?es g?nomiques pour la recherche m?dicale a motiv? la tendance actuelle qui consiste ? utiliser des outils informatiques tels que l'apprentissage statistique dans le domaine de la science des donn?es afin de d?couvrir les biomarqueurs mol?culaires en lien avec l'am?lioration du pronostic. Cette th?se est con?ue suivant deux directions d'approches destin?es ? r?pondre ? deux d?fis majeurs dans l'analyse de donn?es g?nomiques pour le pronostic du cancer du sein d'un point de vue m?thodologique de l'apprentissage statistique : les approches bas?es sur le classement pour am?liorer le pronostic mol?culaire et les approches guid?es par un r?seau donn? pour am?liorer la d?couverte de biomarqueurs. D'autre part, les m?thodologies d?velopp?es et ?tudi?es dans cette th?se, qui concernent respectivement l'apprentissage ? partir de donn?es de classements et l'apprentissage sur un graphe, apportent une contribution significative ? plusieurs branches de l'apprentissage statistique, concernant au moins les applications ? la biologie du cancer et la th?orie du choix social.

  • Titre traduit

    Rank-based Molecular Prognosis and Network-guided Biomarker Discovery for Breast Cancer


  • Résumé

    Breast cancer is the second most common cancer worldwide and the leading cause of women's death from cancer. Improving cancer prognosis has been one of the problems of primary interest towards better clinical management and treatment decision making for cancer patients. With the rapid advancement of genomic profiling technologies in the past decades, easy availability of a substantial amount of genomic data for medical research has been motivating the currently popular trend of using computational tools, especially machine learning in the era of data science, to discover molecular biomarkers regarding prognosis improvement. This thesis is conceived following two lines of approaches intended to address two major challenges arising in genomic data analysis for breast cancer prognosis from a methodological standpoint of machine learning: rank-based approaches for improved molecular prognosis and network-guided approaches for enhanced biomarker discovery. Furthermore, the methodologies developed and investigated in this thesis, pertaining respectively to learning with rank data and learning on graphs, have a significant contribution to several branches of machine learning, concerning applications across but not limited to cancer biology and social choice theory.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Paris Sciences et Lettres. Thèses électroniques.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.