Thèse soutenue

Développement d’un indice de séparabilité adapté aux données de génomique en analyse de survie

FR  |  
EN
Auteur / Autrice : Sigrid Laure Rouam
Direction : Philippe BroëtThierry Moreau
Type : Thèse de doctorat
Discipline(s) : Biostatistiques
Date : Soutenance le 30/03/2011
Etablissement(s) : Paris 11
Ecole(s) doctorale(s) : Ecole doctorale Agriculture, Alimentation, Biologie, Environnement, Santé (Paris ; 2000-2015)
Partenaire(s) de recherche : Laboratoire : Centre de recherche en épidémiologie et santé des populations (Villejuif, Val-de-Marne ; 2010-....)
Jury : Président / Présidente : Jean-Christophe Thalabard
Examinateurs / Examinatrices : Philippe Broët, Thierry Moreau, Jean-Christophe Thalabard, Jean-Pierre Daurès, Jean-Louis Golmard
Rapporteurs / Rapporteuses : Jean-Pierre Daurès, Jean-Louis Golmard

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Dans le domaine de l’oncogénomique, l’un des axes actuels de recherche est l’identification de nouveaux marqueurs génétiques permettant entre autres de construire des règles prédictives visant à classer les patients selon le risque d’apparition d’un événement d’intérêt (décès ou récidive tumorale). En présence de telles données de haute dimension, une première étape de sélection parmi l’ensemble des variables candidates est généralement employée afin d’identifier les marqueurs ayant un intérêt explicatif jugé suffisant. Une question récurrente pour les biologistes est le choix de la règle de sélection. Dans le cadre de l’analyse de survie, les approches classiques consistent à ranger les marqueurs génétiques à partir du risque relatif ou de quantités issues de test statistiques (p-value, q-value). Cependant, ces méthodes ne sont pas adaptées à la combinaison de résultats provenant d’études hétérogènes dont les tailles d’échantillons sont très différentes.Utiliser un indice tenant compte à la fois de l’importance de l’effet pronostique et ne dépendant que faiblement de la taille de l’échantillon permet de répondre à cette problématique. Dans ce travail, nous proposons un nouvel indice de capacité de prédiction afin de sélectionner des marqueurs génomiques ayant un impact pronostique sur le délai de survenue d’un évènement.Cet indice étend la notion de pseudo-R2 dans le cadre de l’analyse de survie. Il présente également une interprétation originale et intuitive en terme de « séparabilité ». L’indice est tout d’abord construit dans le cadre du modèle de Cox, puis il est étendu à d’autres modèles plus complexes à risques non-proportionnels. Des simulations montrent que l’indice est peu affectée par la taille de l’échantillon et la censure. Il présente de plus une meilleure séparabilité que les indices classiques de la littérature. L’intérêt de l’indice est illustré sur deux exemples. Le premier consiste à identifier des marqueurs génomiques communs à différents types de cancers. Le deuxième, dans le cadre d’une étude sur le cancer broncho-pulmonaire, montre l’intérêt de l’indice pour sélectionner des facteurs génomiques entraînant un croisement des fonctions de risques instantanés pouvant être expliqué par un effet « modulateur » entre les marqueurs. En conclusion, l’indice proposé est un outil prometteur pouvant aider les chercheurs à identifier des listes de gènes méritant des études plus approfondies.