Thèse soutenue

Amélioration et développement de méthodes de sélection du nombre de composantes et de prédicteurs significatifs pour une régression PLS et certaines de ses extensions à l'aide du bootstrap

FR  |  
EN
Auteur / Autrice : Jérémy Magnanensi
Direction : Nicolas Meyer
Type : Thèse de doctorat
Discipline(s) : Biostatistique
Date : Soutenance le 18/12/2015
Etablissement(s) : Strasbourg
Ecole(s) doctorale(s) : École doctorale des Sciences de la vie et de la santé (Strasbourg ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Progression tumorale et micro-environnement. Approches translationnelles et épidémiologie (Strasbourg) - Institut de recherche mathématique avancée (Strasbourg)
Jury : Président / Présidente : Vincenzo Esposito Vinzi
Examinateurs / Examinatrices : Vincenzo Esposito Vinzi, Frédéric Bertrand, Dominique Guenot
Rapporteurs / Rapporteuses : Robert Sabatier, Mohamed Hanafi

Résumé

FR  |  
EN

La régression Partial Least Squares (PLS), de part ses caractéristiques, est devenue une méthodologie statistique de choix pour le traitement de jeux de données issus d’études génomiques. La fiabilité de la régression PLS et de certaines de ses extensions repose, entre autres, sur une détermination robuste d’un hyperparamètre, le nombre de composantes. Une telle détermination reste un objectif important à ce jour, aucun critère existant ne pouvant être considéré comme globalement satisfaisant. Nous avons ainsi élaboré un nouveau critère de choix pour la sélection du nombre de composantes PLS basé sur la technique du bootstrap et caractérisé notamment par une forte stabilité. Nous avons ensuite pu l’adapter et l’utiliser à des fins de développement et d’amélioration de procédés de sélection de prédicteurs significatifs, ouvrant ainsi la voie à une identification rendue plus fiable et robuste des probe sets impliqués dans la caractéristique étudiée d’une pathologie.