Amélioration et développement de méthodes de sélection du nombre de composantes et de prédicteurs significatifs pour une régression PLS et certaines de ses extensions à l'aide du bootstrap
| Auteur / Autrice : | Jérémy Magnanensi |
| Direction : | Nicolas Meyer |
| Type : | Thèse de doctorat |
| Discipline(s) : | Biostatistique |
| Date : | Soutenance le 18/12/2015 |
| Etablissement(s) : | Strasbourg |
| Ecole(s) doctorale(s) : | École doctorale des Sciences de la vie et de la santé (Strasbourg ; 2000-....) |
| Partenaire(s) de recherche : | Laboratoire : Progression tumorale et micro-environnement. Approches translationnelles et épidémiologie (Strasbourg) - Institut de recherche mathématique avancée (Strasbourg) |
| Jury : | Président / Présidente : Vincenzo Esposito Vinzi |
| Examinateurs / Examinatrices : Vincenzo Esposito Vinzi, Frédéric Bertrand, Dominique Guenot | |
| Rapporteurs / Rapporteuses : Robert Sabatier, Mohamed Hanafi |
Résumé
La régression Partial Least Squares (PLS), de part ses caractéristiques, est devenue une méthodologie statistique de choix pour le traitement de jeux de données issus d’études génomiques. La fiabilité de la régression PLS et de certaines de ses extensions repose, entre autres, sur une détermination robuste d’un hyperparamètre, le nombre de composantes. Une telle détermination reste un objectif important à ce jour, aucun critère existant ne pouvant être considéré comme globalement satisfaisant. Nous avons ainsi élaboré un nouveau critère de choix pour la sélection du nombre de composantes PLS basé sur la technique du bootstrap et caractérisé notamment par une forte stabilité. Nous avons ensuite pu l’adapter et l’utiliser à des fins de développement et d’amélioration de procédés de sélection de prédicteurs significatifs, ouvrant ainsi la voie à une identification rendue plus fiable et robuste des probe sets impliqués dans la caractéristique étudiée d’une pathologie.