Thèse soutenue

Prédiction contrefactuelle pour l'estimation causale à partir de données de vie réelle

FR  |  
EN
Auteur / Autrice : Arthur Chatton
Direction : Yohann Foucher
Type : Thèse de doctorat
Discipline(s) : Biostatistique
Date : Soutenance le 13/12/2021
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale Biologie-Santé (Nantes)
Partenaire(s) de recherche : Laboratoire : SPHERE (Nantes ; Tours)
Jury : Examinateurs / Examinatrices : Florent Le Borgne, Cécile Proust-Lima, Anne-Laure Boulesteix, Julie Josse

Résumé

FR  |  
EN

L’absence de randomisation pour les données de vie réelle complique l’analyse statistique et nécessite l’utilisation de méthodes complexes. L’application web Plug-Stat® facilitece type d’analyse en proposant des interfaces intuitives pour les non-spécialistes. La présente thèse cherche à optimiser Plug-Stat® en automatisant le plus possible l’étape d’estimation causale. Trois travaux étudiant le comportement de ces méthodes et un quatrième proposant un outil d’aide à la décision sont présentés. Le premier travail compare par simulations les méthodes d’inférence causale les plus courantes selon différents ensembles d’ajustement. Le second travail compare différentes approches de machine learning en combinaison avec la g- computation pour éviter les biais liés à une mauvaise spécification du modèle. Le troisième travail présente le développement d’un estimateur de g-computation en présence de censure à droite. Ce nouvel estimateur est également combiné avec un score de propension pour former un estimateur doublement robuste. Ces trois méthodes sont ensuite comparées par simulations. Le dernier travail propose un algorithme d’aide à la vérification de l’hypothèse de positivité. Au final, la g-computation semble être une méthode à considérer pour l'automatisation de Plug-Stat®. Elle ne nécessite pas d'hypothèse d'équilibre et le machine learning évite les problèmes de spécification. Enfin, la vérification de la positivité est automatisée au moyen d'arbres de décision pour permettre à l’investigateur de redéfinir sa population d'étude.