Thèse soutenue

Changement de représentation pour l'inférence contrefactuelle

FR  |  
EN
Auteur / Autrice : Armand Lacombe
Direction : Michèle SebagPhilippe Caillou
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 05/03/2024
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....)
Référent : Université Paris-Saclay. Faculté des sciences d’Orsay (Essonne ; 2020-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….)
Equipe de recherche : TAckling the Underspecified (TAU)
Jury : Président / Présidente : Jean-Pierre Nadal
Examinateurs / Examinatrices : Hervé Isambert, Marianne Clausel, Julie Josse, Éric Gaussier
Rapporteurs / Rapporteuses : Hervé Isambert, Marianne Clausel

Résumé

FR  |  
EN

Quelques éloignées puissent-elles paraître, les notions de prise de décision algorithmique, d’évaluation des politiques publiques ou de personnalisation des soins médicaux reposent sur une même question fondamentale : que se serait-il passé, que se passerait-il si la décision était autre ? Parce que l'apprentissage causal fonde par essence des raisonnements contrefactuels sur les données disponibles, il constitue le cadre théorique et pratique idoine de ces problématiques. Depuis l'introduction d’approches fondées sue des réseaux de neurones, les progrès en inférence causale ont été portés principalement par le raffinement de l'équilibrage entre les représentations apprises des individus contrôle, et traités. Prenant constat des limites de cette approche, nous opérons un changement de paradigme. Des contraintes asymétriques dans l'espace des représentation permettent, au prix de la dégradation de la modélisation factuelle d'une population, l'amélioration de la modélisation contrefactuelle de l'autre. La combinaison d'un modèle favorable à la population traitée avec son pendant relatif à la population contrôle cumule leurs avantages, sans leurs inconvénients. Cette nouvelle architecture est incarnée par Alrite, un modèle dont nous démontrons la pertinence sur un plan théorique, avant de le soumettre à des expériences pratiques. Un soin tout particulier est porté à la sélection rigoureuse de ses hyper-paramètres, tâche réputée délicate dans le domaine de l'inférence causale. Une comparaison favorable avec les modèles concurrents de l'état de l'art confirme finalement le bien-fondé de l'approche.