Apprentissage robuste au transfert, avec application en physique des hautes énergies

par Victor Estrade

Projet de thèse en Informatique

Sous la direction de Cécile Germain-renaud et de Isabelle Guyon.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec LRI - Laboratoire de Recherche en Informatique (laboratoire) , A&O - Apprentissage et Optimisation (equipe de recherche) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2016 .


  • Résumé

    Le but principal de cette thèse est de faire progresser les méthodes d'adaptation de domaine pour la quantification et la calibration des incertitudes en sciences expérimentales, avec application à des expériences de physique des hautes énergies (High Energy Physics, HEP). Du point de vue de l'apprentissage statistique (Machine Learning, ML), la cali- bration est un cas particulier du transfer learning et de l'adaptation de domaine. Pour le moment, seules des fonctions d'objectif classiques ont été appliquées à l'adaptation de domaine comme critère de performance. Or l'apprentissage dans certains contextes de découverte scientifique repose sur des critères plus généraux et plus exigeants, reliés à l'aire sous la courbe de ROC (AUC) et à l'apprentissage de Neymann-Pearson. Les objectifs de ce thèse sont : la conception de classifieurs qui minimisent efficacement la combinaison des erreurs systématiques et statistiques ; et l'optimisation du modèle génératif du processus de calibration, qui relève directement de l'apprentissage adversarial. Les deux objectifs impliquent une formalisation basée sur la théorie de transport optimal. Les résultats démontrés des collaborations interdisciplinaires (ML + HEP) conduites par les directeurs de thèse assurent un impact très significatif de cette recherche sur l'analyse des expériences du Large Hadron Collider (LHC) au CERN.

  • Titre traduit

    Robust domain-adversarial learning, with applications to High Energy Physics


  • Résumé

    The overall goal of the PhD is to advance domain adaptation methods for uncertainty quantification and calibration in experimental discovery, with applications to High Energy Physics (HEP) experiments. In the machine learning (ML) perspective, calibration is a case of transfer learning and domain adaptation. So far, domain adaptation has been ad- dressed only with classical objectives functions as performance criteria. Learning to discover relies on more global and difficult criteria, related to the Area Under Roc Curve (AUC) and Neymann-Pearson learning. The specific goals of the PhD are : the design of robust bias-aware classifiers, which should efficiently minimize the compound systematic and statistical errors ; and the optimization of the generative model of the calibration process, which can be addressed through adversarial learning. Both designs will involve a formalization based on the theory of optimal transport. The proven results of the interdisciplinary (ML+HEP) collaborations led by the PhD advisors ensure a very significant impact of this work on the analysis the Large Hadron Collider (LHC) experiments at CERN.