Problèmes d’inférence non-paramétrique et en grande dimension
Auteur / Autrice : | Julien Chhor |
Direction : | Alexandre B. Tsybakov |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 30/08/2022 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Centre de Recherche en Economie et Statistique (Palaiseau ; 1993-....) |
établissement opérateur d'inscription : École nationale de la statistique et de l'administration économique (Palaiseau ; 1960-....) | |
Jury : | Président / Présidente : Cristina Butucea |
Examinateurs / Examinatrices : Alexandre B. Tsybakov, Cristina Butucea, Béatrice Laurent, Chao Gao, Yannick Baraud, Richard J. Samworth | |
Rapporteurs / Rapporteuses : Béatrice Laurent, Chao Gao |
Mots clés
Résumé
Dans cette thèse, nous traitons les sujets suivants: tests minimax locaux, estimation sous contraintes combinées de robustesse et de confidentialité locale différentielle, estimation adaptative en régression non-paramétrique avec benign overfitting.Nous étudions en premier lieu le problème de test minimax d'adéquation pour des lois discrètes et des lois à densité Hölder-régulières.Le problème consiste à tester l'égalité à une loi connue contre une alternative composée de distributions séparées de l'hypothèse nulle au sens d'une certaine métrique.Nous identifions les vitesses locales non-asymptotiques sur la séparation nécessaire pour assurer l'existence d'un test uniformément consistant et nous donnons leur dépendance précise par rapport à l'hypothèse nulle pour différentes distances de séparation.Nous identifions également les tests locaux optimaux correspondants.Nous étudions le problème d'estimation de lois discrètes avec contrainte de confidentialité differentielle locale en supposant de plus que les données sont issues d'un modèle de contamination adversariale.Nous proposons un algorithme robuste aux outliers et adapté à la confidentialité, dont nous montrons l'optimalité statistique ainsi que l'efficacité en temps de calcul.Enfin, dans le cadre de la régression non-paramétrique, nous utilisons des estimateurs par polynômes locaux avec noyau singulier afin de construire des estimateurs continus, minimax et adaptatifs à la régularité inconnue de la fonction à estimer, et qui interpolent tous les points de données avec grande probabilité - un phenomène connu sous le nom de ``benign overfitting''.