Thèse soutenue

Apprentissage statistique contre des agents stratégiques et non-stratégiques, avec application à la théorie des enchères

FR  |  
EN
Auteur / Autrice : Thomas Nedelec
Direction : Vianney Perchet
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 17/12/2019
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Centre de mathématiques et de leurs applications (1990-2019 ; Cachan, Val-de-Marne)
établissement opérateur d'inscription : Université Paris-Saclay (2020-....)
Jury : Président / Présidente : Mathilde Mougeot
Examinateurs / Examinatrices : Ludovic Renou, Omar Besbes, Tim Roughgarden, Olivier Gossner, Noureddine El Karoui
Rapporteurs / Rapporteuses : Ludovic Renou, Omar Besbes, Tim Roughgarden

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Le fil directeur de cette thèse est l'étude de mécanismes de décision automatique utilisant des données recueillies en interagissant avec des agents stratégiques ou non-stratégiques. Dans la première partie, nous nous intéressons à l'un des problèmes fondateur de la théorie des mécanismes d'incitation, l'apprentissage de l'enchère maximisant le revenu du vendeur. Cette théorie suppose l'existence d'une distribution de valeur qui permet au vendeur d'optimiser son mécanisme. Pour estimer cette distribution de valeur, les vendeurs utilisent en pratique pour la plupart la distribution des enchères passées des différents acheteurs. En considérant cette hypothèse, nous prouvons qu'il existe des stratégie simples qui permettent aux acheteurs d'augmenter très fortement leur utilité si le vendeur utilise ses enchères passées pour optimiser son mécanisme. Nous commençons par une étude détaillée des principaux résultats de la littérature des enchères. Nous introduisons une forme variationnelle qui permet à la fois de calculer analytiquement des équilibres de Nash mais aussi de mettre en place des méthodes numériques. Nous prouvons que notre approche est robuste par rapport au nombre d'exemples accessibles au vendeur et à une connaissance partielle de la distribution de la compétition. Notre approche numérique nous permet de considérer d'autres configurations plus complexes comme les enchères simultanées de plusieurs objets. Nos travaux sont une nouvelle contribution à l'ensemble des recherches récentes qui s'intéressent à comment certains résultats à la frontière entre la théorie des jeux et l'économie doivent être repensés au moment où des algorithmes d'apprentissage statistique sont utilisés pour exploiter la masse de données disponibles sur la plupart des grandes plateformes internet. Dans la seconde partie, indépendante de la première, nous nous intéressons à ce qu'il est possible de faire pour un agent qui a accès à des données qui n'ont pas été manipulées par un agent stratégique, comme dans un essai clinique par exemple. Nous introduisons un nouvel algorithme qui permet d'arbitrer entre la longueur et le coût d'un A/B test ou de toute expérimentation statistique. Lorsque l'expérimentateur a accès à des données récoltées de façon aléatoire, il est aussi capable de faire des raisonnements contrefactuels. Nous étudions les différents estimateurs qui permettent de faire ce type de raisonnement et proposons un nouvel estimateur plus adapté à l'étude des systèmes de recommandations. Cette seconde partie se concentre sur certains des principaux outils statistiques aujourd'hui utilisés pour mettre en place des systèmes automatisés de prises de décisions.