Thèse soutenue

Stratégies à mémoire finie dans les jeux concurrents à deux joueurs

FR  |  
EN
Auteur / Autrice : Nathan Thomasset
Direction : Patricia Bouyer-DecitreStéphane Le Roux
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 21/12/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Méthodes formelles (Gif-sur-Yvette, Essonne ; 2021-....)
Référent : École normale supérieure Paris-Saclay (Gif-sur-Yvette, Essonne ; 1912-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….)
Jury : Président / Présidente : Johanne Cohen
Examinateurs / Examinatrices : Jacques Duparc, Nathanaël Fijalkow, Arnaud Durand, Nathalie Bertrand, Philippe Schnoebelen
Rapporteurs / Rapporteuses : Jacques Duparc, Nathanaël Fijalkow

Résumé

FR  |  
EN

On étudie des jeux concurrents à deux joueurs de durée infinie qui se jouent de la façon suivante : chaque tour, les deux joueurs choisissent chacun une action sans connaître le choix actuel de l'adversaire. Sur un nombre de tours infini, cette procédure génère une suite infinie de paires d'actions. Cette suite est alors gagnante pour le Joueur 1 si elle appartient à l'ensemble gagnant du jeu. On nomme histoire une suite finie de paires d'actions, qui décrit ce que les Joueurs ont joué après un temps fini, et stratégie (du Joueur 1) une fonction qui associe à chaque histoire une distribution de probabilité sur les actions du Joueur 1. Une stratégie décrit un comportement du joueur. Ce modèle de jeu diffère de celui des jeux sur graphes, plus communément étudié par la communauté de la théorie des jeux pour l'informatique. Toutefois, on établit des relations entre les deux modèles qui permettent d'appliquer nos résultats aux jeux sur graphe. Le modèle étudié ici est dit concurrent, par opposition aux modèles de jeux à tours dans lesquels les joueurs jouent l'un après l'autre. Dans les jeux concurrents, contrairement aux jeux à tours boréliens, il n'est pas garanti qu'un des deux joueurs ait une façon de jouer qui lui assure de gagner. On étudie différents types de stratégies souhaitables : les stratégies gagnantes, gagnantes presque sûrement, optimales, et quasi-optimales. Seules les stratégies quasi-optimales existent dans tous les jeux. Toutefois, ces stratégies souhaitables peuvent être très complexes. L'existence de stratégies qui sont à la fois souhaitables et simples est une question récurrente de la théorie des jeux pour l'informatique. Une interprétation standard de stratégies simples est celle des stratégies à mémoire finie, qui peuvent être représentées comme des machines à états finis. On cherche à montrer des résultats de transfert de la forme suivante : étant données certaines hypothèses sur l'ensemble gagnant, si le Joueur 1 a une stratégie gagnante, gagnante presque sûrement, ou optimale, alors il en a une à mémoire finie. Une hypothèse clé à laquelle on s'intéresse est la condition de bel ordre, qui se rapporte aux ensembles gagnants résiduels. Cette condition est satisfaite par des objectifs classiques de la littérature sur les jeux sur des graphes finis, comme les jeux d'énergie ou les jeux avec un objectif ω-régulier. De plus, on montre via des contre-exemples que cette hypothèse est ''presque nécessaire'' pour les résultats de transfert. Pour décrire les ensembles gagnants considérés, on utilise à la fois des éléments de la théorie descriptive des ensembles et de la théorie des jeux. En particulier, on utilise la hiérarchie des différences d'ouverts de Hausdorff, qui décrit les ensembles dans Δ⁰₂. On introduit une nouvelle opération sur les ensembles inspirée de cette hiérarchie, que l'on appelle l'interfoliage. En utilisant cette opération, on introduit deux nouvelles classes d'ensembles : les interfoliages d'ensembles Büchi-réguliers, qui sont une sous-classe de ∏⁰₂, et les interfoliages à bassin fini d'ensembles ω-réguliers, qui sont une sous-classe de Δ⁰₃ qui contient les langages ω-réguliers. Ces deux nouvelles classes contiennent la classe Δ⁰₂, mais sont incomparables l'une avec l'autre du fait de la restriction aux bassins finis. On montre des résultats de transfert pour des jeux dont l'ensemble gagnant satisfait la condition de bel ordre et appartient à l'une des trois classes suivantes : Δ⁰₂, les interfoliages d'ensembles Büchi-réguliers, et les interfoliages à bassin fini d'ensembles ω-réguliers. Plus précisément, on se penche sur les stratégies optimales et quasi-optimales pour les ensembles dans Δ⁰₂, sur les stratégies gagnantes et gagnantes presque sûrement pour les interfoliages d'ensembles Büchi-réguliers, et sur les stratégies gagnantes pour les interfoliages à bassin fini d'ensembles ω-réguliers.