Contrôle distribué et théorie des jeux : application aux systèmes auto-optimisants

par Stéphane Durand

Thèse de doctorat en Mathématiques et Informatique

Sous la direction de Bruno Gaujal.

Thèses en préparation à Grenoble Alpes , dans le cadre de École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble) , en partenariat avec Laboratoire d'Informatique de Grenoble (laboratoire) .


  • Résumé

    Dans le contexte de la théorie des jeux, les équilibres de Nash, ie les états dans lesquels aucun joueur ne peut augmenter son utilité en changeant sa stratégie unilatéralement, sont une des formes principales de solutions des jeux. Ils sont les états les plus probables rencontrés lors de l'évolution des systèmes, des points de stabilité, et sont l'objet de nombreuse propriétés utiles ( le prix de l'anarchie bornant la distance à un optimum du jeu, par exemple). La classe des jeux de potentiels est une large sous classe des jeux incluant entre autre tous les jeux de congestions, et permettant de modéliser un grand nombre de problèmes. dans cette classe, il est difficile de trouver un équilibre de Nash: ce problème est PLS -complet, PLS étant une classe de complexité située entre P et NP. La dynamique de meilleure réponse, un algorithme glouton assez simple utilisé initialement comme outil de preuve pour montrer l'existence d'équilibre de Nash dans tous jeux, admet une complexité en pire cas exponentielle en le nombre de joueurs. En conséquence, cette dynamique n'est pas considérée un outil efficace pour obtenir un équilibre. Dans cette thèse, nous allons montrer que cet algorithme est efficace et robuste, selon le critère de l'analyse en moyenne. Dans le cas le plus simple, on obtient une borne linéaire sur le temps moyen avant convergence, a l'aide d'une approximation par une chaîne de Markov qui peut être résolue analytiquement. Cette approche montre que la dynamique de meilleure réponse reste efficace pour des conditions d'utilisation beaucoup plus générales. Cela inclus les systèmes distribués (des joueurs indépendants, chacun ayant peu de connaissances sur les états des autres) avec une borne en O(n log n), ainsi que les systèmes dans lesquels les joueurs ne connaissent pas leurs utilités avec une borne du même ordre. Cette approche montre également comment profiter d'une structure de type réseau pour obtenir une complexité fonction du nombre de voisins au lieu du nombre de joueurs .

  • Titre traduit

    Coupling Distributed Control and Game Theory: Application to Self-Optimizing Systems


  • Résumé

    In game theory, Nash equilibria, the states where no players can gain by unilaterally changing their strategy, are one of the main notions of solution of the games. nash equilibria are the most likely states at equilibrium, they are also stable and in many context they have properties guaranteeing being near the optimums. We focus on potential games, a subclass of the gameswhich include among other all congestion games and routing games. Even restricted on the class of potential games, finding a Nash equilibrium is difficult. This problem is in fact PLS-complete, which is a class between P and NP. Best response dynamics, are a greedy algorithm, which were first devised as a tool for proving existence of a Nash equilibrium. Their worst-case complexity is exponential with respect to the number of players. they were also though to need their players acting strictly one after the others to ensure convergence. as such they do not appears as an efficient algorithm for actually computing an equilibrium. However, in this thesis we will show that the condition to ensure convergence is more permissive than separates players, and that this algorithm is efficient when considered through average complexity: When averaging over the set of all potential games, we can obtain a linear bound on the basic version. In order to obtain this result, we apply a Markovian approximation allowing us to solve the system analytically. This approach also shows that the best response dynamics are robust, they stay efficient under much wider conditions of application. This include distributed system, with independent actors with little knowledge of each other, with a bound in O(n log n). It can also take into account instances where players do not know their utilities, getting a similar bound. This approach also shows how to benefit from a network structure on the game to get a complexity based on the number of neighbors of the players instead of the number of players.