Thèse soutenue

Planification multi-agents dans un cadre markovien : les jeux stochastiques à somme générale
FR
Accès à la thèse
Auteur / Autrice : Mohammed Amine Hamila
Direction : René MandiauEmmanuelle GrislinAbdel-Illah Mouaddib
Type : Thèse de doctorat
Discipline(s) : Sciences et technologie - Informatique
Date : Soutenance le 03/04/2012
Etablissement(s) : Valenciennes
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur (Lille)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'automatique, de mécanique et d'informatique industrielles et humaines (Valenciennes, Nord ; 1994-...)
Pôle de recherche et d'enseignement supérieur (PRES) : Communauté d'universités et d'établissements Lille Nord de France (2009-2013)
Jury : Président / Présidente : Pierre Marquis
Examinateurs / Examinatrices : René Mandiau, Emmanuelle Grislin, Abdel-Illah Mouaddib, François Charpillet, Amal El Fallah Seghrouchni, Rachid Alami, Abder Koukam
Rapporteurs / Rapporteuses : François Charpillet, Amal El Fallah Seghrouchni

Résumé

FR  |  
EN

Planifier les actions d’un agent dans un environnement dynamique et incertain, a été largement étudié et le cadre des processus décisionnels de Markov offre les outils permettant de modéliser et de résoudre de tels problèmes. Le domaine de la théorie des jeux, a permis l’étude des interactions stratégiques entre plusieurs agents pour un jeu donné. Le cadre des jeux stochastiques, est considéré comme une généralisation du domaine des processus décisionnels de Markov et du champ de la théorie des jeux et permet de modéliser des systèmes ayant plusieurs agents et plusieurs états. Cependant, planifier dans unsystème multi-agents est considéré comme difficile, car la politique d’actions de l’agent dépend non seulement de ses choix mais aussi des politiques des autres agents. Le travail que nous présentons dans cette thèse porte sur la prise de décision distribuée dans les systèmes multi-agents. Les travaux existants dans le domaine, permettent la résolution théorique des jeux stochastiques mais imposent de fortes restrictions et font abstraction de certains problèmes cruciaux du modèle. Nous proposons un algorithme de planification décentralisée pour le modèle des jeux stochastiques, d’une part basé sur l’algorithme Value-Iteration et d’autre part basé sur la notion d’équilibre issue de la résolution des jeux matriciels. Afin d’améliorer le processus de résolution et de traiter des problèmes de taille importante, nous recherchons à faciliter la prise de décision et à limiter les possibilités d’actions à chaque étape d’interaction. L’algorithme que nous avonsproposé, a été validé sur un exemple d’interaction incluant plusieurs agents et différentes expérimentations ont été menées afin d’évaluer la qualité de la solution obtenue.