Auteur / Autrice : | Mohammed Amine Hamila |
Direction : | René Mandiau, Emmanuelle Grislin, Abdel-Illah Mouaddib |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences et technologie - Informatique |
Date : | Soutenance le 03/04/2012 |
Etablissement(s) : | Valenciennes |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur (Lille) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'automatique, de mécanique et d'informatique industrielles et humaines (Valenciennes, Nord ; 1994-...) |
Pôle de recherche et d'enseignement supérieur (PRES) : Communauté d'universités et d'établissements Lille Nord de France (2009-2013) | |
Jury : | Président / Présidente : Pierre Marquis |
Examinateurs / Examinatrices : René Mandiau, Emmanuelle Grislin, Abdel-Illah Mouaddib, François Charpillet, Amal El Fallah Seghrouchni, Rachid Alami, Abder Koukam | |
Rapporteurs / Rapporteuses : François Charpillet, Amal El Fallah Seghrouchni |
Mots clés
Résumé
Planifier les actions d’un agent dans un environnement dynamique et incertain, a été largement étudié et le cadre des processus décisionnels de Markov offre les outils permettant de modéliser et de résoudre de tels problèmes. Le domaine de la théorie des jeux, a permis l’étude des interactions stratégiques entre plusieurs agents pour un jeu donné. Le cadre des jeux stochastiques, est considéré comme une généralisation du domaine des processus décisionnels de Markov et du champ de la théorie des jeux et permet de modéliser des systèmes ayant plusieurs agents et plusieurs états. Cependant, planifier dans unsystème multi-agents est considéré comme difficile, car la politique d’actions de l’agent dépend non seulement de ses choix mais aussi des politiques des autres agents. Le travail que nous présentons dans cette thèse porte sur la prise de décision distribuée dans les systèmes multi-agents. Les travaux existants dans le domaine, permettent la résolution théorique des jeux stochastiques mais imposent de fortes restrictions et font abstraction de certains problèmes cruciaux du modèle. Nous proposons un algorithme de planification décentralisée pour le modèle des jeux stochastiques, d’une part basé sur l’algorithme Value-Iteration et d’autre part basé sur la notion d’équilibre issue de la résolution des jeux matriciels. Afin d’améliorer le processus de résolution et de traiter des problèmes de taille importante, nous recherchons à faciliter la prise de décision et à limiter les possibilités d’actions à chaque étape d’interaction. L’algorithme que nous avonsproposé, a été validé sur un exemple d’interaction incluant plusieurs agents et différentes expérimentations ont été menées afin d’évaluer la qualité de la solution obtenue.