Apprentissage de la communication dans un système multi-agents ouvert, asynchrone et faiblement couplé

par Shirley Hoet

Thèse de doctorat en Système Multi-Agents

Sous la direction de Nicolas Sabouret.


  • Résumé

    In a Multi-Agent System (MAS) , direct communication allows agents to exchange information, delegate tasks or negotiate by sending structured messages. In current approaches, it is generally assumed that agents know the content and recipients of the messages it has to send, and the moment in time when it should send it. However, in open and loosely coupled MAS, this hypothesis is no longer valid : agents to not "know" each other and cannot determine in advance what message to send, when and to whom. The goal of this PhD thesis is to define mechanisms for agents to learn how to communicate with other agents, based on their own goals and changes perceived in the system. First, we present an exploration algorithm coupled with a multi-agent protocol that allows agents to build the content of their messages. Second, we present a reinforcement learning mechanism that allows an agent to decide when it must communicate and what message it must send. Our algorithm is based on using a memory in which the agent can store its beliefs and the communication acts it has used. The evaluation ofour learning algorithm showed problems that come from using a general-purpose memory structure. This impacts our learning mechanism by creating a too large set of states for the algorithm to workThat is why we present a new model of memory for communication learning based on storing dates and message answers. Last, we propose a mechanism that allows the agent to build a model of communication acts, i. E. The preconditions it must satisfy to send the message and a description of the expected effects of this message on the system.


  • Résumé

    Dans un système multi-agents, la communication directe permet aux agents, via l’envoi de messages structurés, d’échanger des informations, de déléguer des tâches ou de négocier. Dans les travaux actuels, il est généralement supposé que l’agent connaît la nature des messages qu’il doit envoyer ainsi que le moment où les envoyer. Mais si l’on se place dans les systèmes multi-agents ouverts et faiblement couplés, cette hypothèse n’est plus valide : les agents ne se « connaissant » pas, ils ne peuvent déterminer à l’avance quels messages s’envoyer. L’objectif de cette thèse est par conséquent de définir des mécanismes pour permettre aux agents d’apprendre à communiquer avec les autres agents, en fonction de leurs objectifs et des changements perçus dans le systèmeNous présentons tout d'abord un algorithme d’exploration couplé à un protocole multi-agents permettant à un agent de construire le contenu de ses messages. Ensuite, nous présentons un mécanisme d’apprentissage par renforcement couplé à une mémoire permettant à un agent de déterminer s' il doit ou non communiquer et dans ce cas quel message il doit envoyer. Suite à l’évaluation de notre algorithme d’apprentissage, nous avons mis en évidence des problèmes que nous imputons à l’utilisation d’une mémoire qui n’est pas spécifique à la communication. C'est pourquoi nous proposons un nouveau modèle de mémoire spécifique à l’apprentissage de la communication. Enfin, nous proposons un mécanisme permettant d’extraire le modèle des actes de communication, c’est-à-dire les préconditions et les effets attendus des messages d'un agent. Afin qu'il puisse les utiliser dans de nouveaux contextes

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (188 p.)
  • Annexes : Bibliogr. p. 183-188. 89 réf. bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Université Pierre et Marie Curie. Bibliothèque Universitaire Pierre et Marie Curie . Section Mathématiques-Informatique Recherche.
  • Consultable sur place dans l'établissement demandeur
  • Cote : T Paris 6 2012 511
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.