Une double approche modulaire de l'apprentissage par renforcement pour des agents intelligents adaptatifs

par Olivier Bernard Henri Buffet

Thèse de doctorat en Informatique

Sous la direction de François Charpillet.

Soutenue en 2003

à Nancy 1 , en partenariat avec Université Henri Poincaré Nancy 1. Faculté des sciences et techniques (autre partenaire) .


  • Résumé

    Cette thèse s'est intéressée à deux domaines de l'intelligence artificielle : d'une part l'apprentissage par renforcement (A/R), et d'autre part les systèmes multi-agents (SMA). Le premier permet de concevoir des agents (entités intelligentes) en se basant sur un signal de renforcement qui récompense les décisions menant au but fixé, alors que le second concerne l'intelligence qui peut venir de l'interaction d'un groupe d'entités (dans la perspective que le tout soit plus que la somme de ses parties). Chacun de ces deux outils souffre de diverses difficultés d'emploi. Le travail que nous avons mene�� a permis de montrer comment chacun des deux outils peut servir à l'autre pour répondre à certains de ces problèmes. On a ainsi conçu les agents d'un SMA par A/R, et organisé l'architecture d'un agent apprenant par renforcement sous la forme d'un SMA. Ces deux outils se sont avérés très complémentaires, et notre approche globale d'une conception ``progressive'' a prouvé son efficacité.


  • Résumé

    These PhD thesis has been interested in two fields of artificial intelligence: reinforcement learning (RL) on the one hand, and multi-agent systems (MAS) on the other hand. The former allows for the conception of agents (intelligent entities) based on a reinforcement signal which rewards decisions leading to the specified goal, whereas the latter is concerned with the intelligence that can result from the interaction of a group of entities (in the perspective that the whole is more than the sum of its parts). Both these tools suffer from various difficulties. The work we accomplished has shown how these tools can serve each other to answer some of these problems. Thus, agents of a MAS have been conceived through RL, and the architecture of a reinforcement learning agent has been designed as a MAS. Both tools appear to be very complementary, and our global approach of a ``progresssive'' design has proved its efficiency.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol.(XX-218 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 207-216

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation et de l'Edition - BU Sciences et Techniques.
  • Disponible pour le PEB
  • Cote : SC N2003 108
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.