Méthodes évolutionnaires & apprentissage : apprentissage par imitation dans le cadre des systèmes de classeurs

par Marc Métivier

Thèse de doctorat en Informatique

Sous la direction de Norbert Cot.

Soutenue en 2004

à Paris 5 .


  • Résumé

    Dans cette thèse, nous étudions les moyens de mise en oeuvre d'un processus d'apprentissage par imitation permettant d'aider l'apprentissage par renforcement dans le cadre des systèmes de classeurs. Il s'agit de systèmes à base de règles utilisant des méthodes d'exploration évolutionnaires. Nous présentons quatre approches de la prise en compte d'un comportement observé : deux avec un modèle du mentor, et deux sans modèle. Ces approches sont évaluées et comparées dans différents environnements lorsqu'elles sont appliquées à trois systèmes de classeurs majeurs : ZCS pour les systèmes basés sur la force, XCS pour les systèmes basés sur la précision et ACS pour les systèmes basés sur l'anticipation. Les résultats obtenus sont analysés et discutés. Ils permettent, en particulier, de mettre en évidence l'importance de la modélisation du mentor pour une imitation efficace et de montrer les avantages de la prise en compte de cette modélisation par l'augmentation d'action.


  • Résumé

    In this thesis, we study the means of developing an imitation learning process allowing to improve reinforcement learning in the framework of learning classifier systems. Learning classifier systems are rule-based systems using evolutionary methods of exploration as genetic algorithms. We present four approaches of the taking into account of an observed behavior : two approaches using a mentor model, and two other one without modelling. These approaches are evaluated and compared in different environments when they are applied to three major classifier systems : ZCS for the strength-based systems, XCS for the accuracy-based systems, and ACS for the anticipatory classifier systems. Obtained results are analyzed and discussed. They highlight the importance of using a model of the mentor to enable an efficient imitation, and they show the advantages of taking this model into account through action augmentation.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (181 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 173-181

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris Descartes-Bibliothèque Saints-Pères Sciences (Paris). Service commun de la documentation. Bibliothèque Saints-Pères Sciences.
  • Consultable sur place dans l'établissement demandeur
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.