Des comportements flexibles aux comportements habituels : meta-apprentissage neuro-inspiré pour la robotique autonome

Erwan Renaudo

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Erwan Renaudo
Direction :	Raja Chatila, Mehdi Khamassi
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 06/06/2016
Etablissement(s) :	Paris 6
Ecole(s) doctorale(s) :	École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche :	Laboratoire : Institut des systèmes intelligents et de robotique (Paris ; 2009-....)
Jury :	Examinateurs / Examinatrices : Costas Tzafestas, Jacques Malenfant
	Rapporteurs / Rapporteuses : David Filliat, Nicolas Rougier

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage par renforcement (intelligence artificielle)

Robotique

Mots clés libres

Robotique autonome

Architecture de contrôle robotique

Robotique bio-Inspirée

Apprentissage par renforcement

Comportement instrumental

Sélection de l'action

Résumé

FR |

EN

Dans cette thèse, nous proposons d'intégrer la notion d'habitude comportementale au sein d'une architecture de contrôle robotique, et d'étudier son interaction avec les mécanismes générant le comportement planifié. Les architectures de contrôle robotiques permettent à ce dernier d'être utilisé efficacement dans le monde réel et au robot de rester réactif aux changements dans son environnement, tout en étant capable de prendre des décisions pour accomplir des buts à long terme (Kortenkamp et Simmons, 2008). Or, ces architectures sont rarement dotées de capacités d'apprentissage leur permettant d'intégrer les expériences précédentes du robot. En neurosciences et en psychologie, l'étude des différents types d'apprentissage montre pour que ces derniers sont une capacité essentielle pour adapter le comportement des mammifères à des contextes changeants, mais également pour exploiter au mieux les contextes stables (Dickinson, 1985). Ces apprentissages sont modélisés par des algorithmes d'apprentissage par renforcement direct et indirect (Sutton et Barto, 1998), combinés pour exploiter leurs propriétés au mieux en fonction du contexte (Daw et al., 2005). Nous montrons que l'architecture proposée, qui s'inspire de ces modèles du comportement, améliore la robustesse de la performance lors d'un changement de contexte dans une tâche simulée. Si aucune des méthodes de combinaison évaluées ne se démarque des autres, elles permettent d'identifier les contraintes sur le processus de planification. Enfin, l'extension de l'étude de notre architecture à deux tâches (dont l'une sur robot réel) confirme que la combinaison permet l'amélioration de l'apprentissage du robot.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Des comportements flexibles aux comportements habituels : meta-apprentissage neuro-inspiré pour la robotique autonome

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Des comportements flexibles aux comportements habituels : meta-apprentissage neuro-inspiré pour la robotique autonome

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses