Thèse soutenue

Apprentissage par le succès et l'échec pour les robots humanoïdes : étude pour la marche bipède

FR  |  
EN
Auteur / Autrice : John Nassour
Direction : Fethi Ben OuezdouGordon Cheng
Type : Thèse de doctorat
Discipline(s) : Ingénierie
Date : Soutenance en 2012
Etablissement(s) : Versailles-St Quentin en Yvelines en cotutelle avec Technische Universität (Munich, Allemagne)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

L’être humain apprend et se développe par des expériences via des interactions continues avec le monde. Actuellement, la compréhension neurologique des mécanismes d'apprentissage est à un niveau où ils peuvent être validés sur des robots. Le cortex cingulaire antérieur (CCA) est impliqué dans le contrôle cognitif en agissant comme un système d'alerte précoce pour l'erreur liée à la prise de risques (vigilance) alors que le cortex orbitofrontal (OFC) joue un rôle dans la boucle de récompense par le codage des résultats régulant ainsi la prise de décision et l’anticipation. Ces mécanismes neuronaux sont sous-jacents dans le développement cognitif et l'apprentissage. En outre il a été montré que des patrons moteurs rythmiques robustes et complexes proviennent de la moelle épinière où siègent les centres générateurs de rythmes (CPG). Cette thèse présente des modèles neuronaux pour l’apprentissage des robots par l’expérience. Basée sur les études du CCA sur l’apprentissage par succès-échecs, une structure utilisant un mécanisme neuronal permettant au robot d'apprendre à partir de ses expériences est présentée. Basé sur l'OFC cet apprentissage a été étendu à la notion de récompense adaptée à l'apprentissage afin d’améliorer les performances du robot. Basé les modèles de CPG un contrôleur bas niveau fournit différents patrons moteurs pour l'apprentissage. L’assemblage de ces modèles permet de valider le principe de l’apprentissage par succès-échecs sur une architecture de CPG pour le robot humanoïde NAO afin qu’il apprenne à marcher dans des conditions variables. Les résultats montrent que le robot est capable d’apprendre, de s'adapter et de compenser certaines perturbations.