Apprentissage de compétences robotiques complexes à partir de démonstrations humaines

par Robin Strudel

Projet de thèse en Informatique

Sous la direction de Ivan Laptev, Josef Sivic et de Cordelia Schmid.

Thèses en préparation à Paris Sciences et Lettres , dans le cadre de École doctorale Sciences mathématiques de Paris centre (Paris) , en partenariat avec DIENS - Département d'informatique de l'École normale supérieure (laboratoire) et de École normale supérieure (Paris ; 1985-....) (établissement de préparation de la thèse) depuis le 01-09-2018 .


  • Résumé

    Le domaine de la en vision par ordinateur a connu de grandes avancées récemment grâce à l'apprentissage profond de représentations visuelles pour la classification d'image, la détection d'objects et une multitude d'autres taches visuelles. Un des conecpts fondateurs qui a permis ces avancées est l'apprentissage supervisé à partir de base de donneés d'images annotées à grand échelle. Inspirés par ces succès en vision par ordinateur, nous croyons que l'apprentissage supervisé présente un grand potentiel en robotique. Apprendre des représentations visuelles spécifiques à la réalisation de taches robotiques comme la préhension et l'assemblage à l'aide d'une caméra devraient améliorer les performances et la capacité de généralisation des robots actuels. L'objectif scientifique de cette thèse est donc de développer des modèles et des méthodes permettant d'apprendre des compétences robotiques complexes à l'aide de grandes bases de données d'entrainement et de démonstrations humaines.

  • Titre traduit

    Learning complex robot skills from human demonstrations


  • Résumé

    Computer vision has recently evolved and shown significant improvements by the end-to-end learn- ing of visual representations for image classification object detection and many other visual tasks. One major factor enabling this progress has been supervised learning from large-scale annotated image data. Inspired by the success of visual recognition, we believe large-scale training data and supervised end-to-end learning schemes hold much potential for robotics. Learning visual representations specifically for robotics tasks such as grasping and assembling together with robot commands while using images as raw input data, is expected to significantly improve the performance and generalization abilities of today's robots. The scientific objective of this thesis is, hence, to develop models and methods for learning complex skills from large-scale training data and human demonstrations.