Thèse soutenue

Du rôle des Actions et de l'Apprentissage Automatique dans la Perception des Agents Artificiels.

FR  |  
EN
Auteur / Autrice : Hugo Caselles-Dupré
Direction : David Filliat
Type : Thèse de doctorat
Discipline(s) : Informatique, données, IA
Date : Soutenance le 10/06/2021
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche : Laboratoire : École nationale supérieure de techniques avancées (Palaiseau). Unité d'Informatique et d'Ingénierie des Systèmes
Jury : Président / Présidente : Olivier Sigaud
Examinateurs / Examinatrices : Alessandro Lazaric, Irina Higgins
Rapporteurs / Rapporteuses : Sylvain Argentieri, Jean-Baptiste Mouret

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L'automatisation est le moyen par lequel l'espèce humaine peut se libérer du fardeau des tâches qu'elle a déjà résolues. Ces tâches sont omniprésentes dans notre vie quotidienne, à la maison ou dans un contexte professionnel. Une grande ambition dans la recherche est de créer des agents capables d'agir et de raisonner dans le monde réel, en automatisant ces tâches résolues. Pour cela, nous supposons les agents doivent construire une perception de leur environnement, tout comme les humains.La programmation directe de ces agents est impossible en raison de la complexité du monde et de ses interaction. C'est pourquoi les approches fondées sur l'apprentissage ont prévalu dans la recherche au cours des 20 dernières années. Alors que l'apprentissage supervisé des algorithmes utilisant des données étiquetées a fourni de nombreuses applications utiles, avoir des agents qui perçoivent le monde aussi bien que des agents biologiques exigerait des quantités prohibitives de données étiquetées. La recherche a ainsi opté pour des approches non supervisées ou faiblement supervisées pour construire des algorithmes qui apprennent à partir des données et peuvent ensuite être intégrés dans de vrais robots qui résolvent des tâches dans le monde réel.Ainsi, parmi les approches d'apprentissage automatique, nous avons plusieurs sous-domaines qui abordent chacun différents aspects de la perception que les agents devraient avoir. L'apprentissage de répresentations d'états (ARE) se concentre sur l'apprentissage des représentations de l'expérience des agents. Le ARE essaie d'imiter la capacité des humains à résumer des scènes complexes en objets et concepts de composition. L'apprentissage continu vise à résoudre le célèbre problème d'oubli catastrophique des réseaux de neurones, qui oublient tout ce qu'ils ont appris lorsque de nouvelles données leur sont présentées. Les humains ne souffrent pas de ce problème car nous avons une mémoire et des mécanismes d'oubli sélectifs qui permettent d'apprendre continuellement tout au long de notre vie. Nous avons enfin l'apprentissage par renforcement, qui vise à apprendre à résoudre une tâche en maximisant la récompense qui lui est associée, mécanisme qui est également présent chez les agents biologiques.D'un autre côté, nous avons aussi des approches plus originales qui n'ont pas forcément les mêmes performances mais reposent sur des paradigmes prometteurs qui pourraient permettre des progrès de recherche. La robotique développementale est un sous-domaine de la robotique qui vise à développer des méthodes d'apprentissage inspirées de la biologie sur de vrais robots. Nous avons aussi ce que nous appellerons dans ce manuscrit les approches de l'agent incarné, qui sont des considérations théoriques et pratiques basées sur les théories de la perception développées en psychologie, philosophie et sciences cognitives. Dans ces théories, le rôle des actions est crucial dans le développement de la perception. Nous utiliserons cela comme base pour la plupart de nos contributions.Dans cette thèse, nous contribuons à ces sous-domaines de recherche en développant des connaissances théoriques et des algorithmes d'application qui visent à créer des agents avec des niveaux plus profonds de perception de leur corps et de l'environnement. Plus précisément, nous développons deux approches novatrices pour l'apprentissage de représentation d'états et l'apprentissage continu avec des applications à de vrais robots. Nous étendons une théorie sur la désintrication pour l'apprentissage de représentation, en montrant le rôle crucial des actions dans l'apprentissage. Nous proposons enfin un nouveau mécanisme d'apprentissage des agents incarnés basé sur la commutativité sensorielle des séquences d'action: nous nous inspirons des théories sur la perception et développons des connaissances théoriques ainsi que des algorithmes d'apprentissage pour la détection d'objets et la découverte du corps.