Thèse soutenue

Apport du couplage entre dynamique d’apprentissage et propriétés collectives dans l’optimisation multi-contraintes par un système multi-agents et multi-robots

FR  |  
EN
Auteur / Autrice : Abdelhak Chatty
Direction : Philippe GaussierMohamed Adel Alimi
Type : Thèse de doctorat
Discipline(s) : STIC (sciences et technologies de l'information et de la communication) - Cergy
Date : Soutenance le 30/06/2014
Etablissement(s) : Cergy-Pontoise en cotutelle avec École nationale d'ingénieurs de Sfax (Tunisie)
Ecole(s) doctorale(s) : École doctorale Sciences et ingénierie (Cergy-Pontoise, Val d'Oise)
Partenaire(s) de recherche : Laboratoire : Equipes Traitement de l'Information et Systèmes (Cergy-Pontoise, Val d'Oise)
Jury : Président / Présidente : Rachid Alami
Examinateurs / Examinatrices : Mohamed Adel Alimi, Guy Théraulaz
Rapporteurs / Rapporteuses : François Charpillet, Nicolas Bredèche, Khaled Ghédira

Résumé

FR  |  
EN

Dans ce travail, nous proposons un système auto-organisé composé d'agents-robots contrôlés par une architecture de subsomption et des règles locales probabilistes de prises et de dépôts. Ces agents-robots sont capables, grâce au développement de leurs capacités cognitives de se créer une carte cognitive, d'apprendre plusieurs lieux buts et de planifier le retour vers ces buts. Bien que formellement l'algorithme ne permette pas à chaque agent de "mélanger ni de fusionner ou d'optimiser" plusieurs objectifs, nous montrerons que le système global est capable de réaliser une optimisation multi-objectifs. Particulièrement, la fusion de l'apprentissage local avec l'accumulation de décisions individuelles permet de faire émerger (i) des structures dans l'environnement et (ii) des dynamiques tel que le comportement de spécialisation ou les comportements que nous pouvons considérer comme étant "égoïstes" ou "altruistes". Nous montrons qu'un mécanisme d'imitation simple contribue à l'amélioration des performance de notre SMAC et de notre SMRC, à savoir l'optimisation de la durée pour découvrir des différentes ressources, le temps moyen de planification, le niveau global de satisfaction des agents et enfin le temps moyen de convergence vers une solution stable. Particulièrement, l'ajout d'une capacité d'imitation améliore la construction des cartes cognitives pour chaque agent et stimule le partage implicite des informations dans un environnement a priori inconnu. En effet, les découvertes individuelles peuvent avoir un effet au plan social et donc inclure l'apprentissage de nouveaux comportements au niveau individuel. Pour finir, nous comparons les propriétés émergentes de notre SMAC à un modèle mathématique basé sur la programmation linéaire (PL). Cette évaluation montre les bonnes performances de notre SMAC qui permet d'avoir des solutions proches des solutions de la PL pour un coût de calcul réduit. Dans une dernière série d'expériences, nous étudions notre système d'agrégation dans un environnement réel. Nous mettons en place un SMRC, composé par des robots qui sont capables d'effectuer les opérations de prise, de dépôt et de maintien. Nous montrons via les premiers tests d'agrégation que les résultats sont prometteurs.