Apport du couplage entre dynamique d’apprentissage et propriétés collectives dans l’optimisation multi-contraintes par un système multi-agents et multi-robots

par Abdelhak Chatty

Thèse de doctorat en STIC (sciences et technologies de l'information et de la communication) - Cergy

Sous la direction de Philippe Gaussier et de Mohamed Adel Alimi.

Le président du jury était Rachid Alami.

Le jury était composé de Mohamed Adel Alimi, Guy Théraulaz.

Les rapporteurs étaient François Charpillet, Nicolas Bredèche, Khaled Ghédira.


  • Résumé

    Dans ce travail, nous proposons un système auto-organisé composé d'agents-robots contrôlés par une architecture de subsomption et des règles locales probabilistes de prises et de dépôts. Ces agents-robots sont capables, grâce au développement de leurs capacités cognitives de se créer une carte cognitive, d'apprendre plusieurs lieux buts et de planifier le retour vers ces buts. Bien que formellement l'algorithme ne permette pas à chaque agent de "mélanger ni de fusionner ou d'optimiser" plusieurs objectifs, nous montrerons que le système global est capable de réaliser une optimisation multi-objectifs. Particulièrement, la fusion de l'apprentissage local avec l'accumulation de décisions individuelles permet de faire émerger (i) des structures dans l'environnement et (ii) des dynamiques tel que le comportement de spécialisation ou les comportements que nous pouvons considérer comme étant "égoïstes" ou "altruistes". Nous montrons qu'un mécanisme d'imitation simple contribue à l'amélioration des performance de notre SMAC et de notre SMRC, à savoir l'optimisation de la durée pour découvrir des différentes ressources, le temps moyen de planification, le niveau global de satisfaction des agents et enfin le temps moyen de convergence vers une solution stable. Particulièrement, l'ajout d'une capacité d'imitation améliore la construction des cartes cognitives pour chaque agent et stimule le partage implicite des informations dans un environnement a priori inconnu. En effet, les découvertes individuelles peuvent avoir un effet au plan social et donc inclure l'apprentissage de nouveaux comportements au niveau individuel. Pour finir, nous comparons les propriétés émergentes de notre SMAC à un modèle mathématique basé sur la programmation linéaire (PL). Cette évaluation montre les bonnes performances de notre SMAC qui permet d'avoir des solutions proches des solutions de la PL pour un coût de calcul réduit. Dans une dernière série d'expériences, nous étudions notre système d'agrégation dans un environnement réel. Nous mettons en place un SMRC, composé par des robots qui sont capables d'effectuer les opérations de prise, de dépôt et de maintien. Nous montrons via les premiers tests d'agrégation que les résultats sont prometteurs.

  • Titre traduit

    Contribution of the coupling between dynamic learning and collective properties in a multi-constraints optimizations by a multi-agent system and multi-robots


  • Résumé

    In this work, we propose a self-organized system composed by agents-robots, controlled by a subsumption architecture with probabilistic local rules of deposits and taking. These agents-robots are able, thanks to the development of their cognitive abilities to create a cognitive map, to learn various goals' locations and to plan the return to these goals. Although formally the algorithm does not allow each agent to « mix or merge or optimize » several objectives, we show that the overall system is able to perform a multi-objective optimization. Specifically, the fusion of local learning with the accumulation of the individual decisions allows to emerge (i) structures in the environment and (ii) several dynamics such as specialization behavior or those that we can consider as « selfish » or « altruistic ». We show that the imitation strategy contributes to the improvement of the performance of our SMAC and our SMRC, namely the optimization of time to explore the various resources, the average planning time, the overall satisfaction level of agents and finally the the average time of convergence to a stable solution. Specifically, the addition of an imitation ability improves the construction of cognitive maps for each agent and stimulates the implicit sharing of informations in an unknown environment. Indeed, individual discoveries can affect the social level and therefore include learning new behaviors at the individual level. Finally, we compare the emergent properties of our SMAC with a mathematical model based on linear programming (LP). This evaluation shows the good performance of our SMAC which allows to obtain solutions close to the solution of the PL for a low cost of computation. In a final series of experiments, we study our aggregation system in a real environment. We set up a SMRC, composed by robots that are able to perform taking operations, deposits operations and refueling operations. We show through the first tests of aggregation that the results are promising.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université de Cergy-Pontoise. Service commune de la documentation. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.