Learning behaviours aligned with moral values in a multi-agent system : guiding reinforcement learning with symbolic judgments | Theses.fr

Rémy Chaput

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Apprentissage de comportements alignés sur des valeurs morales dans un système multi-agent : guider l'apprentissage par renforcement avec des jugements symboliques

FR |

EN

Auteur / Autrice :	Rémy Chaput
Direction :	Salima Hassas, Olivier Boissier, Mathieu Guillermin
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 27/10/2022
Etablissement(s) :	Lyon 1
Ecole(s) doctorale(s) :	École doctorale en Informatique et Mathématiques de Lyon (2009-....)
Partenaire(s) de recherche :	Laboratoire : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Rhône ; 2003-....)
Jury :	Président / Présidente : Parisa Shariat Ghodous
	Examinateurs / Examinatrices : Salima Hassas, Olivier Boissier, Mathieu Guillermin, Grégory Bonnet, Marija Slavkovik, Alain Dutech, Juan Antonio Rodríguez-Aguilar
	Rapporteurs / Rapporteuses : Grégory Bonnet, Marija Slavkovik

Mots clés

FR |

EN

Mots clés contrôlés

Choix moral

Aspect moral

Intelligence artificielle

Apprentissage par renforcement (intelligence artificielle)

Intelligence artificielle répartie

Mots clés libres

Éthique computationnelle

Agents moraux artificiels

Systèmes multi-agent

Apprentissage par renforcement multi-agent

Apprentissage par renforcement multi-objectif

Apprentissage hybride neuro-symbolique

Dilemmes moraux

Préférences humaines

Résumé

FR |

EN

Les précédentes décennies ont vu un immense progrès des techniques d’Intelligence Artiﬁcielle, dans de nombreux domaines, allant jusqu’à atteindre, voire dépasser, les per-formances humaines dans certains d’entre eux. Cela a mené des systèmes informatiques équipés de telles techniques d’IA à quitter les environnements contraints et artiﬁciels des laboratoires, pour être déployés dans notre monde et notre société humaine, aﬁn de résoudre des tâches ayant un impact bien réel. Ces systèmes ont une inﬂuence plus ou moins directe sur des humains, que ce soit leur vie pour les cas les plus extrêmes, ou de manière plus subtile, mais plus ubiquitaire, leur quotidien. Des questions se posent ainsi quant à leur capacité d’agir en accord avec les valeurs (morales) qui nous semblent importantes. Divers champs de recherche se sont intéressés à des aspects de ce problème, tels que la capacité à fournir des décisions équitables et justes, ou encore la capacité à être intelligible, et ainsi fournir aux utilisateurs humains des raisons d’accorder leur conﬁance, et de savoir quand ne pas l’accorder. Dans cette thèse, nous nous concentrons particulièrement sur le domaine des Machine Ethics, qui consiste à produire des systèmes ayant les moyens d’intégrer des considérations éthiques, c’est-à-dire des systèmes ayant une prise de décision éthique, en accord avec les valeurs humaines qui sont importantes à la société. Notre but est ainsi de proposer des systèmes, qui soient capables d’apprendre à exhiber des comportements jugés comme éthiques par les humains, à la fois dans des situations ayant des enjeux éthiques non en conﬂit, mais aussi dans les cas plus complexes de dilemmes entre les valeurs morales. Nous proposons 3 contributions, chacune ayant un objectif différent, pouvant être prises indépendamment les unes des autres, mais ayant été conçues pour s’associer aﬁn de combiner leurs avantages, et de répondre à la problématique globale. Premièrement, nous proposons un algorithme d’apprentissage par renforcement, capable d’apprendre à exhiber des comportements intégrant ces considérations éthiques à partir d’une fonction de récompense. Le but est ainsi d’apprendre ces enjeux éthiques dans de nombreuses situations, au ﬁl du temps. Un cadre multi-agent est utilisé, ce qui augmente d’une part la richesse de l’environnement, et d’autre part offre une simulation plus réaliste, plus proche de notre société humaine, intrinsèquement multi-agent, et dans laquelle ces approches sont vouées à être déployées. Nous nous intéressons particulièrement à la question de l’adaptation des agents aux changements, à la fois aux dynamiques de l’environnement, tels que les changements saisonniers, mais aussi aux variations dans les mœurs éthiques couramment acceptées par la société. Notre deuxième contribution se concentre sur la conception de la fonction de récompense, aﬁn de guider l’apprentissage. Nous proposons l’intégration d’agents juges, se basant sur du raisonnement symbolique, chargés de juger les actions des agents apprenants et déterminer leur récompense, relativement à une valeur morale spéciﬁque. L’introduction de multiples agents juges permet de rendre explicite l’existence de multiples valeurs morales. L’utilisation de jugement symbolique facilite la conception par des experts du domaine applicatif, et permet d’améliorer l’intelligibilité des récompenses ainsi produites, ce qui offre une fenêtre sur les motivations que reçoivent les agents apprenants. Troisièmement, nous nous focalisons plus précisément sur la gestion des dilemmes. Nous proﬁtons de l’existence de multiples valeurs morales aﬁn de fournir plus d’informations aux agents apprenants, leur permettant ainsi d’identiﬁer explicitement ces situations de dilemme, lorsque 2 valeurs morales (ou plus) sont en conﬂit et ne peuvent être satisfaites en même temps. [...]

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage de comportements alignés sur des valeurs morales dans un système multi-agent : guider l'apprentissage par renforcement avec des jugements symboliques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage de comportements alignés sur des valeurs morales dans un système multi-agent : guider l'apprentissage par renforcement avec des jugements symboliques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses