Thèse soutenue

Apprentissage neuronal et validation de modèles hiérarchiques d’aide à la décision multicritère présentant de l'interaction entre les critères

FR  |  
EN
Auteur / Autrice : Roman Bresson
Direction : Johanne CohenChristophe Labreuche
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 02/02/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication
Partenaire(s) de recherche : Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) - Institut national de recherche en informatique et en automatique (France). Unité de recherche (Saclay, Ile-de-France)
référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Patrice Perny
Examinateurs / Examinatrices : Andrea Passerini, Michèle Sebag, Eyke Hüllermeier, Hendrik Blockeel, Krzysztof Dembczynski
Rapporteurs / Rapporteuses : Patrice Perny, Andrea Passerini

Résumé

FR  |  
EN

L’aide à la décision multicritères (ADMC) est un domaine qui vise à aider des décideurs experts (DE) pour des problèmes tels que la sélection, le classement ou la classification d’alternatives définies par plusieurs attributs qui peuvent intéragir. Ces modèles ne sont pas ceux qui prennent pas la décision, mais ils apportent une assistance au DE lors du processus. Il est donc crucial que le modèle offre au DE des moyens d’interpréter ses résultats. Ceci est en particulier vrai dans des contextes critiques où les erreurs peuvent avoir des conséquences désastreuses. Il est par conséquent indispensable que les modèles d’ADMC soient intelligibles, interprétables et que leur comportement soit fortement contraint par des connaissances provenant d’une expertise dans le domaine. De tels modèles sont généralement construits par une interaction (questions/réponses) avec un DE, par le biais de méthodes issues de la recherche opérationnelle. D’autre part, l’apprentissage automatique (ML) fonde son approche sur l’apprentissage du modèle optimal à partir de données d’ajustement. Ce domaine se concentre généralement sur les performances du modèle, en adaptant les paramètres de modèles complexes (dits boîtes noires) pour obtenir une erreur statistiquement faible sur de nouveaux exemples. Bien que cette approche soit adaptée à de nombreux contextes, l’utilisation de modèles boîtes noires est inconcevable dans les cas usuels d’ADMC, car ils ne sont ni interprétable, ni facilement contraignables. Cette thèse fait le pont entre ces deux domaines. Nous nous concentrons sur une certaine classe de modèles d’ADMC, appelés intégrales de Choquet hiérarchiques utilitaires (ICHU). Notre première contribution, qui est théorique, est de montrer l’identifiabilité (ou l’unicité de la paramétrisation) des ICHUs. Ce résultat motive notre seconde contribution : le framework NeurHCI, une architecture de modules de réseaux de neurones qui peuvent apprendre les paramètres d’un ICHU. En particulier, tous les modèles NeurHCI sont garantis comme étant formellement valides, répondant aux contraintes qui conviennent à de tels modèles (monotonie, normalisation), et restent interprétables. Nous montrons empiriquement que les modèles Neur-HCI sont performants sur des ensembles de données artificielles et réelles, et qu’ils présentent une stabilité remarquable, ce qui en fait des outils pertinents pour alléger l’effort d’élicitation de modèles lorsque les données sont facilement disponibles, et permet leur utilisation comme outils d’analyse appropriés pour identifier certains phénomènes sous-jacents dans les données.