Interprétabilité locale post-hoc des modèles de classification "boites noires"

Thibault Laugel

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Thibault Laugel
Direction :	Christophe Marsala, Marie-Jeanne Lesot
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 03/07/2020
Etablissement(s) :	Sorbonne université
Ecole(s) doctorale(s) :	École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche :	Laboratoire : LIP6 (1997-....)
Jury :	Président / Présidente : Nicolas Maudet
	Examinateurs / Examinatrices : Chris Russell, Marcin Detyniecki
	Rapporteurs / Rapporteuses : Fosca Giannotti, Jamal Atif

Mots clés

FR |

EN

Mots clés contrôlés

Évaluation du risque

Systèmes d'aide à la décision

Apprentissage automatique

Mots clés libres

Interprétabilité

Apprentissage automatique

Post-hoc

Explications contrefactuelles

Boîtes noires

Intelligence artificielle

Résumé

FR |

EN

Cette thèse porte sur le domaine du XAI (explicabilité de l'IA), et plus particulièrement sur le paradigme de l'interprétabilité locale post-hoc, c'est-à-dire la génération d'explications pour une prédiction unique d'un classificateur entraîné. En particulier, nous étudions un contexte totalement agnostique, c'est-à-dire que l'explication est générée sans utiliser aucune connaissance sur le modèle de classification (traité comme une boîte noire) ni les données utilisées pour l'entraîner. Dans cette thèse, nous identifions plusieurs problèmes qui peuvent survenir dans ce contexte et qui peuvent être préjudiciables à l'interprétabilité. Nous nous proposons d'étudier chacune de ces questions et proposons des critères et des approches nouvelles pour les détecter et les caractériser. Les trois questions sur lesquelles nous nous concentrons sont : le risque de générer des explications qui sont hors distribution ; le risque de générer des explications qui ne peuvent être associées à aucune instance d'entraînement ; et le risque de générer des explications qui ne sont pas assez locales. Ces risques sont étudiés à travers deux catégories spécifiques d'approches de l'interprétabilité : les explications contrefactuelles et les modèles de substitution locaux.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Interprétabilité locale post-hoc des modèles de classification "boites noires"

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Interprétabilité locale post-hoc des modèles de classification "boites noires"

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses