Apprentissage actif pour l'approximation de variétés

Benoît Gandar

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Benoît Gandar
Direction :	Guillaume Deffuant
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 27/11/2012
Etablissement(s) :	Clermont-Ferrand 2
Ecole(s) doctorale(s) :	École doctorale des sciences pour l'ingénieur (Clermont-Ferrand)
Partenaire(s) de recherche :	Equipe de recherche : Laboratoire d'Informatique, de Modélisation et d'Optimisation des Systèmes
	Laboratoire : (UR LISC) Laboratoire d'ingénierie pour les systèmes complexes - (LIMOS) Laboratoire d'Informatique- de Modélisation et d'optimisation des Systèmes
Jury :	Président / Présidente : Philippe Mahey
	Examinateurs / Examinatrices : Stéphane Canu, Antoine Cornuéjols, Gaëlle Loosli, Olivier Teytaud
	Rapporteurs / Rapporteuses : Stéphane Canu, Antoine Cornuéjols

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage automatique

Mots clés libres

Apprentissage statistique

Apprentissage actif

Échantillonnage aveugle ou échantillonnage adaptatif

Échantillonnage sélectif

Plans d’expériences

Approximation de variétés

Résumé

FR |

EN

L’apprentissage statistique cherche à modéliser un lien fonctionnel entre deux variables X et Y à partir d’un échantillon aléatoire de réalisations de (X,Y ). Lorsque la variable Y prend un nombre binaire de valeurs, l’apprentissage s’appelle la classification (ou discrimination en français) et apprendre le lien fonctionnel s’apparente à apprendre la frontière d’une variété dans l’espace de la variable X. Dans cette thèse, nous nous plaçons dans le contexte de l’apprentissage actif, i.e. nous supposons que l’échantillon d’apprentissage n’est plus aléatoire et que nous pouvons, par l’intermédiaire d’un oracle, générer les points sur lesquels l’apprentissage de la variété va s’effectuer. Dans le cas où la variable Y est continue (régression), des travaux précédents montrent que le critère de la faible discrépance pour générer les premiers points d’apprentissage est adéquat. Nous montrons, de manière surprenante, que ces résultats ne peuvent pas être transférés à la classification. Dans ce manuscrit, nous proposons alors le critère de la dispersion pour la classification. Ce critère étant difficile à mettre en pratique, nous proposons un nouvel algorithme pour générer un plan d’expérience à faible dispersion dans le carré unité. Après une première approximation de la variété, des approximations successives peuvent être réalisées afin d’affiner la connaissance de celle-ci. Deux méthodes d’échantillonnage sont alors envisageables : le « selective sampling » qui choisit les points à présenter à un oracle parmi un ensemble fini de candidats et l’« adaptative sampling » qui permet de choisir n’importe quels points de l’espace de la variable X. Le deuxième échantillonnage peut être vu comme un passage à la limite du premier. Néanmoins, en pratique, il n’est pas raisonnable d’utiliser cette méthode. Nous proposons alors un nouvel algorithme basé sur le critère de dispersion, menant de front exploitation et exploration, pour approximer une variété.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage actif pour l'approximation de variétés

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage actif pour l'approximation de variétés

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses