Reinforcement learning for combinatorial optimization : leveraging uncertainty, structure and priors | Theses.fr

Nathan Grinsztajn

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Apprentissage par renforcement pour l'optimisation combinatoire : exploiter l'incertitude, les structures et les connaissances a priori

FR |

EN

Auteur / Autrice :	Nathan Grinsztajn
Direction :	Philippe Preux
Type :	Thèse de doctorat
Discipline(s) :	Informatique et applications
Date :	Soutenance le 15/06/2023
Etablissement(s) :	Université de Lille (2022-....)
Ecole(s) doctorale(s) :	Ecole doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille)
Partenaire(s) de recherche :	Laboratoire : Centre de Recherche en Informatique, Signal et Automatique de Lille - Centre Inria de l'Université de Lille
Jury :	Président / Présidente : Emmanuel Rachelson
	Examinateurs / Examinatrices : Clarisse Dhaenens, Zhiguang Cao
	Rapporteurs / Rapporteuses : Sylvain Lamprier, Ludovic Denoyer

Mots clés

FR |

EN

Mots clés contrôlés

Ordonnancement (informatique)

Prise de décision (statistique)

Métaheuristiques

Optimisation combinatoire

Apprentissage par renforcement (intelligence artificielle)

Mots clés libres

Structure de problème

Résumé

FR |

EN

Les problèmes d'optimisation combinatoire ont été largement étudiés, notamment en raison de leurs nombreuses applications (planification, logistique, distribution, investissement, production...) et de leur complexité. Coûteux à résoudre de manière exacte, les approches les plus populaires s'appuient sur des heuristiques pour prendre leurs décisions. Cependant, produire des heuristiques efficaces et performantes est un exercice difficile, d'autant plus dans des environnements réalistes avec de l'incertitude ou de la stochasticité.Dans cette thèse de doctorat, nous étudions comment l'apprentissage par renforcement peut être utilisé en optimisation combinatoire pour automatiser la production de telles heuristiques. Après nous être intéressés à un exemple concret, l'ordonnancement de tâches, nous isolons plusieurs caractéristiques clés de ces problèmes, rencontrées en pratique: une possible incertitude sur les données, les décisions à prendre, voire la définition même du problème, et une structure forte, qui a la particularité d'être souvent connue ou partiellement connue a priori. Nous explorons différentes façons de tenir compte de ces caractéristiques dans le cadre de l'apprentissage par renforcement pour une large gamme de problèmes, sortant parfois du cadre strict de l'optimisation combinatoire.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage par renforcement pour l'optimisation combinatoire : exploiter l'incertitude, les structures et les connaissances a priori

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage par renforcement pour l'optimisation combinatoire : exploiter l'incertitude, les structures et les connaissances a priori

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses