Apprentissage automatique pour l'optimisation de Tournées de Véhicules

par Ali Yaddaden

Projet de thèse en Informatique

Sous la direction de Michel Vasquez.

Thèses en préparation à l'IMT Mines Alès , dans le cadre de École Doctorale Information, Structures, Systèmes , en partenariat avec EuroMov Digital Health in Motion (laboratoire) et de I3A - Informatique, image, intelligence artificielle (equipe de recherche) depuis le 01-11-2019 .


  • Résumé

    Les problèmes de tournées de véhicules (Vehicle Routing Problem) constituent un enjeu logistique important dans l'industrie moderne tant au niveau des problèmes d'approvisionnement que du transport et de la distribution. Cette étude s'inscrit dans le cadre général de l'optimisation du routage et de la planification de tournées de véhicules où il s'agit de visiter des clients pour des opérations de maintenance ou de livraison avec une flotte de véhicules et un pool de techniciens. Sur la base des récents progrès amenés par l'apprentissage machine, Machine Learning (notamment l'apprentissage profond), nous étudierons la définition d'approches tirant parti de techniques d'apprentissage par renforcement pour améliorer l'exploration des espaces de recherche complexes rencontrés dans ce type de problème de planification. Ces approches permettent l'apprentissage d'invariants complexes utiles pour l'identification d'alternatives pertinentes, permettant ainsi de réduire le nombre d'alternatives à évaluer lors de la recherche des solutions aux (sous-)problèmes traités. Au cours des dernières années, en raison du développement rapide de nouvelles méthodes informatiques de calcul et d'optimisation, l'intérêt des praticiens a de plus été déplacé vers des variantes de VRP plus réalistes, qui sont communément connues sous la dénomination de 'rich VRP'. Ces variantes prennent notamment en compte : - Des données incertaines (évènements flous ou stochastiques), - Des données dynamiques (l'« optimisation on-line»), - Une importante variété de contraintes réelles liées aux dimensions temps et espace, - L'ordonnancement de visites avec différentes contraintes temporelles, sur un horizon donné, - La prise en compte du trafic sinon en temps réel du moins par plages d'horaires, - La gestion de stock chez les clients. La plupart de ces formulations de VRP sont ainsi, par définition, dépendantes du caractère variable de certaines composantes du problème (e.g. trafic, commandes, disponibilité des ressources). Dans ce contexte, nous étudierons aussi la définition d'approches hybrides basées sur le couplage de modèles prédictifs permettant d'intégrer une meilleur gestion des complexités induites par les variabilités inhérentes aux formulations réalistes du problème de VRP. Nous étudierons pour cela l'utilisation de techniques d'apprentissage supervisé et non supervisé pour l'intégration de prédictions contextuelles.

  • Titre traduit

    Machine learning for Vehicle Routing Problems


  • Résumé

    The Vehicle Routing Problem (VRP) is of major importance for the Industry, e.g. transport, supply, and logistics. The topic studied in this thesis is optimization for routing and planning of vehicles, in cases where customers have to be visited with a fleet of vehicles and a pool of technicians for maintenance or delivery operations. Based on recent advances in Machine Learning (in particular Deep Learning), we will study the definition of approaches that take advantage of reinforcement learning techniques to enhance exploration of complex search spaces encountered in this type of planning problem similarly to the approach defined in AlphaGo, the DeepMind solution used to win the best Go players. These approaches allow learning complex invariants that are useful for finding relevant alternatives by reducing the number of alternatives to be evaluated when looking for solutions to (sub-)problems of interest. In recent years, due to the rapid development of new computing and optimization methods, practitioners have also focused on more realistic VRP variants, which are commonly known as 'rich VRP'. These variants take into account in particular: - Uncertain data (fuzzy or stochastic events), - Real-time data ('on-line optimization'). - An important variety of real constraints related to time and space dimensions, - The scheduling of visits with different temporal constraints, over a given period 'Periodic VRP', - Taking into account traffic, if not in real time at least in 'Time dependent VRP' time bands, - Stock management. Most of these VRP formulations are thus, by definition, dependent on the variable nature of specific components of the problem (e.g., traffic, orders, availability of resources). In this context, we will also study the definition of hybrid approaches able to take advantage of predictive models. Such approaches would enable a better management of the complexities induced by the variabilities attached to the realistic formulations of the VRP problem. We will in particular study the use of supervised and unsupervised learning techniques for the integration of contextual predictions.