Thèse soutenue

Prise de décision dynamique en cas d'incertitude dans l'acheminement des véhicules et la logistique
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Nicholas D. Kullman
Direction : Jean-Charles BillautJorge-Ernesto MendozaJustin C. Goodson
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 04/05/2020
Etablissement(s) : Tours
Ecole(s) doctorale(s) : École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique Fondamentale et Appliquée de Tours (2012-...)
Jury : Président / Présidente : Ameur Soukhal
Examinateurs / Examinatrices : Martin Cousineau, Jakob Puchinger
Rapporteurs / Rapporteuses : Pascal Van Hentenryck, Ola Jabali

Résumé

FR  |  
EN

Cette thèse présente trois études menées sur des problèmes de tournées dynamiques. En particulière, elle se concentre sur les challenges résultants de l’utilisation de véhicules électriques dans les systèmes logistiques et de transports. Dans la première étude, nous introduisons le problème de tournées de véhicules électriques avec des bornes de recharge publiques et privées. Dans ce contexte, les véhicules peuvent recharger leurs batteries en route, dans des bornes publiques, ainsi qu’au dépôt (bornes privées). Pour se protéger contre l’incertitude de la disponibilité des bornes publiques, nous présentons des politiques de routage qui anticipent la dynamique des files d’attente des bornes. Nos politiques se basent sur une décomposition du problème en deux phases : routage et planification des opérations de recharge. Grâce à cette décomposition, nous obtenons la politique statique optimale, ainsi qu’un certain nombre de politiques dites « anticipatoires » et une borne inférieure. Des tests numériques effectués sur des instances réelles fournies par une entreprise, monter que nos politiques sont capables de livrer des solutions avec un gap d’optimalité de moins de 5%. Nos tests montrent aussi que permettre aux véhicules de charger en dehors du dépôt (même en présence d’incertitude sur la disponibilité des bornes) se traduit par des économies considérables dans la durée des routes.Dans la deuxième étude, nous considérons le problème d’un opérateur contrôlant une flotte de véhicules de tourisme avec chauffeur (VTCs) électriques. L’opérateur, qui cherche à maximiser ses revenus, doit affecter les véhicules aux demandes au fur et à mesure de leur apparition ainsi que charger et repositionner les véhicules en prévision des demandes futures. Pour attaquer ce problème, nous utilisons des approches basées sur l’apprentissage par renforcement profond. Pour mesurer la qualité de nos approches, nous avons développé aussi une heuristique proche de celle typiquement utilisée dans l’affectation de taxis, ainsi que des bornes supérieures. Nous testons nos approches dans des instances construites à partir de données réelles de l’île de Manhattan. Nos tests montrent que notre meilleure politique basée sur l’apprentissage profond livre des résultats supérieurs à ceux livrés par l’heuristique. Les tests montrent aussi que cette stratégie passe facilement à l’échelle et peut être déployée sur de plus grandes instances sans entrainement supplémentaire.La dernière étude introduit une nouvelle approche générique pour modéliser des problèmes d’optimisation dynamique sous la forme de jeux vidéo de type Atari. L’objectif est de les rendre abordables à travers de méthodes de solution issus de communauté d’apprentissage par renforcement profond. L’approche est flexible et applicable à un large éventail de problèmes. Pour illustrer son application, nous nous attaquons à un problème bien établie dans la littérature : le problème de tournées de véhicules avec des requêtes de service stochastiques. Nos résultats préliminaires sur ce problème sont très encourageants et montrent que « l’Atari-fication » peut être la voie pour résoudre des problèmes d’optimisation dynamique qui s’avèrent difficiles pour les approches basées sur les outils classiques de la recherche opérationnelle.Les derniers chapitres présentent deux logiciels développées pour supporter nos recherches. Le premier, nommé frvcpy, permet de déterminer l’insertion optimal des opérations de recharge dans une tournée prédéterminée. Ce logiciel et son code source, présenté comme une bibliothèque Python, a été mis à disposition de la communauté scientifique. Le deuxième outil, VRP-REP Mapper, est un outil web pour visualiser et analyser des solutions pour les problèmes de tournées de véhicules. Cette outil a été intégré a www.vrp-rep.org, la plateforme de référence pour le partage de données scientifiques dans le domaine.