Thèse en cours

Stabilisation de modèles mathématiques de trafic à l'aide d'apprentissage par renforcement
FR  |  
EN
Auteur / Autrice : Nathan Lichtlé
Direction : Amaury HayatAlexandre Bayen
Type : Projet de thèse
Discipline(s) : Mathématiques
Date : Inscription en doctorat le 01/10/2021
Etablissement(s) : Marne-la-vallée, ENPC
Ecole(s) doctorale(s) : École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication
Partenaire(s) de recherche : Laboratoire : Centre d'enseignement et de recherche en mathématiques et calcul scientifique (Champs-sur-Marne, Seine-et-Marne)

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L'insertion de véhicules autonomes dans le trafic, qui possèdent des capacités sensorielles et calculatoires supérieures à celles de l'homme, et peuvent opérer en vue d'un objectif social comme la réduction des embouteillages ou la réduction de la consommation d'énergie, est une approche qui voit le jour et qui a le potentiel de considérablement fluidifier les flux de trafic ou de réduire les émissions de CO2. Pour ce faire, ces véhicules autonomes doivent agir de manière intelligente, il est donc nécessaire de leur construire des lois de contrôle efficaces afin qu'ils interagissent avec le trafic de manière à atteindre les objectifs désirés. Une approche possible est d'apprendre des lois de contrôle en simulation en utilisant des méthodes d'apprentissage par renforcement. Ces simulations se font en général à l'échelle microscopique, où il peut être nécessaire de simuler des centaines de véhicules plusieurs fois par secondes, sur des dizaines de simulations en parallèle, demandant donc de nombreuses ressources en temps et en puissance de calcul. Par ailleurs, les nombreux véhicules interagissant entre eux rendent le système extrêmement couplé, augmentent grandement la complexité du problème. Une autre approche est d'utiliser des modèles mathématiques de trafic, soit des systèmes couplés d'équations différentielles partielles et ordinaires, opérant cette fois-ci à l'échelle macroscopique. La simulation est donc beaucoup plus rapide, mais les méthodes mathématiques permettant la stabilisation de tels systèmes deviennent vite limitées si l'on souhaite considérer des scénarios de trafic compliqués, ou si l'on souhaite considérer les solutions intéressantes d'un point de vue physique, qui contiennent des discontinuités provenant de chocs. Le but de cette thèse est d'étudier les différentes méthodes disponibles sur le marché et d'analyser comment celles-ci peuvent être adaptées aux cas qui nous intéressent, où les méthodes actuelles sont limitées. Il s'agira également d'appliquer des méthodes d'apprentissage par renforcement pour la stabilisation de ces modèles mathématiques de trafic, afin d'obtenir le meilleur des deux mondes, puis d'étudier le transfert des lois de contrôle ainsi apprises vers une échelle microscopique, correspondant aux scénarios de la vie réelle.