Thèse soutenue

Prévision de charge dans les transports en commun en situation atypique par traitement d'image

FR  |  
EN
Auteur / Autrice : Thomas Bapaume
Direction : Latifa Oukhellou
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 01/12/2023
Etablissement(s) : Université Gustave Eiffel
Ecole(s) doctorale(s) : École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication (Champs-sur-Marne, Seine-et-Marne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Génie des Réseaux de Transport Terrestre et Informatique Avancé (Noisy-le-grand, Seine-Saint-Denis) - Laboratoire Génie des Réseaux de Transport Terrestre et Informatique Avancé (Noisy-le-grand, Seine-Saint-Denis)
Jury : Examinateurs / Examinatrices : Latifa Oukhellou, Vincent Guigue, Laurent Heutte, Alexandre Alahi, Etienne Côme
Rapporteurs / Rapporteuses : Vincent Guigue, Laurent Heutte

Résumé

FR  |  
EN

Les transports en commun jouent un rôle essentiel dans le développement du tissu urbain en offrant des services de transport contribuant à la durabilité des grandes villes. Avec la tenue d'évènements majeurs (Jeux Olympiques 2024, Coupe du Monde de Rugby) et la création de nouvelles lignes de métro dans la capitale parisienne (projet du Grand Paris), les transports en commun seront soumis à des contraintes nouvelles et atypiques. La tâche de prédiction de charge à bord doit bien sûr fournir une prédiction la plus fiable possible en situation nominale mais elle doit aussi tenir compte de ces futures évolutions en considérant les situations atypiques observées au cours des dernières années (Covid, Grève, incident) afin de garantir un niveau de service élevé favorisant l'usage des transports en commun. Dans ce contexte, ces travaux de thèse cherchent à construire un modèle de prédiction court-terme de charge en focalisant sur les situations atypiques du réseau, qu'elles soient prévues ou non, récurrentes ou non. La modélisation est construite sur une représentation fidèle des mouvements de trains sous la forme d'une image. Une telle représentation des données a l'avantage d'encoder l'intégralité des trains circulant sur une ligne de transport en évitant toute agrégation temporelle, autorisant ainsi une prédiction à l'échelle de la ligne et une compréhension fine des dynamiques de charges en particulier lors des cas atypiques. La prédiction de charge est ainsi transposée sous la forme d'une problématique de traitement d'image visant à reconstruire une partie de l'image (tâche d'inpainting). Elle est effectuée simultanément pour tous les trains et stations d'une ligne de métro. En s'inspirant des modèles de traitement d'image, nous proposons une méthodologie de prédiction court-terme des charges dans les transports en commun, tenant compte des spécificités propres à l'image comme les données manquantes, l'aspect spatio-temporelle entre trains et stations. Un des challenge de la thèse est de valider la méthodologie proposée sur un jeu de trois ans de données avec une variété de situations atypiques (événements sportifs, Covid, grèves, incidents, ...) tout en utilisant diverses architectures allant de la diffusion à l'apprentissage profond en particulier les modèles U-net et transformer (Vision Transformer pour les images). Enfin, ces travaux mettent l'accent sur les situations atypiques, regroupant à la fois les perturbations d'une ligne (retards, fortes charges), et des évènements impactant la ligne (événements sportifs, confinements, grèves). Ces contextes spéciaux du trafic ferroviaire constituent un réel enjeu pour les outils de prédiction car ils ne sont pas considérés dans l'offre théorique. Dans un premier temps, nous exploitons conjointement des indicateurs statistiques et l'espace latent pour labelliser les images et constituer des sous-bases spécifiques. Nous procédons ensuite à une analyse différenciée des performances de prédiction sur chacune des classes d'images. Il s'agit d'évaluer les modèles pour les cas les plus complexes afin de juger de leur capacité de généralisation. Dans un second temps, nous explorons deux pistes pour améliorer ces performances, l'une se base sur le sur-échantillonnage des images atypiques tandis que l'autre s'attache à générer de nouvelles images atypiques. Nous évaluons les modèles de prédiction de charges sur les bases de données ainsi constituées