Contributions à la prévision court-terme, multi-échelle et multi-variée, par apprentissage statistique du trafic routier

par Pierre-Antoine Laharotte

Thèse de doctorat en Génie Civil

Sous la direction de Nour-Eddin el-Faouzi Faouzi et de Romain Billot.

Le président du jury était Latifa Oukhellou.

Le jury était composé de Philippe Goudal.

Les rapporteurs étaient Vincent Aguiléra, Liming Chen.


  • Résumé

    La maturité de la télématique et des technologies de l’information et la communication (TIC), ainsi que l’avènement du big data dans le transport ont conduit à des développements foisonnants dans le domaine des systèmes de transports intelligents (ITS), aussi bien sur le plan des technologies de recueil que du traitement innovant de l’information. Il est désormais possible de connaître les conditions de circulation et les états de trafic sur la plupart des sections d’un réseau routier sans avoir recours à des infrastructures intrusives de collecte de données, de transmettre l’information résultante via des réseaux sans fil et de traiter rapidement toutes ces données multi-sources disponibles. La constitution de grandes bases de données a naturellement fait évoluer la pratique de gestion du trafic et plus particulièrement les méthodes de prévision. Ces méthodes ont connu un renouveau en s’inspirant des travaux produits en apprentissage statistique. Néanmoins, la façon d’appréhender le problème de la prévision est restée à une échelle locale. Pour chaque section de route, un modèle de prévision est adapté et optimisé. Notre travail de thèse présente un cadre de prévision du trafic routier qui aborde la question à l’échelle du réseau. L’étude menée au sein de ces travaux de thèse vise à exposer et évaluer cette nouvelle approche, dite globale, au regard d’approches usuelles, puis à analyser sa sensibilité vis-à-vis de divers facteurs. Après un positionnement par rapport à l’état de l’art en théorie du trafic, le cadre prédictif fondé sur des méthodes de prévision multi-variées par apprentissage est détaillé. Une version multidimensionnelle des k plus proches voisins, modèle parcimonieux et simple, est évaluée sur divers cas d’études. L’originalité réside dans l’exploitation de données issues de méthodes innovantes de collecte (e.g. Bluetooth, véhicules traceurs, véhicules connectés). Par la suite, les performances de l’approche initiale sont comparées à d’autres méthodes d’apprentissage. Un effort particulier est porté sur l’adaptation de méthodes à noyaux au cadre prédictif global. Les performances obtenues laissent entrevoir une typologie des méthodes en fonction des caractéristiques spatiotemporelles du réseau. Afin d’améliorer les performances en prévision et de réduire les temps de calcul, une méthode d’identification et de sélection des sections critiques du réseau est proposée. Les résultats prouvent qu’un sous-ensemble restreint de sections est en effet suffisant pour garantir des performances satisfaisantes en généralisation. Enfin, la résilience du cadre prédictif est évaluée au regard des événements non récurrents affectant le fonctionnement nominal du réseau, comme des incidents ou des conditions météorologiques dégradées. Les résultats soulignent l’impact de ces conditions non récurrentes sur la prévision temps-réel de la dynamique court-terme d’un réseau et permettent de dresser une feuille de route pour l’élaboration d’un cadre prédictif résilient et opérationnel. Cette nouvelle vision de la prévision s’inscrit dans les perspectives actuelles en termes d’applications sur les modules embarqués et les objectifs des gestionnaires d’infrastructures.

  • Titre traduit

    Contributions to the short-term, multi-variate and multi-scale prediction of traffic states based on machine learning methods


  • Résumé

    The maturity of information and communication technologies and the advent of Big Data have led to substantial developments in intelligent transportation systems (ITS) : from data collection to innovative processing solutions. Knowledge of current traffic states is available over most of the network range without the use of intrusive infrastructure-side collection devices, instead relying on wireless transmission of multi-source data. The increasing use of huge databases had a strong influence on traffic management, including forecasting methods. These approaches followed the recent trend towards innovative works on statistical learning. However, the prediction problem remains mainly focused on the local scale. The prediction for each road link relies on a dedicated, optimized and adapted prediction model. Our work introduces a traffic-forecasting framework able to tackle network scale problems. The study conducted in this thesis aims to present and evaluate this new “global” approach, in comparison to most-used existing works, and then to analyze its sensitivity to several factors. The traffic-forecasting framework, based on multi-variate learning methods, is detailed after a review of the literature on traffic flow theory. A multi-dimensional version of the k nearest-neighbors, a simple and sparse model, is evaluated through several use cases. The originality of the work stands on the processing approach, applied to data collected through new measurement process (e.g. Bluetooth, floating car data, connected vehicles). Then, the performance of our primary approach is compared to other learning-based methods. We propose an adaptation of kernel-based methods for the global prediction framework. The obtained results show that global approaches perform as well as usual approaches. The spatial and temporal specificities of the methods are highlighted according to the prediction accuracy. To improve the forecasting accuracy and reduce the computation time, we propose an identification and selection method targeting critical links. The results demonstrate that the use of a restricted subset of links is sufficient to ensure acceptable performances during validation tests. Finally, the prediction framework resilience is evaluated with respect to non-recurrent events as incidents or adverse weather conditions affecting the nominal network operations. The results highlight the impact of these non-recurrent conditions on real-time forecasting of short-term network dynamics. This enables the design of a further operational and resilient prediction framework. This perspective of forecasting matches the current applications relying on embedded systems and addressing the traffic network supervisor’s expectations.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Ecole nationale des travaux publics de l'Etat. Bibliothèque.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.