Méthodes d'apprentissage statistique pour la détection de la signalisation routière à partir de véhicules traceurs

par Yann Meneroux

Thèse de doctorat en Signal, Image, Automatique

Sous la direction de Sébastien Mustière et de Guillaume Saint Pierre.

Soutenue le 28-11-2019

à Paris Est , dans le cadre de École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication (Champs-sur-Marne, Seine-et-Marne ; 2015-....) , en partenariat avec Laboratoire en Sciences et technologies de l'information géographique (Champs-sur-Marne, Seine-et-Marne) (laboratoire) et de Laboratoire des Sciences et Technologies de l'Information Géographique / LaSTIG (laboratoire) .


  • Résumé

    Avec la démocratisation des appareils connectés équipés d’un récepteur GPS, de grandes quantités de trajectoires de véhicules deviennent disponibles, notamment via les flottes de véhicules professionnels et les applications mobiles collaboratives de navigation et d’assistance à la conduite. Récemment, les techniques dites de map inference, visant à dériver de l’information cartographique à partir de ces traces GPS, tendent à compléter, voire à remplacer les techniques traditionnelles. Initialement restreintes à la construction de la géométrie des routes, elles sont progressivement utilisées pour enrichir les réseaux existants, et en particulier pour construire une base de données numérique de la signalisation verticale. La connaissance fine et exhaustive de l’infrastructure routière est un prérequis indispensable dans de nombreux domaines : pour les gestionnaires de réseaux et les décideurs dans le cadre de travaux d’aménagement, pour les usagers avec le calcul précis des temps de parcours, mais aussi dans le cadre du véhicule autonome, avec la construction et la mise à jour d’une cartographie haute définition, garante de la disponibilité à tout instant d’un horizon électronique à même de suppléer le système en cas de dysfonctionnement des capteurs du véhicule. Dans ce contexte, les méthodes d’apprentissage statistique apportent une perspective intéressante et garantissent l’adaptabilité de l’approche aux différents cas d’utilisation et à la grande variabilité des données rencontrées en pratique. Dans ce travail de thèse, nous cherchons à étudier le potentiel de cette classe de méthodes, pour la détection automatique de la signalisation routière, en temps différé, à partir d’un ensemble de profils de vitesse GPS. Le premier cas d’application est celui de la détection des feux de circulation, étendu par la suite à d’autre types de signalisation comme les passages piétons. Dans un premier temps, nous travaillons sur un jeu de données expérimental de haute qualité, à l’aide duquel nous étudions les performances de plusieurs classifieurs et nous comparons deux représentations mathématiques des données : une approche classique de reconnaissance d’image et une approche fonctionnelle consistant à agréger et à décomposer les signaux de profils de vitesses sur une base d’ondelettes de Haar. Les résultats obtenus montrent la pertinence de l’approche fonctionnelle, en particulier lorsqu’elle est combinée à l’algorithme des forêts aléatoires, en termes de fiabilité de détection et de temps de calcul. L’approche est alors appliquée sur d’autres types d’éléments de l’infrastructure. Dans une deuxième partie, nous tentons d’adapter la méthode proposée sur le cas de données observationnelles, i.e. acquises en environnement non-contrôlé, pour lesquelles nous cherchons également à estimer la position des feux de signalisation par régression statistique. Les résultats montrent la sensibilité de l’approche axé sur l’apprentissage face à des données fortement bruitées ainsi que la difficulté liée à la définition de l’emprise spatiale des instances individuelles sur un réseau routier complexe. Nous tentons de lever ce second verrou à l’aide d’approches images globales basées sur une segmentation par réseau de neurones convolutionnel. Enfin, nous expérimentons une approche permettant d’exploiter l’autocorrélation spatiale des variables cibles sur les instances individuelles à l’aide de la topologie du graphe routier et en modélisant la zone d’étude sous forme d’un champ de Markov conditionnel. Les résultats obtenus montrent une amélioration des performances par rapport aux résultats obtenus par l’apprentissage non-structuré. Ces travaux de thèse ont également suscité le développement de méthodes originales de pré-traitement des trajectoires GPS (filtrage, interpolation, débiaisage et recalage sur un réseau routier de référence) ainsi que de critères objectifs d’évaluation de la qualité de ces pré-traitements

  • Titre traduit

    Using probe vehicle data and machine learning algorithms for road signs detection


  • Résumé

    With the democratization of connected devices equipped with GPS receivers, large quantities of vehicle trajectories become available, particularly via professional vehicle fleets, mobile navigation and collaborative driving applications. Recently, map inference techniques, aiming at deriving mapping information from these GPS tracks, have tended to complete or even replace traditional techniques. Initially restricted to the construction of road geometry, they are gradually being used to enrich existing networks, and in particular to build a digital database of road signs. Detailed and exhaustive knowledge of the infrastructure is an essential prerequisite in many areas : for network managers and decision-makers, for users with precise calculation of travel times, but also in the context of the autonomous vehicle, with the construction and updating of a high definition map providing in real time electronic horizons, which can supplement the system in the event of failures of the main sensors. In this context, statistical learning methods (e.g. Bayesian methods, random tree forests, neural networks,...) provide an interesting perspective and guarantee the adaptability of the approach to different use cases and the great variability of the data encountered in practice.In this thesis, we investigate the potential of this class of methods, for the automatic detection of traffic signals (mainly traffic lights), from a set of GPS speed profiles. First, we are working on an experimental, high-quality dataset, for which we compare the performances of several classifiers on classical image recognition approaches and on a functional approaches stemming from the field of signal processing, aggregating and decomposing speed profiles on a Haar wavelet basis whose coefficients are used as explanatory variables. The results obtained show the relevance of the functional approach, particularly when combined with the random forest algorithm, in terms of accuracy and computation time. The approach is then applied to other types of road signs.In a second part, we try to adapt the proposed method on the case of observational data for which we also try to estimate the position of the traffic lights by regression. The results show the sensitivity of the learning approach to the data noise and the difficulty of defining the spatial extent of individual instances on a complex road network. We are trying to solvethis second issue using global image approaches based on a segmentation by convolutional neural network, allowing us to avoid the definition of instances. Finally, we are experimenting an approach leveraging spatial autocorrelation of individual instances using the graph topology, by modeling the study area as a conditional Markov field. The results obtained show an improvement compared to the performance obtained with non-structured learning.This thesis work has also led to the development of original methods for pre-processing GPS trajectory data, in particular for filtering, debiaising coordinates and map-matching traces on a reference road network


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Communautés d’Universités et d'Etablissements Université Paris-Est. Bibliothèque universitaire.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.