Localisation d'un véhicule à l'aide d'un SLAM visuel contraint

par Dorra Larnaout

Thèse de doctorat en Vision pour la Robotique

Sous la direction de Michel Dhome.

Soutenue le 06-05-2014

à Clermont-Ferrand 2 , dans le cadre de École doctorale des sciences pour l'ingénieur (Clermont-Ferrand) , en partenariat avec Institut Pascal (Aubière, Puy-de-Dôme) (équipe de recherche) .

Le président du jury était Nicolas Paparoditis.

Le jury était composé de Marie-Odile Berger, François Chaumette, Steve Bourgeois, Vincent Gay-Bellile.

Les rapporteurs étaient Marie-Odile Berger, François Chaumette.


  • Résumé

    Pour se localiser en ville, la majorité des solutions commercialisées se base sur les systèmes GPS. Même si ces systèmes offrent une précision suffisante hors agglomération, celle-ci se dégradent considérablement en villes à cause des phénomènes connus sous le nom du canyon urbain (i.e. réflexion du signal GPS sur les façades des bâtiments). Pour pallier ce problème, les solutions basées sur un SLAM visuel (Simultaneous Localization And Mapping) semblent une alternative prometteuse. En plus de l’estimation des six degrés de liberté de la caméra mobile, il fournit une carte 3D de la scène observée. Toutefois, la localisation assurée par le SLAM visuel n’est pas géo-référencée et présente souvent des dérives (e.g. mauvaise estimation du facteur d’échelle, accumulation des erreurs). Pour faire face à ces limitations et afin de proposer une solution facile à déployer, nous avons étudié la possibilité d’intégrer au SLAM des informations supplémentaires qui pourraient contraindre l’ensemble de la reconstruction fournie. Ces dernières doivent alors être peu couteuses et disponibles en milieux urbains denses et péri-urbains. C’est pour cette raison que nous avons choisi d’exploiter les contraintes fournies par un GPS standard et celles apportées par des modèles issus des Systèmes d’Information Géographique, plus précisément : des modèles 3D des bâtiments et des modèles d’élévation de terrain. La principale contribution de ces travaux réside en l’intégration de ces contraintes au sein de l’ajustement de faisceaux (i.e. processus d’optimisation du SLAM). Ceci n’est pas trivial étant donné que combiner des contraintes agissant sur la trajectoire de la caméra et la reconstruction 3D peut entrainer des problèmes de convergences, en particulier lorsque les informations exploitées ont des incertitudes variées, voire même des données biaisées ou aberrantes (e.g. Pour les mesures du GPS). Différentes solutions Larnaout et al. (2012, 2013a,b,c) permettant de combiner plusieurs de ces contraintes simultanément tout en limitant les problèmes de convergence ont été développées. Les solutions proposées ont été validées sur des séquences de synthèse et d’autres réelles de plusieurs kilomètres enregistrées dans des conditions de circulation normale. Les résultats obtenus montrent que la précision atteinte au niveau de l’estimation des six degrés de liberté de la caméra permet d’assurer des nouvelles applications d’aide à la navigation par le biais de la Réalité Augmentée. En plus de leur précision, nos approches ont l’avantage d’être rapides, peu couteuses et faciles à déployer (ne nécessitant pas un matériel sophistiqué).


  • Résumé

    To ensure a global localization in urban environment, the majority of commercial solutions is based on Global Positioning Systems (GPS). While these systems offer sufficient accuracy in peri-urban or rural areas, their accuracy decreases significantly in cities because of the urban canyon (i.e. reflections of the GPS signal through the facades of buildings). To overcome this problem, vision based solutions such as the visual SLAM (Simultaneous Localization And Mapping) seem to be a promising alternative. In addition to the estimation of the six degrees of freedom of the mobile camera, such approach provides a 3D map of the observed scene. However, the localization provided by the visual SLAM is not geo-referenced and is often subject of drifts (e.g. poor estimate of the scale factor, accumulations errors). To address these limitations and to provide a solution easy to deploy, we studied the possibility of integrating to the SLAM algorithm additional information that could constrain the entire reconstruction. These data must then be inexpensive and available in dense urban and peri-urban areas. For these reasons, we chose to exploit the constraints provided by a standard GPS and those provided by models from Geographic Information Systems, more precisely, the 3D buildings models and the digital elevation models. The main contribution of this work lies in the integration of these constraints in the bundle adjustment (i.e. the optimization process of the SLAM algorithm). This is not trivial since combining constraints acting on the trajectory of the camera and the 3D reconstruction can lead to convergence problems, especially when the information used have various uncertainties and even outliers (e.g. specially GPS measurements). Different solutions Larnaout et al. (2012, 2013a,b,c) to combine these constraints simultaneously while limiting the problems of convergence have been developed. The proposed solutions have been evaluated on synthetic sequences and large scale real sequences recorded in normal traffic conditions. The results show that the accuracy achieved on the six degrees of freedom of the mobile camera is sufficient to ensure new service of aided navigation through Augmented Reality. In addition to the accuracy, our approaches have the advantage of being fast, inexpensive and easy to deploy (not requiring sophisticated equipment).


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université Clermont Auvergne. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.