Cumulative methods for image based driver assistance systems : applications to egomotion estimation, motion analysis and object detection

par Qiong Nie

Thèse de doctorat en Physique

Sous la direction de Alain Mérigot et de Samia Bouchafa.

  • Titre traduit

    Méthodes cumulatives d’analyse d’images pour les systèmes d’aide à la conduit : application à l’estimation du movement et à la reconstruction de scène


  • Résumé

    La thèse porte sur la détection d’objets à partir d’une caméra embarquée sur un véhicule mobile en exploitant l’approche monoculaire « c-vélocité ». Cette méthode s’inspire de la méthode appelée « v-disparité » utilisée en stéréovision : toutes deux ont pour objectif la détection d’objets en les approximant par des plans d’orientations différentes, ce qui permet d’éviter, en monoculaire, d’estimer la profondeur. Ces deux approches, monoculaires et binoculaires, permettent de transformer le problème complexe de la détection d’objets en un problème plus simple de détection de formes paramétriques simples (droites, paraboles) dans un nouvel espace de représentation où la détection peut être réalisée à l’aide d’une transformée de Hough. La « c-vélocité », pour être efficace, requiert un calcul assez précis du flot optique et une bonne estimation de la position du Foyer d’expansion (FOE). Dans cette thèse, nous avons étudié les approches existantes de calcul de flot optique et sommes arrivés à la conclusion qu’aucune n’est vraiment performante notamment sur les régions homogènes telle que la route dans les scènes qui correspondent à l’application que nous visons à savoir : les véhicules intelligents. Par ailleurs, les méthodes d’estimation du flot optique peinent également à fournir une bonne estimation dans le cas de déplacement importants dans les régions proches de la caméra. Nous proposons dans cette thèse d’exploiter à la fois un modèle 3D de la scène et une estimation approximative de la vitesse du véhicule à partir d’autres capteurs intégrés. L’utilisation de connaissances a priori permet de compenser le flot dominant pour faciliter l’estimation de la partie résiduelle par une approche classique. Par ailleurs, trois approches différentes sont proposées pour détecter le foyer d’expansion. Parmi elles, nous proposons une méthode novatrice permettant d’estimer le FOE en exploitant la norme du flot et la structure de la scène à partir d’un processus « c-vélocité » inversé. En plus d’améliorer ces étapes préliminaires, nous proposons aussi l’optimisation et l’accélération de l’algorithme « c-vélocité » par une implémentation multithread. Enfin, nous proposons une modification de l’approche c-vélocité d’origine afin d’anticiper une éventuelle coopération mouvement/stéréo, proposée en perspective, à travers un jumelage avec la v-disparité.


  • Résumé

    This thesis is based on the detection of objects from an onboard moving camera by exploiting the monocular approach "c-velocity". This method is inspired by the method called "v-disparity" used in stereovision: both methods aim at detecting objects by approximating objects into plans with different orientations. Such approximation can avoid to estimate the depth in monocularvision. These two approaches, monocular and binocular, allow to transform the complex objet détection problem into a more simple parametric forms (eg. lines) detection in a new space, where these formes can be easily extracted using Hough Transform.The “c-velocity”, to make it effective, requires an accurate computation of optical flow and a good estimation of the focus of expansion (FOE) location. Therefore, we have studied the existing approaches of optical flow estimation and arrived at the conclusion that none of them is really powerful especially on the homogeneous regions such as road surface. In addition, the optical flow estimation methods also struggle to provide a good estimate in the case of huge displacement in the areas close to the camera. We propose in this thesis to exploit both a 3D model of the scene and a rough estimate about the vehicle speed from other integrated sensors. Using a priori knowledge allows to compensate the dominant optical flow and to facilitate the estimation of the rest part by a classical approach. In addition, three different approaches are proposed to detect the focus of expansion. Among them, we propose a novel method for estimating FOE by leveraging the flow norm and the scene structure from an inverse “c-velocity“ process. In addition to improve these preliminary steps, we also propose an acceleration and optimization of the “c-velocity“ algorithm by a multi-thread implementation. Finally, we propose a modification to the original “c-velocity“ approach in order to anticipate a possible cooperation motion/stereo, proposed in perspective, with the “v-disparity“ approach.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris-Saclay. DiBISO. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.