Conception d'un capteur de stéréovision omnidirectionnelle : architecture, étalonnage et applications à la reconstruction de scènes 3D

par Nicolas Ragot

Thèse de doctorat en Génie informatique, automatique et traitement du signal. Vision par ordinateur

Sous la direction de Belahcene Mazari.

Soutenue en 2009

à l'Université de Rouen, IRSEEM .


  • Résumé

    Les travaux de thèse présentés dans ce mémoire ont pour objectif la conception et l'évaluation d'un système de vision 3D constitué de deux capteurs catadioptriques positionnés verticalement. Afin d'obtenir un modèle 3D, l'étalonnage des capteurs, c'est-à-dire l'estimation des relations entre l'espace 3D et le plan image, est un préalable indispensable. Une méthode, qualifiée de paramétrique a tout d'abord été implémentée. Elle utilise un modèle ad hoc et une mire 3D de forme cylindrique dont les points d'intérêt sont des diodes électroluminescentes. Cette méthode formule l'hypothèse d'un centre de projection unique qui peut s'avérer difficile à mettre oeuvre en pratique. Nous proposons donc une méthode non-paramétrique qui permet de s'affranchire des contraintes liées aux modèles. Les relations entre l'espace 3D et le plan image sont alors définies pour un nombre fini de points et des algorithmes d'interpolation numérique permettent d'approximer les fonctions de projection et rétro-projection pour tous les couples points 3D-points 2D. Nous proposons ensuite l'implémentation et l'évaluation d'une méthode de reconstruction 3D volumétrique qui modélise la scène sous forme d'un tableau 3D dont chaque cellule est un voxel. Une mesure de similarité colorimétrique des projections du voxel dans chacune des images permet de statuer quant à l'appartenance du voxel à un objet de la scène. Cette méthode est évaluée pour une reconstruction statique de la scène 3D, c’est-à-dire pour une acquisition d'images simultanée. Puis cette méthode est étudiée pour des déplacements du capteur. Il s'agit d'une reconstruction dynamique définie comme l'intersection des reconstructions statiques réalisées à des instants successifs.


  • Résumé

    The work presented in this thesis deals with the design and the evaluation of a vision sensor made of two catadioptric sensors, one above the other. To obtain a 3D model, it is necessary to calibrate the sensors, that is to say to estimate the relationships between the 3D space and the image plane. A parametric method has been implemented. It uses an ad hoc model and a cylindrical 3D pattern whose points of interest are light-emetting diodes. This method is based on the assumption that the sensor respects the single effective viewpoint constraint, but which is difficult to put into practice. Thus, we propose a non-parametric method which eliminate the problem of model restrictions. The relationships are defined for a finite number of points and numerical interpolation algorithms allow us to approximate the projection and back-projection functions for all pairs of 3D points-2D points. Then, we propose the implementation and the evaluation of a 3D volumetric reconstruction method which models the scene by a 3D array whose cells are voxels. A colorimetric similarity measure of the voxel projections estimate whether or not the voxel is an object in 3D. This method is evaluated on a 3D static reconstruction, that is a simultaneous image acquisition. Then, this method is studied for sensor displacements. This is a 3D dynamic reconstruction which is defined as the intersection of 3D static reconstructions made at successive times.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (xii-168 f.)
  • Annexes : Bibliogr. f. 145-159. [175] réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rouen. Service commun de la documentation. Section sciences site Madrillet.
  • Disponible pour le PEB
  • Cote : 09/ROUE/S035
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.