Traitement de séquences video : asynchronisme, reconstruction 3D et application en temps réel

par Vincent Guitteny

Thèse de doctorat en Vision par ordinateur

Sous la direction de Jean Devars.

Soutenue en 2008

à Paris 6 .

  • Titre traduit

    Video streams processing : asynchronism, 3D reconstruction and real-time applications


  • Résumé

    L’implantation accrue de systèmes d’acquisition vidéo amène de nouvelles problématiques relatives à l’exploitation en temps réel ou différée des données image. En effet l’analyse des données multi-caméras pour la reconstruction 3D ou la réalité augmentée nécessite au préalable un recalage temporel de chacun des flux vidéo. Si la plupart de ces systèmes sont équipés de synchroniseurs matériels, d’autres en revanche n’ont pas d’autre alternative que l’analyse des images afin d’estimer cette cohérence temporelle (systèmes hétérogènes de surveillance urbain. . . ). Cette thèse s’inscrit dans ce cadre d’étude. La première partie concerne la mise en œuvre de méthodes logicielles qui s’appuient sur le contenu des images afin d’estimer la synchronisation d’un ensemble de flux vidéos. La cohérence géométrique des objets en mouvement présents dans chaque plan image est utilisée pour estimer ce décalage. Nous présentons tout d’abord deux méthodes d’analyse spatiale. Dans un premier temps, la synchronisation est déduite de la mise en correspondance de points d’intérêts dans les plans rectifiés. Un appariement dynamique des trajectoires en correspondance est utilisé dans le cas contraire où la géométrie épipolaire n’est pas connue. Cette étude présente également deux méthodes d’analyse fréquentielle. La première approche consiste à corréler les traces laissées sur chaque ligne épipolaire par le passage des objets en mouvement. Le décalage est alors déduit du positionnement d’un pic d’intensité dans l’image de corrélation fréquentielle. L’originalité de cette méthode a conduit au dépôt d’un brevet européen par THALES et l’Université Pierre et Marie Curie. Une deuxième approche consiste à corréler des volumes extraits autour des objets en mouvement entre les flux vidéos. L’utilisation du domaine fréquentiel permet de réduire les temps de calculs trop coûteux observés avec des méthodes de mise en correspondance spatiale. Notre étude montre que cette corrélation permet une estimation fiable pour un grand nombre de points d’intérêt et sous certaines contraintes géométriques (notamment de pose-caméra). La deuxième partie de cette thèse est consacrée aux méthodes de reconstruction 3D par analyse d’images. Dans le cadre d’acquisitions monoculaires calibrées, les algorithmes de "structure et mouvement" sont présentés. Une implémentation dans la carte graphique (GPU) est utilisée pour obtenir des résultats temps réel (30Hz) dans le cas de capteurs stéréoscopiques, et finalement les algorithmes de colorisation volumique sont envisagés pour des réseaux de caméras. L’exploitation des données 3D est enfin proposée dans le cadre d’un démonstrateur de réalité augmentée. Cette application permet l’incrustation temps réel des objets synthétiques reconstruits pour des applications de type environnement urbain. Une méthode de calibrage externe qui s’appuie sur l’identification de marqueurs infrarouges dans la scène est alors proposée pour pallier les contraintes logistiques des marqueurs spatiaux.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (171 p.)
  • Annexes : Bibliogr. p. 170-171.. Bibliogr. p. réf. bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Université Pierre et Marie Curie. Bibliothèque Universitaire Pierre et Marie Curie . Section Mathématiques-Informatique Recherche.
  • Consultable sur place dans l'établissement demandeur
  • Cote : T PARIS 6 2008 162
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.