Méthodes d'analyse-synthèse en vision monoculaire dynamique : application au clonage de visages en visiophonie tridimensionnelle

par Laurent Peyronny

Thèse de doctorat en Opto-acousto-électronique

Sous la direction de Christian Roux et de Faouzi Ghorbel.

Soutenue en 2000

à Valenciennes .


  • Résumé

    L'aboutissement des techniques d'analyse développées dans le cadre de la vision par ordinateur a favorisé l'avènement de la norme mpeg-4, conséquence d'un intérêt grandissant sur les technologies multimédia et de réalité virtuelle, comme l'animation de clones 3D de visage. En asseyant l'acuité visuelle des systèmes intelligents sur les bases de la géométrie projective, l'ingénierie de la vision a pu décrire avec succès les phénomènes de la création d'images et les propriétés communes à plusieurs projections (images) d'une même scène tridimensionnelle. Les deux premiers chapitres dressent un large aperçu des problèmes classiques de vision tridimensionnelle. La détermination de la géométrie et du mouvement 3D d'un solide en mouvement à partir d'une séquence d'images acquise par une seule camera fixe non-calibrée est un problème dual non encore adressé dans la littérature. L'originalité de ce travail consiste en l'établissement d'une méthode de reconstruction tridimensionnelle fondée sur le principe d'analyse-synthèse. Le processus d'analyse se décline en trois étapes successives de segmentation, d'appariement et de classification : une famille de descripteurs invariants algébriques projectifs permet d'interpréter la nature du mouvement tridimensionnel des points précédemment appariés sur les images par un algorithme de Block-Matching. La synthèse tridimensionnelle est alors réalisée par l'action conjointe de deux algorithmes de reconstruction fondés sur l'hypothèse de mouvement et ayant des fonctionnements duaux d'estimation et de calcul des attributs tridimensionnels de l'ensemble de points ainsi décrits. Ces approches constituent une réelle boite à outils que nous avons mis en pratique dans un schéma de codage compatible MPEG-4 dédié au clonage 3D de visages humains. Dans la pratique, les limites de la précision numérique de ces derniers ne nous ont pas permis de reconstruire la structure tridimensionnelle des objets à partir des images réelles. Cependant, la mise en œuvre de ces outils sur des séquences synthétiques laisse présager de nombreuses et fructueuses perspectives. A défaut de présenter une méthode performante, cette thèse indique de manière précise quels sont les efforts à mener pour réaliser une analyse/synthèse robuste de scène 3D.

  • Titre traduit

    Analysis-synthesis methods in dynamical monocular computer vision : application to face cloning in 3D videophone systems


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (VIII-197 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Annexes. Bibliogr. p.[183]-197

Où se trouve cette thèse ?

  • Bibliothèque : Université de Valenciennes et du Hainaut-Cambrésis. Service commun de la documentation. Site du Mont Houy.
  • Disponible sous forme de reproduction pour le PEB
  • Cote : 904868 TH
  • Bibliothèque : Université de Valenciennes et du Hainaut-Cambrésis. Service commun de la documentation. Site du Mont Houy.
  • Disponible pour le PEB
  • Cote : 904869 TH

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : MF-2000-PEY
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.