From 2D to stereoscopic-3D visual saliency : revisiting psychophysical methods and computational modeling

par Junle Wang

Thèse de doctorat en Automatique et informatique appliquée, Traitement du signal et des images

Sous la direction de Patrick Le Callet et de Vincent Ricordel.

Le président du jury était Frédéric Dufaux.

Les rapporteurs étaient Anne Guérin-Dugué.

  • Titre traduit

    Saillance visuelle, de la 2D à la 3D stéréoscopique : examen des méthodes psychophysiques et modélisation computationnelle


  • Résumé

    L’attention visuelle est l’un des mécanismes les plus importants mis en oeuvre par le système visuel humain (SVH) afin de réduire la quantité d’information que le cerveau a besoin de traiter pour appréhender le contenu d’une scène. Un nombre croissant de travaux est consacré à l’étude de l’attention visuelle, et en particulier à sa modélisation computationnelle. Dans cette thèse, nous présentons des études portant sur plusieurs aspects de cette recherche. Nos travaux peuvent être classés globalement en deux parties. La première concerne les questions liées à la vérité de terrain utilisée, la seconde est relative à la modélisation de l’attention visuelle dans des conditions de visualisation 3D. Dans la première partie, nous analysons la fiabilité de cartes de densité de fixation issues de différentes bases de données occulométriques. Ensuite, nous identifions quantitativement les similitudes et les différences entre carte de densité de fixation et carte d’importance visuelle, ces deux types de carte étant les vérités de terrain communément utilisées par les applications relatives à l’attention. Puis, pour faire face au manque de vérité de terrain exploitable pour la modélisation de l’attention visuelle 3D, nous procédons à une expérimentation oculométrique binoculaire qui aboutit à la création d’une nouvelle base de données avec des images stéréoscopiques 3D. Dans la seconde partie, nous commençons par examiner l’impact de la profondeur sur l’attention visuelle dans des conditions de visualisation 3D. Nous quantifions d’abord le " biais de profondeur " lié à la visualisation de contenus synthétiques 3D sur écran plat stéréoscopique. Ensuite, nous étendons notre étude avec l’usage d’images 3D au contenu naturel. Nous proposons un modèle de l’attention visuelle 3D basé saillance de profondeur, modèle qui repose sur le contraste de profondeur de la scène. Deux façons différentes d’exploiter l’information de profondeur par notre modèle sont comparées. Ensuite, nous étudions le biais central et les différences qui existent selon que les conditions de visualisation soient 2D ou 3D. Nous intégrons aussi le biais central à notre modèle de l’attention visuelle 3D. Enfin, considérant que l’attention visuelle combinée à une technique de floutage peut améliorer la qualité d’expérience de la TV-3D, nous étudions l’influence de flou sur la perception de la profondeur, et la relation du flou avec la disparité binoculaire


  • Résumé

    Visual attention is one of the most important mechanisms deployed in the human visual system to reduce the amount of information that our brain needs to process. An increasing amount of efforts are being dedicated in the studies of visual attention, particularly in computational modeling of visual attention. In this thesis, we present studies focusing on several aspects of the research of visual attention. Our works can be mainly classified into two parts. The first part concerns ground truths used in the studies related to visual attention ; the second part contains studies related to the modeling of visual attention for Stereoscopic 3D (S-3D) viewing condition. In the first part, our work starts with identifying the reliability of FDM from different eye-tracking databases. Then we quantitatively identify the similarities and difference between fixation density maps and visual importance map, which have been two widely used ground truth for attention-related applications. Next, to solve the problem of lacking ground truth in the community of 3D visual attention modeling, we conduct a binocular eye-tracking experiment to create a new eye-tracking database for S-3D images. In the second part, we start with examining the impact of depth on visual attention in S-3D viewing condition. We firstly introduce a so-called “depth-bias” in the viewing of synthetic S-3D content on planar stereoscopic display. Then, we extend our study from synthetic stimuli to natural content S-3D images. We propose a depth-saliency-based model of 3D visual attention, which relies on depth contrast of the scene. Two different ways of applying depth information in S-3D visual attention model are also compared in our study. Next, we study the difference of center-bias between 2D and S-3D viewing conditions, and further integrate the center-bias with S-3D visual attention modeling. At the end, based on the assumption that visual attention can be used for improving Quality of Experience of 3D-TV when collaborating with blur, we study the influence of blur on depth perception and blur’s relationship with binocular disparity.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 2 vol. (223,71 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Réf. Bibliogr. (vol. 1)

Où se trouve cette thèse ?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. BU Sciences.
  • Non disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.