Thèse soutenue

Understanding binocular perception for the estimation of visual fatigue, visual attention and quality of experience for stereoscopic content

FR  |  
EN
Auteur / Autrice : Iana Iatsun
Direction : Christine Fernandez-MaloigneMohamed-Chaker Larabi
Type : Thèse de doctorat
Discipline(s) : Traitemement du signal et des images
Date : Soutenance le 27/11/2014
Etablissement(s) : Poitiers
Ecole(s) doctorale(s) : École doctorale Sciences et ingénierie pour l'information, mathématiques (Limoges ; 2009-2018)
Partenaire(s) de recherche : Laboratoire : SIC
faculte : Université de Poitiers. UFR des sciences fondamentales et appliquées
Jury : Président / Présidente : Fabrice Mériaudeau
Examinateurs / Examinatrices : Christine Fernandez-Maloigne, Mohamed-Chaker Larabi, Patricia Ladret, Jérôme Fournier
Rapporteurs / Rapporteuses : Fabrice Mériaudeau, Faouzi Alaya Cheikh

Résumé

FR  |  
EN

L'avènement de la technologie 3D stéréoscopique (3DS) a produit autant d'enthousiasme que l'introduction de la télévision couleur. Contrairement à la télévision couleur 2D, la 3DS est loin d'être un processus naturel de vision puisqu'il repose sur le fait de tromper le cerveau en lui donnant des disparités qui n'existent pas dans la réalité. Par conséquent, cette vision non naturelle peut générer une fatigue visuelle et altérer la qualité, sans parler de certains phénomènes physiologiques et cognitifs peu explorés à ce jour. Cette thèse aborde l'étude de la perception binoculaire sous trois angles différents: 1- la fatiguevisuelle, 2- l'attention visuelle et, 3- la Qualité de l'Expérience (QdE). Tout d'abord, nous avons proposé un paradigme psychophysique entièrement contrôlé afin d’évaluer la fatigue visuelle et d’étudier le lien existant avec les caractéristiques visuelles les plus importantes obtenues par oculométrie. Ainsi, nous avons montré que l'accumulation de la fatigue visuelle causée par la 3DS est fortement plus élevée que celle causée par la 2D. Nous avons également proposé un modèle de prédiction de la fatigue visuelle basé sur les principales conclusions de l’étude et faisant appel aux paramètres intrinsèques dela vidéo. Une autre exploration fondamentale a été menée pour étudier l'impact de la disparité sur la perception des couleurs. Ainsi, les expériences subjectives, conduites avec des stimuli simples, ont montré la faible influence de la disparité dans ladiscrimination des couleurs. Cette importante conclusion confirme le fait que la perception de la profondeur repose non seulement sur des indices binoculaires mais aussi sur des indices monoculaires. La deuxième partie de la thèse porte sur l'étude de l'attention visuelle binoculaire et propose des modèles permettant de prédire des cartes de saillance d'une séquence 3D. L'idée repose sur l'utilisation des caractéristiques spatiotemporelles et la possibilité de prédire avec précision la profondeur à partir d’une seule vue de la paire stéréo. Par conséquent, le modèle proposé, incluant une étape de fusion optimisée, a montré de très bonnes performances en accord avec la vérité de terrain (l’attention visuelle). Enfin, les propriétés binoculaires du système visuel humain, telles que la fusion binoculaire et la rivalité, ont été exploitées conjointement avec la saillance prédite dans l’optique de proposer une mesure objective de la qualité stéréoscopique. La métrique de qualité proposée a été testée sur des bases d’images de référence et ses résultats montrent une bonne corrélation avec le jugement humain.