Intégration des propriétés binoculaires du SHV pour l'optimisation du codage et de la mesure de la qualité d'images stéréoscopiques

par Rafik Bensalma

Thèse de doctorat en Traitement du signal et des images

Soutenue en 2011

à Poitiers .


  • Résumé

    Les travaux réalisés dans cette thèse s'inscrivent dans le cadre de l'imagerie stéréoscopique, particulièrement liés à la compréhension de la perception binoculaire et son application dans le processus d'appariement, le codage et la mesure de la qualité. La perception 3D engage des mécanismes divers dans le cerveau visul dont la fusion binoculaire qui a fait l'objet d'une multitude de travaux pluridisciplinaires ayant pour objectif sa compréhension et/ou sa modélisation. Ainsi, plusieurs modélisations ont été proposées dans la littérature ne prenant pas forcément en compte l'aspect biologique ou cognitif. Pour pallier à ce déficit, nous avons proposé une approche d'appariement d'images stéréoscopiques s'inspirant du fonctionnement des cellules simples et complexes, responsables de la fusion binoculaire. L'énergie binoculaire dégagée localement par une paire stéréoscopique est ainsi estimée à travers les cellules complexes ayant pour entrées les réponses des cellules simples caractérisées par leur taille, amplitude, phase et orientation. Dans l'optique d'optimiser l'appariement, le modèle précédent a été étendu afin de prendre en compte d'autres contraintes stéréoscopiques à caractère global comme l'unicité, l'ordre, la cohérence,. . . Il permet ainsi de classer l'information contenue dans la paire stéréoscopique en tant qu'information : appariée, occultée appariée, occultée non appariée ou supprimée par la rivalité binoculaire. Le résultat de l'approche proposée se décline sous la forme d'une carte de disparité relatant les décalages existant entre les éléments appariés. En ce qui concerne le codage des paires d'images stéréoscopiques, nous avons proposé trois approches de réduction de la redondance. La première est basée sur les transformations géométriques des deux images comme la translation et la rotation. Dans la seconde approche, nous avons exploité la compensation et la suppression binoculaires survenant dans le cas d'un déséquilibre du contenu (asymétrique) entre les deux images de la paire. Enfin la troisième et dernière approche est basée sur le modèle décrit précédemment. Afin de mesurer les dégradations sur des paires d'images stéréoscopiques, il est indispensable de disposer de métriques de qualité adaptée. Or, dans la littérature, il n'existe aucune vraie métrique de qualité stéréoscopique. Nous avons ainsi proposé une métrique purement 3D décrivant la qualité sous la forme d'une variation de l'énergie binoculaire générée à différentes échelles par les paires stéréoscopiques.

  • Titre traduit

    Integration of binocular properties of HVS for coding optimization and quality assessment of sterescopic images


  • Résumé

    The work present in this thesis is a part of stereoscopic imaging. Particularly, it is related to the understanding of binocular perception and its application in the matching process, coding and quality measurement. 3D perception involves different mechanisms in the brain including the visual binocular fusion. Binocular fusion is the subject of a multitude of interdisciplinary work with the objectives of understanding and/or modeling. Thus, several models had been proposed in the literature. These models did not take into account the biological and cognitive aspects. To overcome this deficiency, we propose a stereo matching approach for stereo images. The proposed approach is inspired by the function of simple and complex cells. Thus, the responses of simple cells, characterized by their size, amplitude, phase and orientation, are considered as input to complex cell. In order to optimize the matching, the previous model is extended to take into account the other global stereoscopic contraints, such as uniqueness, order and coherence. It allows to classify the information of stereoscopic images into paired, unpaired. The result of the proposed approach is represented by a disparity map and binocular energy map. In order to develop an efficient stereo coder, we propose three approaches to reduce redundancy. The first approach is based on the geometric transformations of the two images such as translation and rotation. In the second approach, we have exploited the phenomenon of binocular compensation/suppression. The phenomenon occurs in the case of imbalance content between the two stereoscopic images. Finally, the third approach is based on the binocular energy model which is described above. To measure the degradation of stereoscopic images pairs, it is essential to have appropriate quality metrics can not represent truly the stereo quality prediction. Therefore, we have proposed a purely 3D metric describing the quality as a variation of the binocular energy generated at different scales by stereoscopic pairs.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XIII-166 p.)
  • Annexes : Bibliogr. 214 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Poitiers. Service commun de la documentation. Section Sciences, Techniques et Sport.
  • Non disponible pour le PEB
  • Bibliothèque : Université de Poitiers. Service commun de la documentation. Antenne du Futuroscope.
  • PEB soumis à condition
  • Cote : SN-56
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.