Modeling the Perceptual Similarity of Static and Dynamic Visual Textures : application to the Perceptual Optimization of Video Compression

par Karam Adil Naser

Thèse de doctorat en Sciences et technologies de l’information et de la communication

Sous la direction de Patrick Le Callet et de Vincent Ricordel.

Le président du jury était Olivier Déforges.

Le jury était composé de Amy Reibman, Marta Mrak, Marc Antonini.

Les rapporteurs étaient Jens-Rainer Ohm, Marco Cagnazzo.

  • Titre traduit

    Modélisation de la similarité perceptuelle de textures visuelles statiques et dynamiques : application à l’optimisation perceptuelle de la compression vidéo


  • Résumé

    Les textures sont des signaux particuliers dans la scène visuelle, où elles peuvent couvrir de vastes zones. Elles peuvent être classées en deux catégories : statique et dynamique, où les textures dynamiques impliquent des variations temporelles. Plusieurs travaux sur la perception des textures statiques ont permis de définir des mesures de similarité visuelle pour des applications comme la reconnaissance ou la classification de textures. Ces mesures utilisent souvent une représentation inspirée du traitement neuronal du système visuel humain. Cependant de telles approches ont été peu explorées dans le cas de textures dynamiques. Dans cette thèse, un modèle perceptuel généralisé pour la mesure de similarité applicable aux textures statiques et dynamiques, a été développé. Ce modèle est inspiré du traitement effectué dans le cortex visuel primaire. Il s’avère très efficace pour des applications de classification et de reconnaissance de textures. L’application du modèle dans le cadre de l’optimisation perceptuelle de la compression vidéo, a été également étudiée. En particulier, l’intégration de la mesure de similarité entre textures, a été utilisée pour l’optimisation débit-distorsion de l’encodeur. Les résultats expérimentaux avec observateurs humains montrent une qualité visuelle améliorée des vidéos ainsi codés/décodées, avec une réduction significative du débit par rapport aux approches traditionnelles.


  • Résumé

    Textures are special signals in the visual scene, where they can cover large areas. They can be classified into two categories: static and dynamic, where dynamic textures involve temporal variations. Several works on the perception of static textures made it possible to define visual similarity measurements for applications such as the recognition or classification of textures. These measures often use a representation inspired by the neural processing of the human visual system. However, such approaches have been little explored in the case of dynamic textures. In this thesis, a generalized perceptual model for the measurement of similarity applicable to static and dynamic textures has been developed. This model is inspired by the processing performed in the primary visual cortex. It is very effective for texture classification and recognition applications. The application of the model in the context of the perceptual optimization of video compression, was also studied. In particular, the integration of the similarity measure between textures, was used for the rate-distortion optimization of the encoder. Experimental results with human observers showed an improved visual quality of the decoded videos, with a significant reduction in the bitrate compared to the traditional approaches.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.