De l'optimisation globale à l'optimisation locale psycho-visuelle en codage vidéo

par Philippe Guillotel

Thèse de doctorat en Traitement du signal et télécommunications

Sous la direction de Christine Guillemot.

Soutenue en 2012

à Rennes 1 .


  • Résumé

    Le codage est un maillon essentiel de la chaîne de production-distribution-rendu vidéo. Il détermine la qualité perçue par l'observateur et participe à l'appréciation globale de la qualité d'expérience (ou QoE). Un codeur vidéo est un système complexe qui met en œuvre de nombreux aspects et nécessite un savoir faire spécifique pour spécifier le bon algorithme de codage en fonction des contraintes applicatives. Ce travail parcourt les principaux points à considérer, propose des solutions innovantes et montre leurs efficacités. La première partie est une introduction au codage vidéo et aux formats d'images avec quelques rappels des principes généraux nécessaires à la compréhension de ce mémoire. Les notions d'échantillonnage spatial et temporel et les bases de la colorimétrie en vidéo sont rappelées, pour présenter ensuite le codage proprement dit. Les différents mécanismes utilisés sont présentés, ainsi que les principaux standards de codage pertinents au regard de ce travail. L'impact des différents formats vidéo sur le codage est aussi abordé pour démontrer que le format progressif présente de nombreux intérêts, mais n'est pas encore largement utilisé du fait de la compatibilité requise avec l'existant. Enfin l'importance de connaître le contexte applicatif est discutée, en particulier dans le cadre de codage adapté aux formats vidéo de très hautes qualités utilisés en production professionnelle. La deuxième partie est consacrée aux algorithmes globaux d'optimisation basés complexité-distorsion et débit-distorsion, où la distorsion est principalement la minimisation de la différence mathématique entre le signal décodé et l'original. Un premier chapitre aborde l'adéquation de l'algorithme avec la plate-forme de codage cible. Dans ce mémoire la cible sera un circuit intégré considéré aujourd'hui comme le plus performant de sa génération. Un focus particulier est effectué dans les autres chapitres sur les techniques, fondamentales en codage vidéo, d'adaptation du codage au signal, au canal et à l'utilisateur. La troisième partie aborde une voie de recherche qui semble gagner un certain intérêt dans le monde académique, celui du codage perceptuel local. Après l'introduction des notions de modélisation du système visuel humain, de métriques de distorsion et d'aspect subjectifs, différentes recherches sont présentées. Elles introduisent l'aspect d'adaptation locale du codage dans l'image basée sur la perception. Autrement dit comment chaque région d'une image peut-elle être codée pour subjectivement donner une meilleure impression. C'est une voie assez récente en codage mais elle ouvre de nouvelles perspectives non encore complètement explorées. Enfin des extensions ou des perspectives complémentaires aux travaux de ce mémoire sont proposées dans la conclusion.

  • Titre traduit

    From global optimization to local psycho-visual optimization in video coding


  • Résumé

    Video coding is an essential part of the production-delivery-rendering video chain. The efficiency of the coding scheme gives the quality perceived by the final user and contributes to the evaluation of the quality of experience (or QoE). A video encoder is a complex system with many different aspects requiring a specific know-how to specify the right algorithm for the considered application. This work deals with the main topics to be considered, proposes innovative solutions and discusses their respective performances. The first part is an introduction to the coding of video signals with some remainders on the general principles necessary to understand this thesis. Spatial sampling, temporal sampling and colorimetry theories are first discussed, and the encoding is introduced just after. The different tools and mechanisms are described, as well as the main existing standards relevant regarding this work. The video formats impact is discussed to demonstrate the interest of the progressive scanning format, even if it is not yet largely diploid because of the necessary backward compatibility. Finally, we demonstrate the importance of knowing the applicative context in a particular case, the professional video production where very high quality video is required. The second part is dedicated to the global optimisation issues based on both the complexity-distortion and rate-distortion functions, where the distortion is mainly the mathematical difference between the original and decoded signals. The first chapter introduces the adequacy between the algorithm and the considered platform. We discuss here a specific IC considered today as one of the most efficient IC of its generation. A particular focus is proposed in the other chapters regarding adaptive coding techniques for the signal, channel or user. The third part introduces a new research area recently attracting a lot of attention from the academic researchers, the local perceptual coding. After an introduction of the human visual system, distortion metrics and other subjective aspects, different research studies are presented. It is proposed to use local adaptation based on the human perception. In other words we propose to study how each picture area can be encoded to provide a better subjective quality. It is a recent research topic but it opens new perspectives not yet fully explored. Finally, extensions and perspectives are proposed in the conclusion to complete this work.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ([161 p.])
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr., 9 p.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Section sciences et philosophie.
  • Disponible pour le PEB
  • Cote : TA RENNES 2012/9
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.