Stratégies d'encodage pour codeur vidéo scalable

par Yohann Pitrey

Thèse de doctorat en Traitement du signal et de l'image

Soutenue en 2009

à Rennes, INSA .


  • Résumé

    La multiplication des moyens de transmission et la diversification des appareils capables de lire du contenu vidéo contraignent les diffuseurs à dépenser beaucoup de temps et de moyens pour être en mesure de fournir une qualité de vidéo optimale quel que soit le contexte. La vidéo scalable a été développée en réponse à ce besoin d'adaptation des contenus vidéo aux différents contextes de diffusion. Le standard H. 264/MPEG-4 SVC (Scalable Video Coding) propose trois types de scalabilité (spatiale, temporelle et en qualité), qui permettent d'adapter la résolution, le nombre d'images par seconde et la qualité du flux en fonction des besoins. Un flux vidéo unique est encodé, contentant plusieurs couches de résolution différentes codées les unes par rapport aux autres, de façon à rendre le codage de l'ensemble plus efficace. La régulation de débit permet d'adapter le débit en sortie de l'encodeur pour respecter des contraintes liées à la transmission ou au décodage du flux vidéo. À partir d'une consigne donnée, le budget à respecter est réparti entre les différents éléments du flux. Un modèle de débit est ensuite utilisé pour anticiper le comportement du débit en fonction des paramètres d'encodage afin de respecter les contraintes imposées au flux. A partir de cette problématique, deux approches sont proposées. La première se base sur un pré-encodage de chaque image pour fournir une base de calcul au modèle de débit. Elle permet d'obtenir une régulation très précise, avec une erreur entre le budget alloué et le débit effectif inférieure à 7% sur les trois types de scalabilité. La seconde approche utilise les informations rassemblées dans les images précédentes comme base pour le modèle de débit de l'image à encoder. Elle ne requiert pas de pré-encodage, et ne pénalise pas la complexité du processus d'encodage. En outre, la perte de performances par rapport à l'approche en deux passes est minime et la consigne de débit par seconde est respectée de manière précise. Enfin, une méthode permettant de réduire les variations de la qualité est proposée pour améliorer l'impression visuelle ressentie par l'utilisateur. Les résultats montrent que la méthode présentée est capable de réguler le débit avec une grande précision sur les trois types de scalabilité, tout en réduisant les variations de la qualité et en conservant une complexité de calculs très faible. Ces atouts la rendent non seulement intéressante du point de vue des performances, mais également applicable dans des contextes pratiques où les ressources en temps sont limitées.

  • Titre traduit

    Encoding strategies for scalable video coding


  • Résumé

    This work is about designing bit rate control technics for the MPEG-4 Scalable Video Coding standard. The proposed approach benefits from a low computational complexity, so that its impact on the encoding time is very small. The quality of the encoded stream is also considered when controlling the bitrate in order to obtain optimal visual impression. This work is about designing bit rate control technics for the MPEG-4 Scalable Video Coding standard. The proposed approach benefits from a low computational complexity, so that its impact on the encoding time is very small. The quality of the encoded stream is also considered when controlling the bitrate in order to obtain optimal visual impression. With today's heterogeneous communication technologies and video-reading devices, broadcasting video content requires large amounts of time and money to provide the user with optimal quality in any context. Scalable video coding has been developed as an answer to this need for adaptive video streams. In 2008, the MPEG-4 Scalable Video Coding (SVC) extension was finalized. To address the adaptivity issues, this new standard provides three types of scalabilities. Spatial, temporal and quality scalabilities allow a video stream to adapt the dimensions, the number of frames per second and the fidelity depending on the target's requirements. Bit rate control is an important part of the encoding process as it allows to adapt the bitrate at the output of the encoder to the target's constraints. Unlike most of the existing approaches, our rate control technic is designed to have a low computational complexity. First, a bit rate per second constraint is specified for each video layer. Then, the available bits are dispatched among frames so that constant quality can be achieved in the decoded stream. The respect of the specified budget is finally enforced by a bit rate model, based on a simple and effective framework called rho-domain. Using the statistics of the frame, this model allows us to choose the optimal quantization parameter while maintaining the amount of calculations very low. Based on this simple technic, we propose two approaches. In the first approach, each image is pre-encoded to provide the bit rate model with the statistics of the frame before rate control. This approach allows us to regulate the bit rate with great accuracy, as the bit rate error is below 7% of the specified constraint on each type of scalability. In the second approach, rate control is performed using the information from the previous frame, so that no pre-encoding step is required and each frame is encoded only once. Thus, the impact on the encoding process is greatly reduced, at the cost of a small error increase. Finally, perceptual quality is considered when dispatching the bits among frames, so that quality variations are reduced and visual experience is improved. Our bit rate control technic for MPEG-4 SVC shows great accuracy on all spatial, temporal and quality scalabilities. Its low complexity, together with quality variation control make it a valuable contribution, especially in practical applications, for which time ressources are limited and the user-felt quality is important.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. 195 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr.p.183-190 (14 réf.). Index

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Institut National des Sciences Appliquées. Bibliothèque.
  • Disponible pour le PEB
  • Cote : 621.382 PIT

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2009ISAR0017
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.