Ondelettes et décompositions spatio-temporelles avancées : application au codage vidéo scalable

par Grégoire Pau

Thèse de doctorat en Signal et images

Sous la direction de Béatrice Pesquet-Popescu et de Basarab Mateï.

Soutenue en 2006

à Paris, ENST .


  • Résumé

    Les progrès récents sur les schémas de codage vidéo par ondelettes ont permis l'apparition d'une nouvelle génération de codeurs vidéos scalables t+2D dont l'efficacité est comparable à celle des meilleurs codecs hybrides. Ces schémas reposent sur l'utilisation d'une transformée en ondelettes appliquée le long du mouvement des images afin d'exploiter leur redondance temporelle, suivie d'une décomposition spatiale des sous-bandes résultantes et d'un codage entropique. L'objectif de cette thèse consiste en l'étude et la construction de nouvelles transformées scalables mises en jeu dans le schéma de codage vidéo t+2D, afin d'en améliorer l'efficacité de codage. L'utilisation du formalisme lifting lors de la construction de ces transformées spatio-temporelles permet l'introduction d' opérateurs non-linéaires, particulièrement utiles pour représenter efficacement les singularités et discontinuités présentes dans une séquence vidéo. Dans un premier temps, nous nous intéressons à l'optimisation et la construction de nouvelles transformées temporelles compensées en mouvement, afin d'améliorer leur performance de décorrelation. Nous étudions alors la construction de filtres M-bandes pour décomposer spatialement les sous-bande temporelles et nous montrons comment les propriétés de scalabilité des bancs de synthèse M-bandes peuvent être étendues à des facteurs rationnels quelconques. Enfin, nous décrivons comment mettre en oeuvre des décompositions spatiales en ondelettes adaptatives, non-linéaires et inversibles, sans nécessiter la transmission d'une carte de décisions.

  • Titre traduit

    Wavelets and advanced spatio-temporal decompositions with an application to scalable video coding


  • Résumé

    Some of the most powerful schemes for scalable video coding are based on the recent t+2D paradigm, which has been shown to outperform the best hybrid video codecs. In these schemes, temporal redundancy is first exploited through a motion-compensated multiresolution decomposition and the resulting temporal subband frames are then spatially decomposed with a wavelet transform. My research works consist in designing wavelet-based and non-linear scalable decompositions, able to efficiently capture the spatio-temporal redundancy present in video sequences. The following main directions have been followed. First, we show how we can design highly efficient temporal lifted transforms, in order to improve the coding gain of the underlying video codec. We then investigate into M-band filters banks, used to spatially decompose the temporal subbands and show how their scalability features can be extended to non-dyadic factors. At last, we present some reversible and adaptive wavelet decompositions that can efficiently capture the directional nature of images without transmitting any side information.

Autre version

Cette thèse a donné lieu à une publication en 2007 par École nationale supérieure des télécommunications à Paris

Ondelettes et décompositions spatio-temporelles avancées : application au codage vidéo scalable


Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (220 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 165 réf. bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
  • Cote : 7.342 PAU
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.
Cette thèse a donné lieu à 1 publication .

Consulter en bibliothèque

Cette thèse a donné lieu à une publication en 2007 par École nationale supérieure des télécommunications à Paris

Informations

  • Sous le titre : Ondelettes et décompositions spatio-temporelles avancées : application au codage vidéo scalable
  • Dans la collection : ENST , 2006E034 , 0751-1353
  • Détails : 1 vol. (220 p.)
  • Notes : En appendice, un article en anglais.
  • Annexes : Bibliogr. p. 209-218. Glossaire. Index. Résumé
La version de soutenance de cette thèse existe aussi sous forme papier.

Où se trouve cette thèse ?

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.