Représentations parcimonieuses adaptées à la prédiction d'images

par Aurélie Martin

Thèse de doctorat en Traitement du signal et télécommunications

Soutenue en 2010

à Rennes 1 .


  • Résumé

    La compression numérique est devenue un outil indispensable pour la transmission et le stockage de contenus multimédias de plus en plus volumineux. Pour répondre à ces besoins, la norme actuelle de compression vidéo, H. 264/AVC, se base sur un codage prédictif visant à réduire la quantité d'information à transmettre. Une image de prédiction est générée, puis soustraite à l'originale pour former une image résiduelle contenant un minimum d'information. La prédiction H. 264/AVC de type intra repose sur la propagation de pixels voisins, le long de quelques directions prédéfinies. Bien que très efficace pour étendre des motifs répondants aux mêmes caractéristiques, cette prédiction présente des performances limitées pour l'extrapolation de signaux bidimensionnels complexes. Pour pallier cette problématique, les travaux de cette thèse proposent un nouveau schéma de prédiction basée sur les représentations parcimonieuses. Le but de l'approximation parcimonieuse est ici de rechercher une extrapolation linéaire approximant le signal analysé en termes de fonctions bases, choisies au sein d'un ensemble redondant. Les performances de cette approche ont été éprouvées dans un schéma de compression basé sur la norme H. 264/AVC. Nous proposons également un nouveau schéma de prédiction spatiale inter-couches dans le cadre de la compression « scalable » basé sur H. 264/SVC. Le succès de telles prédictions repose sur l'habileté des fonctions de base à étendre correctement des signaux texturés de natures diverses. Dans cette optique, nous avons également exploré des pistes visant la création de panels de fonctions de base, adaptées pour la prédiction de zones texturées.

  • Titre traduit

    Sparse representations for image prediction


  • Résumé

    Digital compression has become an essential tool for transmission and storage of increasingly large multimedia content. To meet these needs, the current standard for video compression, H. 264/ AVC, is based on a predictive encoding to reduce the amount of information transmitted. An image prediction is generated, and then subtracted to the original to form a residual image containing few information. H. 264/AVC intra prediction is based on the spread of neighboring pixels, along some predefined directions. Although very effective to extend pattern with the same characteristics, this prediction has limited performances to extrapolate complex two-dimensional signals. To mitigate this problem, this thesis work offer a new prediction scheme based on sparse representations. The goal of sparse approximation techniques is to look for a linear expansion approximating the analyzed signal in terms of functions chosen from a large and redundant set. Performances of this approach have been proven in a compression scheme based on H. 264/AVC standard. We also propose a new spatial inter-layer prediction scheme within the framework of scalable H. 264/SVC-based compression. The success of such predictions is based on the skill of basis functions to properly extend textured signals of various kinds. Accordingly to this, we have also explored solutions to create panels of basis functions adapted for the textured areas prediction.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (145 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 139-142

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Section sciences et philosophie.
  • Disponible pour le PEB
  • Cote : TA RENNES 2010/161
  • Bibliothèque : Centre de recherche INRIA Rennes - Bretagne Atlantique. Service IST.
  • PEB soumis à condition
  • Cote : I.4 - MAR
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.