Compression vidéo fondée sur l'apparence

par Karl Schwerdt

Thèse de doctorat en Imagerie, Vision et Robotique

Sous la direction de James L Crowley.


  • Résumé

    Cette thèse présente une nouvelle technique pour la compression de données vidéo numériques, appelée le Codage de Bases Orthonormales (CBO). Des algorithmes de vision par ordinateur, de compression de données, et d'identification de configuration sont combinés pour donner une méthode de codage en trois étapes. CBO recueille des informations sur le contenu d'une image sans utiliser de modèles. Au lieu de cela, il est basé sur l'apparence d'objets. Les techniques basées sur l'apparence utilisent des représentations orthonormales de l'espace de base des objets, habituellement dans l'espace propre, et exploitent les propriétés géométriques de ces représentations d'objet. Dans une séquence d'images d'un objet, chaque image est un point dans l'espace engendré par la base orthonormale utilisée. Une concentration sur un objet représente une normalisation des données visuelles d'entrée d'un objet principal. Étant donné les domaines d'application pour la compression vidéo, le visage d'un locuteur comme objet principal est un choix normal. Nous démontrons que CBO est une alternative valide aux techniques de compression vidéo conventionnelles. En fonction de la précision de la normalisation sur l'objet principal, le CBO montre une performance bien supérieure a celle des techniques conventionnelles

  • Titre traduit

    Appearance-based Video Compression


  • Résumé

    This thesis describes a new technique for the compression of digital video data, called Orthonormal Basis Coding (OBC). Algorithms from computer vision, data compression, and pattern recognition are combined to form its three-step encoding scheme. OBC gathers information about image content without using models. Instead, it is based on appearance. Appearance-based techniques use orthonormal basis space representations of objects, usually in eigenspace, and exploit geometrical properties of these object representations. From a sequence of images of an object, each image contributes a point in the orthonormal basis space used. Focusing on one object from a sequence means that we need to normalize our video input data to one principal object. Given the application areas for video compression, a talking head as principal object is a natural choice. We show that OBC is a valid alternative to conventional video compression techniques. If the input video stream is well normalized to the principal object, OBC outperforms conventional compression techniques

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (192 p.)
  • Annexes : Bibliographie p. 183-189. Index

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire Joseph-Fourier.
  • Disponible pour le PEB
  • Cote : TS01/INPG/0035

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire Joseph-Fourier.
  • Non disponible pour le PEB
  • Cote : MF-2001-SCH
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.