Thèse soutenue

Compression et synthèse pour représentation de contenus immersifs adaptés au 6DoF

FR  |  
EN
Auteur / Autrice : Patrick Garus
Direction : Christine GuillemotFélix Henry
Type : Thèse de doctorat
Discipline(s) : Signal, image, vision
Date : Soutenance le 07/10/2022
Etablissement(s) : Rennes 1
Ecole(s) doctorale(s) : MATHSTIC
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Rennes, Bretagne-Atlantique) - SIROCCO
Jury : Président / Présidente : Luce Morin
Examinateurs / Examinatrices : Mathias Wien
Rapporteurs / Rapporteuses : Marek Domański, Mohamed-Chaker Larabi

Résumé

FR  |  
EN

Une nouvelle norme de codage vidéo immersive a été finalisée par le Moving Picture Experts Group (MPEG). Il s'agit de la norme MPEG Immersive Video (MIV), MPEG-I Part 12. La norme MIV peut être utilisée pour permettre une navigation libre dans une scène. Cependant, il ne faut pas s'attendre à une compression appropriée de la géométrie, car les codecs vidéo 2D largement utilisés ne prennent pas en charge les outils dédiés au codage de la profondeur. En outre, la compression de la géométrie présente plusieurs inconvénients, tels que des exigences plus élevées en termes de débit binaire et de taux de pixel. Dans cette thèse, Decoder Side Depth Estimation (DSDE) est proposé et développé comme un système de codage alternatif au MIV, qui offre un gain de codage significatif, des économies de taux de pixel et une meilleure qualité perceptuelle. Nous proposons en outre plusieurs nouvelles améliorations de DSDE, impliquant la transmission partielle de la géométrie, la transmission d'informations latérales et l'exploitation du flux binaire de la texture afin d'améliorer encore le gain de codage et de réduire la complexité. Enfin, nous montrons que nos propositions peuvent être utilisées pour améliorer les performances de méthodes de rendu plus récentes, basées sur les réseaux neuronaux, comme les images multiplans.