Compression de vidéo d'écrans d'avion

by Iulia Mitrica

Projet de thèse en Traitement du signal et des images

Sous la direction de Marco Cagnazzo et de Béatrice Pesquet-popescu.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec Laboratoire de Traitement et Communication de l'Information (laboratoire) et de Télécom ParisTech (établissement de préparation de la thèse) depuis le 01-03-2017 .


  • Résumé

    Sujet de thèse CIFRE avec la société Zodiac Compression de vidéo d'écrans d'avion Contexte de l'étude Dans le cadre du développement des produits aéronautiques, la société Zodiac développe des solutions d'acquisition et de traitement vidéo en environnement à fortes contraintes. Cette thèse s'inscrit dans une démarche de recherche pour l'amélioration de leurs systèmes de visualisation. Les informations sur les écrans avioniques présentent des caractéristiques spécifiques, notamment des informations textuelles et graphiques qui ne doivent pas être altérées par la compression. Or, la plupart des systèmes de compression très bas débit conduisent à des artefacts importants notamment au niveau des contours, qui rendraient inutilisables ces données. La compression de ce type de données pose donc des défis supplémentaires par rapport à la compression de vidéos classiques (aussi dites, naturelles). Des avancées ont été faites avec les extensions Screen Content de HEVC [1], mais il y a de la marge pour des gains importants. Approche proposée et méthodologie L'approche proposée vise à prendre en compte au niveau du codeur les spécificités des vidéos écrans d'avion, avec un codage adaptif, sémantique et par apprentissage. Nous envisageons de reconnaitre les parties différentes de l'image à coder : texte, graphiques, niveaux des indicateurs, éventuellement images de fond, et adopter donc un codage adaptif. En particulier, pour le texte et les éléments graphiques un codage sémantique est envisagé : le texte sera donc reconnu et codé en tant que tel, plutôt que comme un ensemble de pixels. Cela permettra une représentation sans pertes de cette information capitale. Par contre, les éléments les moins importants de l'image au niveau sémantique pourront être codés avec une technique « lossy », c'est-à-dire, avec perte d'information. Le débit épargné sur les parties moins importantes de la vidéo pourra être utilisé pour coder parfaitement les parties sensibles. Une phase d'apprentissage et classification est également envisagée. Le codeur reconnait le « type » d'écran d'avion qu'il a à coder, et y recherche les informations sensibles en conséquence. Les travaux préliminaires ont montré que la connaissance de la position de quelques lettres dans l'écran permet d'effectuer une classification très fiable du type d'écran. La classification à son tour permet de raffiner la reconnaissance du texte : si quelques lettres étaient perdues dans la première étape de reconnaissance, une fois que l'écran ait été correctement classifié à l'aide des lettres reconnues, il sera possible de lancer une nouvelle reconnaissance de texte adaptée aux informations a priori sur le type d'écran (par exemple, on s'attend d'avoir du texte dans certaines positions spécifiques, même si pas tout le texte a été retrouvé lors de la première itération). La classification joue donc un rôle majeur dans l'approche envisagée. Il s'agit d'une classification multi-classe, pour laquelle nous avons récemment développé une méthode originale de type Support Vector Machine (SVM) [2], qui présente des performances intéressantes notamment pour les problèmes présentant un nombre réduit d'exemples d'entrainement. L'enjeu consiste ici d'intégrer les critères de classification lors de la phase de compression directement, en combinant ces critères avec les approches classiques débit-distorsion. Calendrier provisionnel Les premiers mois seront consacrés à une étude approfondie de la littérature scientifique sur les sujets de la compression vidéo screen content, de la reconnaissance de texte, ligne, objet, et des méthodes de classification. Des méthodes de compression d'écrans d'avion de référence (c'est-à-dire, basées sur les normes telles que HEVC) seront mises en place. Une première version du codeur avec classification et codage sémantique peut être également réalisée dans le premiers mois de la thèse. La deuxième partie de la thèse sera consacrée à la conception, la mise en œuvre et l'expérimentation de méthodes de plus en plus raffinées et efficaces pour les différentes taches du codeur : la reconnaissance de texte, le codage sémantique et adaptif, la classification. Encadrement et environnement de travail La thèse se déroule dans le cadre d'une collaboration entre l'équipe Multimédia de Télécom ParisTech, sous la supervision de Marco Cagnazzo et Béatrice Pesquet, et l'équipe Zodiac, où elle est encadrée par Eric Mercier.

  • Titre traduit

    Video compression of airplane screens


  • Pas de résumé disponible.