Compression de vidéo d'écrans d'avion

par Iulia Mitrica

Projet de thèse en Traitement du signal et des images

Sous la direction de Marco Cagnazzo et de Béatrice Pesquet-popescu.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec Laboratoire de Traitement et Communication de l'Information (laboratoire) et de Télécom ParisTech (établissement de préparation de la thèse) depuis le 01-03-2017 .


  • Résumé

    Sujet de thèse CIFRE avec la société Zodiac Compression de vidéo d'écrans d'avion Contexte de l'étude Dans le cadre du développement des produits aéronautiques, la société Zodiac développe des solutions d'acquisition et de traitement vidéo en environnement à fortes contraintes. Cette thèse s'inscrit dans une démarche de recherche pour l'amélioration de leurs systèmes de visualisation. Les informations sur les écrans avioniques présentent des caractéristiques spécifiques, notamment des informations textuelles et graphiques qui ne doivent pas être altérées par la compression. Or, la plupart des systèmes de compression très bas débit conduisent à des artefacts importants notamment au niveau des contours, qui rendraient inutilisables ces données. La compression de ce type de données pose donc des défis supplémentaires par rapport à la compression de vidéos classiques (aussi dites, naturelles). Des avancées ont été faites avec les extensions Screen Content de HEVC [1], mais il y a de la marge pour des gains importants. Approche proposée et méthodologie L'approche proposée vise à prendre en compte au niveau du codeur les spécificités des vidéos écrans d'avion, avec un codage adaptif, sémantique et par apprentissage. Nous envisageons de reconnaitre les parties différentes de l'image à coder : texte, graphiques, niveaux des indicateurs, éventuellement images de fond, et adopter donc un codage adaptif. En particulier, pour le texte et les éléments graphiques un codage sémantique est envisagé : le texte sera donc reconnu et codé en tant que tel, plutôt que comme un ensemble de pixels. Cela permettra une représentation sans pertes de cette information capitale. Par contre, les éléments les moins importants de l'image au niveau sémantique pourront être codés avec une technique « lossy », c'est-à-dire, avec perte d'information. Le débit épargné sur les parties moins importantes de la vidéo pourra être utilisé pour coder parfaitement les parties sensibles. Une phase d'apprentissage et classification est également envisagée. Le codeur reconnait le « type » d'écran d'avion qu'il a à coder, et y recherche les informations sensibles en conséquence. Les travaux préliminaires ont montré que la connaissance de la position de quelques lettres dans l'écran permet d'effectuer une classification très fiable du type d'écran. La classification à son tour permet de raffiner la reconnaissance du texte : si quelques lettres étaient perdues dans la première étape de reconnaissance, une fois que l'écran ait été correctement classifié à l'aide des lettres reconnues, il sera possible de lancer une nouvelle reconnaissance de texte adaptée aux informations a priori sur le type d'écran (par exemple, on s'attend d'avoir du texte dans certaines positions spécifiques, même si pas tout le texte a été retrouvé lors de la première itération). La classification joue donc un rôle majeur dans l'approche envisagée. Il s'agit d'une classification multi-classe, pour laquelle nous avons récemment développé une méthode originale de type Support Vector Machine (SVM) [2], qui présente des performances intéressantes notamment pour les problèmes présentant un nombre réduit d'exemples d'entrainement. L'enjeu consiste ici d'intégrer les critères de classification lors de la phase de compression directement, en combinant ces critères avec les approches classiques débit-distorsion. Calendrier provisionnel Les premiers mois seront consacrés à une étude approfondie de la littérature scientifique sur les sujets de la compression vidéo screen content, de la reconnaissance de texte, ligne, objet, et des méthodes de classification. Des méthodes de compression d'écrans d'avion de référence (c'est-à-dire, basées sur les normes telles que HEVC) seront mises en place. Une première version du codeur avec classification et codage sémantique peut être également réalisée dans le premiers mois de la thèse. La deuxième partie de la thèse sera consacrée à la conception, la mise en œuvre et l'expérimentation de méthodes de plus en plus raffinées et efficaces pour les différentes taches du codeur : la reconnaissance de texte, le codage sémantique et adaptif, la classification. Encadrement et environnement de travail La thèse se déroule dans le cadre d'une collaboration entre l'équipe Multimédia de Télécom ParisTech, sous la supervision de Marco Cagnazzo et Béatrice Pesquet, et l'équipe Zodiac, où elle est encadrée par Eric Mercier.

  • Titre traduit

    Video compression of airplane screens


  • Résumé

    Video Compression of Airplane Screens Study context The content of the avionic screens is composed of real recordings, maps, symbols, graphics representations and text information. Because it mixes such different content it is considered a specific content. Nowadays a bigger number of screens are integrated into avionics systems. Those systems have constrains of debit and a limited duration of recording. Thus, the content of those types of screens needs to be strongly compressed but should not be altered by the compression. However, the compression systems of very low-rate leads to artifacts, especially around the edges, which would make the content unusable. Provisional schedule The first few months will be devoted to a thorough study of the scientific literature on the topics of video compression screen content, text recognition, line, object, and classification methods. Compression plane screen compression methods (ie, based on standards such as HEVC) will be implemented. A first version of the coder with classification and semantic coding can also be performed in the first months of the thesis. The second part of the thesis will be devoted to the design, implementation and experimentation of more and more refined and efficient methods for the different tasks of the coder: text recognition, semantic and adaptive coding, classification. Supervision and work environment The thesis is part of a collaboration between Télécom ParisTech's multimedia team, under the supervision of Marco Cagnazzo and Béatrice Pesquet, and the Zodiac team, where she is supervised by Eric Mercier.