Thèse soutenue

Développement de nouvelles techniques de Super résolution de séquences vidéo : Vers une implémentation temps réel sur Smart Caméra

FR  |  
EN
Auteur / Autrice : Yoan Marin
Direction : Dominique GinhacJohel Miteran
Type : Thèse de doctorat
Discipline(s) : Instrumentation et informatique de l'image
Date : Soutenance le 04/12/2020
Etablissement(s) : Bourgogne Franche-Comté
Ecole(s) doctorale(s) : École doctorale Environnements, Santé (Dijon ; Besançon ; 2012-....)
Partenaire(s) de recherche : Laboratoire : Imagerie et Vision Artificielle (ImVia) (Dijon)
Etablissement de préparation : Université de Bourgogne (1970-....)
Jury : Président / Présidente : Daniel Ménard
Examinateurs / Examinatrices : Mohamed Atri, Barthélémy Heyrman, François Berry, Julien Dubois
Rapporteurs / Rapporteuses : Frédéric Morain-Nicolier, Mohamed Atri

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Ces travaux de thèse s’inscrivent dans le contexte d’un projet européen visant à créer une caméra très haute résolution 8k. Au sein de ce projet notre équipe a eu la tâche de travailler sur deux aspects technologiques : (1) la création d’un démonstrateur réalisant une déconvolution en temps réel d’un flux vidéo provenant d’une caméra très haute résolution créée par le consortium, (2) la création d’un prototype permettant d’augmenter la résolution et le niveau de détail de flux vidéod’une résolution d’entrée de 4k vers le 8k en utilisant des méthodes de Super Résolution (SR). Ce manuscrit présente principalement les travaux liés à la création du prototype réalisant une méthode de SR. Afin de pouvoir évaluer l’apport qualitatif de la SR, une étude sur la pertinence des métriques est réalisée afin de sélectionner les métriques les plus adaptées à évaluer des traitements d’amélioration de la qualité des images. Ensuite, une nouvelle méthode de SR Spatiale nommée LASSR pour Local Adaptive Spatial Super Resolution a été mise en place pour corriger certains artefacts observés lors de l’implantationd’une méthode de SR de l’état de l’art. Notre méthode permet d’adapter localement le traitement en fonction de la texture, cette adaptation est réalisée automatiquement en utilisant un modèle de décision généré lors d’un apprentissage supervisé.Suite à la validation de notre méthode par un panel d’experts lors d’une évaluation psychovisuelle, le module IP a été développé pour fonctionner avec des volumes de données très importants sur des cibles FPGA et pour fonctionner en temps réel. Uneboite à outils de composants a été créée afin de pouvoir décrire le module de manière générique. Cela permet d’adapter le module LASSR à différentes configurations (taille de l’image, dynamique des pixels . . .). L’élément majeure de cette boîte àoutil est le filtre de convolution 2-D générique : sa taille et ses coefficients sont paramétrables (la puce FPGA peut limiter ce filtre). Des résultats encourageants ont été obtenus concernant l’augmentation de résolution pour une image de sortie 4k enniveaux de gris, il est possible pour un seul module LASSR d’obtenir une fréquence de sortie de 17.03 im/s. Sur le FPGA de la carte de développement VC707 de Xilinx il est théoriquement possible d’atteindre une fréquence de 136.2 im/s en parallélisant8 modules LASSR.