Thèse soutenue

Apprentissage synthétique pour les méthodes neuronales de restauration d'images

FR  |  
EN
Auteur / Autrice : Raphaël Achddou
Direction : Yann GousseauSaïd Ladjal
Type : Thèse de doctorat
Discipline(s) : Signal, Images, Automatique et robotique
Date : Soutenance le 15/03/2023
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche : Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....) - Laboratoire de Traitement et Communication de l'Information
Etablissement opérateur d'inscription : Télécom Paris (Palaiseau ; 1977-....)
Jury : Président / Présidente : Florence Tupin
Examinateurs / Examinatrices : Florence Tupin, Bruno Galerne, Jean-François Aujol, Jesús Angulo López, Sira Ferradans, Sabine Süsstrunk
Rapporteurs / Rapporteuses : Bruno Galerne, Jean-François Aujol

Résumé

FR  |  
EN

La photographie occupe aujourd'hui une place prépondérante dans nos vies. De plus, les attentes en terme de qualité des images augmentent tandis que la taille des appareils imageurs diminuent. Dans ce contexte, l'amélioration des algorithmes de traitement d'image est primordial.Dans ce manuscrit, on s'intéresse particulièrement aux tâches de restauration des images. Le but est de produire une image propre à partir d'une ou plusieurs observations bruitées de la même scène. Pour ces problèmes, les méthodes d'apprentissage profond ont connu un essor spectaculaire dans la dernière décennie, surpassant l'état de l'art pour la grande majorité des tests traditionnels.Bien que ces méthodes produisent des résultats impressionnants, elles présentent un certain nombre d'inconvénients. Tout d'abord, elles sont difficilement interprétables de part leur fonctionnement “boite noire”. De plus, elles généralisent assez mal à des modalités d'acquisition ou de distorsion absentes de la base de donnée d'apprentissage. Enfin, elles nécessitent des bases de données volumineuses, qui sont parfois difficile à acquérir.On se propose d'attaquer ces différents problèmes en remplaçant l'acquisition des données par un algorithme simple de génération de d'image, basé sur le modèle feuilles mortes. Bien que ce modèle soit très simple, les images générées ont des propriétés statistiques proches de celles des images naturelles et de nombreuses propriétés d'invariances (échelle, translation, rotation, contraste…). Entraîner un réseau de restauration avec ce genre d'image nous permet d'identifier les propriétés importantes des images pour la réussite des réseaux de restauration. De plus, cette méthode permet de s'affranchir de l'acquisition des données, qui peut s'avérer fastidieuse.Après avoir présenté ce modèle, on montre dans un premier temps que la méthode proposée permet d'obtenir des performances de restauration très proches des méthodes traditionnelles pour des tâches relativement simples. Après quelques adaptations du modèle, l'apprentissage synthétique permet aussi de s'attaquer à des problèmes concrets difficiles, comme le débruitage d'images RAW. On propose ensuite une étude statistique de distribution des couleurs des images naturelles, permettant d'élaborer un modèle parametrique réaliste d'échantillonnage des couleurs pour notre algorithme de génération. Enfin, on présente une nouvelle fonction de perte perceptuelle basée sur les protocoles d'évaluation des cameras, faisant intervenir les images feuilles mortes. Les entrainement réalisés avec cette fonction montre qu'on peut conjointement optimiser l'évaluation des appareils, tout en conservant des performances identiques sur les images naturelles.