Thèse soutenue

Méthodes d'initialisation des réseaux de neurones convolutifs pour la détection des manipulations d'images

FR  |  
EN
Auteur / Autrice : Ivan Castillo camacho
Direction : Kai Wang
Type : Thèse de doctorat
Discipline(s) : Signal, image, paroles, télécoms
Date : Soutenance le 06/05/2021
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale électronique, électrotechnique, automatique, traitement du signal (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Grenoble Images parole signal automatique
Jury : Président / Présidente : Alice Caplier
Examinateurs / Examinatrices : William Puech, Patrick Bas
Rapporteurs / Rapporteuses : Francisco J. Garcia Ugalde, William Puech

Résumé

FR  |  
EN

Les fausses images et vidéos apparaissent régulièrement dans les médias de communication de masse. Ce n'est pas quelque chose de récent, des manipulations et des falsifications ont eu lieu depuis l'avènement de la photographie elle-même. Ces altérations peuvent aller de retouches innocentes à la diffusion d'informations trompeuses ou même à l'utilisation de faux contenus dans des instances judiciaires. En conséquence, la création de méthodes qui peuvent nous aider à assurer l'authenticité d'une image présentée comme non modifiée est d'une importance capitale. Dans cette thèse, nous visons à détecter les opérations de manipulation d'images en utilisant des techniques d'apprentissage profond. Nous présentons trois méthodes montrant la progression de notre travail sous un objectif commun, c'est-à-dire la conception et le test de méthodes d'initialisation de réseaux de neurones convolutifs (CNNs) pour les problèmes de la criminalistique d'images avec un focus sur la stabilité de la variance pour la sortie d'une couche CNN.Tout d'abord, nous effectuons une étude bibliographique approfondie de l'état de l'art des méthodes basées sur l'apprentissage profond pour l'analyse criminalistique des images. Cette étude nous permet de confirmer que la première couche d'un CNN a un impact important sur les performances finales. Plus précisément, l'initialisation utilisée sur les filtres de la première couche joue un rôle important qui devrait être conforme à la tâche de la criminalistique d'image en cours.Comme la première tentative, nous proposons une méthode d'initialisation de faible complexité pour les CNNs. En profitant des méthodes précédentes conçues pour le domaine de la vision par ordinateur, nous étendons la méthode populaire de Xavier pour concevoir un filtre qui assurerait la stabilité de la variance après une opération de convolution. Cette méthode génère un ensemble de filtres passe-haut aléatoires pour l'initialisation de la première couche d'un CNN. Ces filtres nous permettent de mieux identifier les traces criminalistiques qui se situent généralement vers la partie haute fréquence de l'image.Cette première approche constitue un bon point de départ pour notre travail. Cependant, une hypothèse erronée, largement utilisée dans la communauté de la recherche, a été faite. Celle-ci est corrigée dans notre deuxième méthode où nous suivons une approche différente et dépendante des données, et prenons en considération les propriétés statistiques réelles des images naturelles. En conséquence, nous proposons une méthode de mise à l'échelle pour les filtres de première couche qui peut bien s'adapter aux différents algorithmes d'initialisation de CNN. L'objectif reste de maintenir la stabilité de la variance du flux de données dans un CNN. Nous présentons également des études théoriques et expérimentales sur la variance de sortie pour un filtre convolutif, qui sont à la base de notre méthode de mise à l'échelle de filtre proposée.Ensuite, nous décrivons une version révisée de notre première proposition, maintenant avec une hypothèse corrigée sur les statistiques des images naturelles. Plus précisément, nous proposons une méthode d'initialisation améliorée de filtres passe-haut aléatoires qui ne calcule pas explicitement les statistiques des données d'entrée. Nous pensons qu'une telle approche «indépendante des données» est plus souple et a un champ d'application plus large que notre deuxième méthode dans les situations où le calcul fiable des statistiques d'entrée n'est pas possible.Les méthodes que nous proposons sont testées sur plusieurs problèmes criminalistiques d'images et sur différentes architectures CNN.Finalement, durant ce travail de thèse, nous avons participé à un concours de détection de fausses images organisé par l'Agence Nationale de la Recherche et la Direction Générale de l'Armement. Nous expliquons en annexe les objectifs du concours ainsi qu'une brève description de nos travaux réalisés pour le concours.