Thèse soutenue

Vision par ordinateur et apprentissage profond appliqués à la reconnaissance faciale dans le spectre invisible

FR  |  
EN
Auteur / Autrice : David Anghelone
Direction : Antitza Dantcheva
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 29/06/2023
Etablissement(s) : Université Côte d'Azur
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) - Thales (Firme)
Jury : Président / Présidente : Jean-Luc Dugelay
Examinateurs / Examinatrices : Antitza Dantcheva, Jean-Luc Dugelay, Christian Rathgeb, Anil K. Jain, Touradj Ebrahimi, Marco Lorenzi, Sandra Cremer, Sarah Lannes
Rapporteurs / Rapporteuses : Jean-Luc Dugelay, Christian Rathgeb

Résumé

FR  |  
EN

La reconnaissance faciale cross-spectrale consiste à identifier des individus à partir d'images faciales provenant de différents spectres électromagnétiques, tels que l'infrarouge et le visible. Bien que cette application soit intrinsèquement plus difficile que la reconnaissance faciale classique, notamment en raison de la variation significative de l'apparence faciale causée par l'écart de modalité, elle est utile dans de nombreux scénarios impliquant la biométrie en vision nocturne ou la détection d'attaques par "présentation" des systèmes biométriques.Le but de cette thèse a été de développer un système de reconnaissance faciale thermique-visible, qui intègre de nouveaux algorithmes pour (a) la détection de visage thermique, ainsi que (b) la traduction d'image thermique en image visible, simplifiant le problème causé par l'écart de modalité pour la reconnaissance faciale cross-spectrale. Ainsi, tout algorithme peut être utilisé pour cette ultime étape de reconnaissance, un fait assuré par la plateforme de reconnaissance faciale FRP de Thales.Pour atteindre cet objectif, nous présentons les contributions suivantes :Tout d'abord, nous avons collecté une base de données comprenant des images faciales multispectrales capturées simultanément sous quatre spectres électromagnétiques. La base de données fournit des ressources essentielles, riches et variées, qui sont appropriées pour reproduire des scénarios pratiques de fonctionnement d'un système biométrique cross-spectral.Deuxièmement, nous avons conçu TFLD, un algorithme de prétraitement dans la chaîne du système, qui consiste à détecter les visages et les points de repère faciaux dans le spectre thermique. TFLD est robuste à des conditions réalistes telles que la pose, l'expression, l'occlusion, la mauvaise qualité d'image et la distance à longue portée. L'alignement facial résultant du prétraitement de TFLD a contribué de manière significative à l'amélioration des performances de reconnaissance faciale.La troisième contribution portait sur la traduction de spectres, visant à réduire l'écart de modalité entre le spectre visible et thermique pour la tâche de reconnaissance faciale. Nous avons présenté un nouveau modèle génératif guidé par l'espace latent, nommé LG-GAN, qui traduit un spectre (par exemple, thermique) en un autre (visible), tout en préservant l'identité d'un visage lors de la traduction. L'objectif de LG-GAN était lié à l'explicabilité, à savoir fournir un aperçu des caractéristiques biométriques pertinentes et discriminatoires à travers les spectres, qui a été poursuivi par l'élaboration d'un modèle génératif supplémentaire guidé par l'attention (AG-GAN). Enfin, pour répondre au défi de la reconnaissance faciale multi-résolution provenant de distances d'acquisition variables, nous avons proposé ANYRES. Ce modèle unique accepte toutes les résolutions d'images thermiques de visage et les convertit en images visibles synthétiques à haute résolution. De plus, nous avons étendu les capacités de ANYRES en mettant l'accent sur la reconnaissance faciale en environnement non contraint, considerant ainsi les variations de pose faciale.