Protection de templates biométriques

par Aurélie Phesso

Projet de thèse en Mathématiques et Informatique

Sous la direction de Albert Bifet et de Hugues Randriambololona.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec Laboratoire de Traitement et Communication de l'Information (laboratoire) , ZZ-autres (equipe de recherche) et de Télécom ParisTech (établissement de préparation de la thèse) depuis le 01-06-2017 .


  • Résumé

    La biométrie permet de reconnaitre des individus grâce à une comparaison de leur trait (visage, empreintes, iris, …). Une image du trait est d'abord prise par un capteur puis est codée en vue de comparaisons d'une référence avec des traits fraichement capturés. Le trait est donc conservé, codé sous une forme que nous appelons template. La protection des templates est un sujet important par rapport au respect de la vie privée. Différents travaux ont déjà été menés pour s'assurer de leur confidentialité, par exemple avec les techniques de secure sketches. Safran Identity & Security a, notamment, participé aux projets ANR RNRT 2005 BACH, FP7 TURBINE et a déjà eu un étudiant commun avec Télécom Paristech sur ce sujet (Bruno Kindarji, 2007-10). Les secure sketches dégradent les performances de reconnaissance et apportent, en pratique, une sécurité assez faible [1]. Par ailleurs, les solutions ad-hoc, par exemple de protection du visage, ne sont pas convaincantes [2].

  • Titre traduit

    Protection of biometric templates


  • Résumé

    Les outils de machine learning sont composés de deux grandes phases : la phase d'apprentissage et celle d'exploitation. Durant cette thèse nous considérons donc ces deux phases. Durant la phase d'exploitation, il a été montré, par exemple, qu'à partir de la connaissance du modèle de machine learning sous-jacent : - il était facile de berner un système de reconnaissance faciale [5], - il était possible de remonter des templates aux données brutes [6]. Cela pose donc aussi, le problème de la confidentialité du modèle qui est lui-aussi chahuté [7, 8]. Durant la phase d'apprentissage, différentes méthodes viennent d'être proposées, pour préserver la confidentialité des données servant à l'apprentissage [9, 10, 11]. En effet, suivant le paradigme du Big Data : l'accès à une quantité importante de données permet d'améliorer les algorithmes de machine learning mais à cela peut se heurter la volonté des possesseurs de protéger le caractère individuel de leur données. Comme nous avons essayé de l'illustrer, le sujet s'inscrit dans un cadre plus large lié au machine learning. Toutefois, la thèse se place dans le domaine particulier de la reconnaissance biométrique ; en particulier, de reconnaissance faciale. En outre, en tant que développeur de systèmes, l'étudiant recherchera de préférence des solutions de protection. Safran Identity & Security travaille déjà aujourd'hui sur ces 2 sujets dans le projet FUI Cryptocomp où le chiffrement homomorphe est utilisé. Cette piste n'est pas celle retenue a priori pour la thèse. Pour la phase d'apprentissage, nous souhaitons suivre la tendance générale et utiliser les techniques de Differential Privacy. Pour la phase d'exploitation, Safran Identity & Security possède une solution brevetée – où aux données de référence sont ajoutées des données artificielles qui évoluent suivant les requêtes qui sont faites – qui nous servira de base de départ pour cette étude.