Thèse en cours

Evaluation de la qualité perceptuelle des nuages de points 3D par apprentissage profond

FR  |  
EN
Auteur / Autrice : Marouane Tliba
Direction : Aladine ChetouaniGiuseppe Valenzise
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/10/2021
Etablissement(s) : Orléans
Ecole(s) doctorale(s) : Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes - MIPTIS
Partenaire(s) de recherche : Laboratoire : PRISME - Laboratoire Pluridisciplinaire de Recherche en Ingénierie des Systèmes et Mécanique Energétique

Résumé

FR  |  
EN

Le développement technologique a permis le déploiement d'un certain nombre de systèmes de vision par ordinateur. On retrouve ces systèmes pour la détection de comportements anormaux dans les lieux à hauts risques (aéroports, gares, etc.), des caméras sont aussi intégrées dans les véhicules pour l'assistance à la conduite (détection de panneaux, piétons, franchissements de lignes blanches, etc.). On peut citer également les outils biométriques (visage, empreinte, iris, etc.) devenus essentiels pour l'identification des personnes ou bien encore les applications liées au patrimoine culturel permettant de proposer de nouvelles expériences au public. Pour toutes ces applications, les données graphiques 3D (nuages de points) sont de plus en plus utilisées notamment pour la réalité virtuelle et mixte (VR/MR) qui suscite un certain engouement (musées, cinéma, etc.) de par la richesse des attributs utilisées (géométriques, cartes de texture, animation, etc.) mais également de par l'accès au contenu sans limite qu'offre cette technologie. A titre d'exemple, on peut citer le projet ILLUMINART MUSEUM qui exploite la réalité virtuelle pour donner accès au patrimoine culturel à des patients. Cette année si particulière due au COVID-19 a boosté cet engouement avec l'apparition de nouvelles applications (e-learning, working at home, design, médicale, etc.) dont certaines sont orientées valorisation du patrimoine (visite virtuelle des musées, analyse architecturale des monuments, etc.). Cependant, pour une visualisation fluide et correcte du contenu, les données 3D qui sont composées de centaines de milliers à plusieurs millions voire milliards de points sont souvent compressées. Cette étape nécessaire dans diverses applications peut fortement impacter la qualité d'expérience utilisateur en dégradant de façon notoire le rendu visuel. Dans le cadre du présent sujet de thèse, nous nous intéresserons aux distorsions engendrées par les différents traitements appliqués aux données 3D (nuages de points) et leur impact sur la qualité d'expérience utilisateur. Nous nous focaliserons sur les outils d'apprentissage profond [2] (ou « deep learning » en anglais) associées aux techniques d'intelligence artificielle. Ce travail se basera notamment sur les méthodes déjà développées au sein de l'axe Images-Vision du laboratoire PRISME sur les maillages 3D. Les méthodes développées exploitent à la fois les caractéristiques visuelles comme l'attention visuelle mais aussi le deep learning [3, 4, 5, 6]. Il conviendra d'adapter dans un premier ces outils aux nuages de points 3D. Ensuite, pour se rapprocher au mieux des données manipulées, les Graph Convolutional Networks (GCNs) seront exploités et adaptés à notre contexte. Pour valider les méthodes qui seront développées, des tests subjectifs seront réalisés pour disposer de la vérité terrain. Ainsi réalisée, cette base de données nous permettra de valider les méthodes développées mais aussi d'envisager différents scénarii et éventuellement diversifier le type de données (régionale, nationale et internationale). [1] Zhou Wang, Alan C. Bovik. « Modern image quality assessment » Morgan & Claypool Publishers, 2006 - 146 pages [2] MIT Course, 'Introduction to Deep Learning', http://introtodeeplearning.com/materials/2018_6S191_Lecture1.pdf [3] I. Abouelaziz, A. Chetouani, M. El Hassouni, L. Jan Latecki, H. Cherifi, « A convolutionnal neural network framework for blind mesh visual quality assessment», IEEE ICIP 2018 [4] I. Abouelaziz, A. Chetouani, M. El Hassouni, L. Jan Latecki, H. Cherifi, « 3D visual saliency and convolutional neural network for blind mesh quality assessment », Springer, Neural Computing and Applications, 2019 [5] M. Hamidi, A. Chetouani, M. El Haziti, M. El Hassouni, H. Cherifi, « Blind Robust 3-D Mesh Watermarking based on mesh Saliency and Wavelet Transform for Copyright Protection » MDPI Information, 2019 [6] I. Abouelaziz, A. Chetouani, M. El Hassouni, L. Jan Latecki, H. Cherifi, « No-Reference Mesh Visual Quality Assessment via Ensemble of Convolutional Neural Networks and Compact Multi-Linear Pooling », Elsevier, Pattern Recognition, 2020