Thèse soutenue

Analyse volumétrique et reconnaissance de formes de formes arbitraires dans les réseaux neuronaux en utilisant des représentations dans le domaine de Fourier

FR  |  
EN
Auteur / Autrice : Dmitrii Zhemchuzhnikov
Direction : Sergei Grudinin
Type : Thèse de doctorat
Discipline(s) : Mathématiques et informatique
Date : Soutenance le 21/10/2024
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble, Isère, France ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Kuntzmann (Grenoble, Isère, France ; 2007-....)
Jury : Président / Présidente : Valérie Perrier
Examinateurs / Examinatrices : Élodie Laine
Rapporteurs / Rapporteuses : Pablo Chacón, Risi Kondor

Résumé

FR  |  
EN

Dans le domaine en constante évolution de l'apprentissage profond pour l'analyse de données spatiales, l'exploration des structures de données tridimensionnelles (3D) présente des défis uniques et des opportunités significatives pour les avancées technologiques dans la modélisation de la physique du monde réel. La thèse présentée se concentre sur le développement et l'évaluation de méthodes de détection de motifs de formes arbitraires dans des données volumétriques régulières et irrégulières, en mettant l'accent sur les approches basées sur le domaine de Fourier. En particulier, la thèse aborde les défis de l'invariance et de l'équivariance des rotations globales et locales. Les techniques développées permettent un apprentissage efficace de la hiérarchie des motifs spatiaux et une interprétation précise des opérations effectuées dans les réseaux de neurones. La recherche détaillée dans cette thèse est segmentée en différentes parties, chacune dédiée à un aspect différent de l'analyse des données.Ci-dessous, je présente dix méthodes. Malgré ce grand nombre, seules trois ont abouti à des publications et prépublications. Nous avons testé de nombreuses idées de manière exhaustive, mais la plupart avaient des applications limitées.J'ai commencé la thèse avec une méthode basée sur Fourier, 6DCNN, inspirée par des techniques de calcul provenant des domaines de la diffusion de rayons X/neutrons et de la cosmologie. Cette approche a démontré des performances compétitives sur les données de structures protéiques, aboutissant à un article de conférence accepté à la conférence AAAI-22 avec un taux d'acceptation de 15%.J'ai continué à étendre et à appliquer ces idées à des données provenant d'autres domaines. Après de multiples modifications de la méthode initiale et de nombreuses tentatives d'application des approches basées uniquement sur Fourier aux données moléculaires, nous avons conclu que la représentation de Fourier présente des limitations pour capturer les motifs à haute résolution ou ceux dans des données irrégulières.Cependant, au cours de mes études doctorales, j'ai découvert que la représentation de Fourier dans l'espace de rotation peut être bénéfique lors du traitement de données régulières. En conséquence, j'ai développé l'approche ILPONet, invariante aux orientations locales des motifs. Nous avons appliqué cette méthode aux images médicales et aux représentations régulières des structures protéiques. Ce travail a été récemment accepté à la conférence ECML-24 avec un taux d'acceptation de 24%. Une autre approche, EquiLoPONet, est un réseau convolutionnel qui fournit une équivariance analytique par rapport à l'espace de rotation continu. Nous avons soumis cette méthode sous forme de prépublication et avons également postulé pour les actes de conférence (actuellement en cours de révision).Une autre idée prometteuse est le Réseau de Convolution de Nuage de Points, où j'ai abandonné la représentation de Fourier pour les données irrégulières. Nous n'avons toutefois pas encore exploré pleinement cette méthode.L'exploration et le développement de ces méthodes soulignent le potentiel significatif et les défis inhérents à l'utilisation de l'apprentissage profond pour l'analyse de données spatiales 3D. Grâce à une évaluation rigoureuse et à un raffinement itératif, cette thèse met en évidence les forces et les limitations des approches basées sur le domaine de Fourier, en particulier leur applicabilité aux données régulières et les défis posés par les données irrégulières. Les contributions de cette thèse offrent des perspectives précieuses pour les recherches futures et les applications dans divers domaines, y compris l'imagerie médicale et l'analyse des données moléculaires, ouvrant la voie à des modèles d'apprentissage profond plus robustes et polyvalents.