Interactions entre Physique Statistique et Apprentissage Automatique : lde l'étude du Déséquilibre de Classe avec la Méthode des Répliques à la Prédiction des Hétérogénéités Dynamiques avec des Réseaux de Neurones sur Graphes SE(3)-équivariants
Auteur / Autrice : | Francesco Pezzicoli |
Direction : | Michèle Sebag, François Landes, Guillaume Charpiat |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique mathématique |
Date : | Soutenance le 19/12/2024 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) |
Référent : Université Paris-Saclay. Faculté des sciences d’Orsay (Essonne ; 2020-....) | |
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….) | |
Equipe de recherche : TAckling the Underspecified (TAU) | |
Jury : | Président / Présidente : Martin Weigt |
Examinateurs / Examinatrices : Alejandro Rodriguez Garcia, Sergei Grudinin, Nataliya Sokolovska, Damien Vandembroucq | |
Rapporteurs / Rapporteuses : Alejandro Rodriguez Garcia, Sergei Grudinin |
Mots clés
Résumé
Cette thèse explore la relation entre l'Apprentissage Automatique (AA) et la Physique Statistique (PS), en abordant deux défis importants à l'interface entre ces deux domaines. Tout d'abord, j'examine le problème du Déséquilibre de Classe (DC) dans le cadre de l'apprentissage supervisé en introduisant un modèle analytiquement solvable basé sur la mécanique statistique: je propose un cadre théorique pour analyser et interpréter le problème de DC. Certains phénomènes non triviaux sont observés : par exemple, un ensemble d'entraînement équilibré aboutit souvent à une performance sous-optimale. Ensuite, j'étudie le phénomène de blocage dynamique dans les verres structuraux à l'aide de modèles avancés d'AA. En exploitant des réseaux de neurones sur graphe qui sont SE(3)-équivariants, j'atteins des performance qui atteignent ou surpassent l'état de l'art pour la prédiction des propriétés dynamiques à partir de la structure statique. Cela suggère l'émergence d'un ''ordre amorphe'' qui est corrélé avec la dynamique. Cela souligne également l'importance des features directionnelles dans l'identification de cet ordre. Ensemble, ces contributions démontrent le potentiel de la physique statistique pour résoudre les défis de l'AA et l'utilité des modèles d'AA pour faire progresser les sciences physiques.