Thèse soutenue

Statistique computationnelle bayésienne pour l'étude des distributions spectrales d'énergie des galaxies

FR  |  
EN
Auteur / Autrice : Grégoire Aufort
Direction : Pierre PudloDenis Burgarella
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 10/10/2022
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : École Doctorale Mathématiques et Informatique de Marseille (Marseille)
Partenaire(s) de recherche : Laboratoire : Institut de mathématiques de Marseille (I2M) (Marseille, Luminy) (2014-....) - Laboratoire d'Astrophysique de Marseille (LAM)
Jury : Président / Présidente : Nicolas Chopin
Examinateurs / Examinatrices : Clotilde Laigle, Florence Forbes, Véronique Buat
Rapporteurs / Rapporteuses : Marc Huertas-Portocarrero Company, Sylvain Le Corff

Résumé

FR  |  
EN

L’exploitation efficace des nouveaux outils de mesure et d'observation en astrophysique nécessite le développement de nouveaux outils statistiques. On s'intéresse en particulier à de nouveaux outils de statistique bayésienne pour l'étude des distributions spectrales d'énergie (SED) des galaxies. Après une introduction à l'étude des SED, la première partie propose un algorithme de calcul bayésien approché pour le choix de modèle d'histoire de formation stellaire à partir de données photométriques. La méthode est appliquée à des données issues du relevé COSMOS pour l'identification de galaxies dont le taux de formation stellaire a subi une violente altération dans un passé proche. La seconde partie propose un nouvel algorithme d'échantillonnage préférentiel adaptatif multiple : TAMIS (Tempered Anti-Truncated Multiple Importance Sampling). En introduisant une suite de distributions cibles auxiliaires auto-calibrées, TAMIS est robuste au fléau de la dimension ainsi qu'à une mauvaise initialisation et ne requiert que relativement peu d'évaluations de la densité de cible, sans utiliser son gradient. La troisième partie présente le code CIGALE utilisé pour la modélisation des SED. Le calcul de la SED attendue à paramètres connus se fait par étapes successives correspondant aux différents processus physique à l'oeuvre. Pour accélérer le temps de calcul, nous proposons le remplacement des calculs explicites de certaines étapes par une approximation par réseau de neurones. Enfin on présente un modèle statistique complet pour l'estimation des paramètres et le choix de modèle bayésiens utilisant à la fois les données photométriques et spectroscopiques, puis l'application de TAMIS