Thèse soutenue

Quelques contributions aux méthodes computationnelles bayesiennes, avec applications à la phylolinguistique
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Grégoire Clarté
Direction : Christian P. Robert
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 06/10/2021
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale SDOSE (Paris)
Partenaire(s) de recherche : Laboratoire : Centre de recherche en mathématiques de la décision (Paris) - CEntre de REcherches en MAthématiques de la DEcision / CEREMADE
établissement opérateur d'inscription : Université Paris Dauphine-PSL (1968-....)
Jury : Président / Présidente : Judith Rousseau
Examinateurs / Examinatrices : Christian P. Robert, Judith Rousseau, Antonietta Mira, Alexandre Bouchard-Côté, Robin Ryder, Geoff Nicholls, Pierre, Etienne Jacob
Rapporteurs / Rapporteuses : Antonietta Mira, Alexandre Bouchard-Côté

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Ce travail est la concaténation de trois parties, ayant pour point commun de porter sur les statistiques bayésiennes. La première partie concerne les méthodes bayésiennes d'inférence de phylogénies, avec une application à l'histoire des langues des Signes. Nous développons un modèle pour des données matricielles, dont lignes et colonnes sont corrélées ; ces données peuvent représenter des traits socio-culturels, phénotypiques, ou, comme dans notre cas, des données lexicales. Nous montrons comment calculer la vraisemblance de ce modèle et proposons des méthodes numériques pour échantillonner depuis le posterior associé, basées sur un Monte Carlo séquentiel associé à un tempering exotique. Les résultats sur données simulées sont plus que satisfaisants, tandis que les résultats sur données réelles apportent des éléments de réponses aux questions des linguistes. La deuxième partie traite des méthodes bayésiennes approchées. Ces méthodes s'utilisent lorsque les vraisemblances sont intraitables, elles sont, hélas, particulièrement sensibles au fléau de la dimension, requérant des ressources exponentiellement élevées à mesure que la dimension croit. Pour résoudre ce problème, nous explorons une version à la Gibbs des méthodes ABC traditionnelles, où l'on met à jour séquentiellement les coordonnées des paramètres selon des lois conditionnelles approchées reposant sur des statistiques résumées de dimension moindre. Bien qu'il ne soit pas possible d'utiliser des méthodes classiques pour étudier cette méthode, nous avons été capables de montrer sa convergence vers une mesure stationnaire dépourvue de forme explicite. Les expériences démontrent une efficacité particulière par rapport aux méthodes standard. La troisième partie est dédiée aux méthodes numériques particulaires. Au cours des dernières décennies, des méthodes MCMC non linéaires ont été développées ; bien qu'attirantes par leur vitesse de convergence et leur efficacité, leur implémentation et étude théorique reste problématique. Nous introduisons une large classe de méthodes non linéaires qu'il est possible d'étudier à l'aide de limites champ-moyen de particules en interaction. L'implémentation que l'on propose repose sur le calcul parallèle sur GPU.