Thèse soutenue

Clustering non paramétrique pour les extrêmes spatiaux
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Philomène Le Gall
Direction : Anne-Catherine Favre PuginPhilippe Naveau
Type : Thèse de doctorat
Discipline(s) : Sciences de la Terre et de l'Univers et de l'Environnement
Date : Soutenance le 25/03/2022
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Sciences de la terre, de l’environnement et des planètes (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Institut des géosciences de l'environnement (Grenoble)
Jury : Président / Présidente : Eric Barthélémy
Examinateurs / Examinatrices : Éric Sauquet, Sophie Fukutome, Carlo Gaetan
Rapporteurs / Rapporteuses : Valérie Chavez-Demoulin, Debbie Dupuis

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les précipitations sont soumises aux diverses caractéristiques spatiales et leur intensité peut être très variable, notamment à l'échelle mondiale. Une question récurrente en analyse du risque et du climat est de déterminer, à l'horizon 2100, les changements dans les régimes de fortes précipitations. D'un point de vue statistique, le découpage du globe en sous-régions homogènes est une tâche délicate, notamment en ce qui concerne la modélisation des caractéristiques des fortes précipitations dans le cadre de la détection et de l'attribution du changement climatique. Plus précisément, il faut combiner différents modèles climatiques globaux et comparer deux scénarios (avec et sans forçages anthropogéniques). Dans cette thèse, notre objectif principal est de proposer et d'étudier des algorithmes de clustering rapides et efficaces qui peuvent partitionner de larges zones en sous-régions homogènes.Par rapport aux techniques classiques d'analyse fréquentielle régionale (RFA), un aspect clé de nos algorithmes est qu'ils ne reposent pas sur le choix a priori des covariables. Les méthodes numériques proposées sont basées uniquement sur les données de précipitations disponibles, qu'elles soient faibles, modérées ou fortes. Bien qu'en conformité avec la théorie des valeurs extrêmes, notre approche n'impose pas de forme paramétrique aux distributions et ne requiert donc, en particulier, ni seuillage ni sélection de taille de bloc pour définir des maxima. Par construction, nos méthodes de regroupement préservent le principe de proportionnalité de la RFA classique. En terme d'inférence, notre premier algorithme est basé sur les probability weighted moments, faciles à calculer, couramment utilisés en hydrologie. La performance de notre algorithme de clustering est évaluée suivant un plan expérimental détaillé basé sur une extension de la distribution de Pareto généralisée. La sensibilité au nombre de clusters est soigneusement étudiée.Nous appliquons ensuite notre algorithme de clustering à deux ensembles de données. Le premier est formé des précipitations quotidiennes Suisses mesurées en 191 sites. Les régions homogènes identifiées sont cohérentes avec le relief local et notre approche surpasse l'analyse fréquentielle régionale classique basée sur l'élévation et les coordonnées.Nous appliquons ensuite cet algorithme aux précipitation européennes de ERA-5 afin de produire plusieurs cartes de niveaux de retour. Nous discutons des limitations et des difficultés pratiques et fournissons également un dépôt git hub. Pour chacun de ces deux ensembles de données, nous montrons qu'un modèle régional relativement parcimonieux avec seulement un paramètre d'échelle variant dans l'espace peut rivaliser avec des modèles complexes. Notre deuxième algorithme de clustering repose sur le développement d'une dissimilarité qui prend aussi en compte la dépendance entre les sites. L'originalité principale de cette dissimilarité est qu'elle associe le principe d'invariance RFA et la dépendance entre deux sites. Notre dissimilarité est illustrée sur une distribution extrême bivariée. Nous appliquons également cet algorithme à des maxima annuels de précipitations quotidiennes de 16 modèles climatiques (CMIP). Une méthode pour manipuler et résumer de tels ensembles de données est proposée, ainsi qu'une comparaison du clustering spatial entre deux expériences différentes (avec ou sans forçage anthropique). Les partitions sont comparées à celles obtenues avec une méthode de partitionnement se concentrant uniquement sur les marges ou la dépendance. Notre algorithme de clustering conduit à des régions plus cohérentes qui sont climatologiquement et physiquement interprétables.Enfin, nous proposons une analyse détaillée de détection et d'attribution de la façon dont le clustering change entre les deux scenarii (avec et sans forçages anthropogéniques).