Thèse soutenue

FR
Auteur / Autrice : Thi Thu Huong Hoang
Direction : Didier Dacunha-Castelle
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance en 2010
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Résumé

FR  |  
EN

Dans cette thèse, nous considérons plusieurs problèmes statistiques liés au réchauffement climatique. Le travail est donc centré sur la compréhension de récentes évolutions des caractéristiques de la température comme moyenne, variance, extrêmes et des liens entre ces quantités. Par ailleurs nous poursuivions deux objectifs particuliers liés aux risques importants : donner une méthodologie pour calculer les niveaux de retour en situation non stationnaire (risques économiques, sanitaires et industriels) et fabriquer un modèle réaliste de simulation permettant de calculer certains de ces risques de définition compliquée. Le contexte étant celui du changement climatique, en incluant bien entendu des aspects métamathématiques. Notre modèle de base pour décrire une série chronologique, plus compliqué que presque tous les modèles classiques est de la forme suivante :X(t)=m(t)+S(t)+SV(t)s(t)Z(t)où t est la date, X(t) les observations, m (t) est la tendance moyenne, S(t) la composante saisonnière et SV(t), s(t) sont respectivement la variabilité saisonnières et la variabilité sur le long terme. Notions dont nous avons cherché une définition intrinsèque. Qu'en est-il de Z(t)? Il s'agit d'un processus stochastique, centré, normé, censé avoir au moins une covariance saisonnière stationnaire. « Covariance saisonnière stationnaire » signifie que la covariance est une fonction périodique de l'intervalle de temps entre les observations. Une approche intrinsèque de la notion de tendance « à long terme » est proposée. Elle est liée au nombre d'observations et sa définition doit respecter un principe heuristique : l'évolution à venir à une échelle de temps courte par rapport à celle qui a été utilisée pour calculer la tendance et l'ajout conjoint de nouvelle données ne doit pas changer les tendances déjà définies. Notre étude est d’abord limitée à des séries de températures homogènes sans prise en compte de saisonnalités. Notre modèle (1) puis transforme en:X(t) = m(t) + s(t) Y(t)Y(t) est également centré et a au moins une covariance stationnaire. Dans notre cas, une technique d’estimation appropriée est d'utiliser la méthode Loess (local polynomial estimation) liée à une fenêtre locale. Des estimations asymptotiquement efficaces avec Loess pour des tendances de la moyenne ou dans la variance seront développées avec arguments théoriques et de nouveaux algorithmes afin de tenir compte des variances non constantes et des bruits corrélés. De réelles difficultés se font jour dans le choix du paramètre de lissage. Un nouvel algorithme permettant le choix automatique des paramètres de régularisation, nommé « modified partitionned cross validation » (MPCV), est donné. Cet algorithme possède de nombreux avantages par rapport aux moyens de sélection utilisés. Puis nous étudions l’estimation pour des modèles de variables indépendantes à paramètre fonctionnel et vectoriel, et lorsque la loi a une forme connue. Nous utilisons une estimation par des splines, résultant de la maximisation de la vraisemblance pénalisée. Dans ce cas, la non orthogonalité, dans le sens statistique, des paramètres de la distribution pose de nouvelles difficultés pour le choix du paramètre de lissage. De nouveau, nous proposons un nouvel algorithme permettant de faire automatiquement un choix pour les paramètres de lissage. La méthode est basée sur la combinaison des moindres carrés pondérés itérés et de la validation croisée itérée de Gu (2002). Sa performance asymptotique est vérifiée au travers de simulations. Cette méthode est utilisée pour estimer des modèles d’extrêmes non stationnaires GEV et POT. Nous proposons ensuite un test de stationnarité pour ce type de modèles paramétrés par des fonctions du temps, et plus spécifiquement pour des modèles d'extrêmes. L'idée est de comparer des estimateurs paramétriques et non paramétriques dans un contexte de modèle erronée. Nous calculons des distances L2 entre deux tels estimateurs. A partir de là, en utilisant des simulations, ou le bootstrap dans des cas particuliers importants, nous testons si  est significativement petite, ce qui signifie que la constance du paramètre peut être accepté. Dans notre cas, ce test est plus particulièrement utilisé pour tester l'hypothèse K suivante : « les extrêmes de Y(t) sont stationnaires ». Si K est acceptée, les paramètres d’extrêmes de X(t) peuvent être calculé en utilisant seulement la moyenne m(t), la variance s2(t) et les paramètres constants du modèle d’extrême de Y(t). En appliquant ces approches aux séries de température en Europe, nous trouvons un fort lien entre les tendances m et s et avec les tendances d’extrêmes et K est souvent accepté. Dans ce dernier cas , nous pouvons prédire le niveau de retour d’une nouvelle façon en passant par les informations de m, s et des paramètres d’extrême de Y, qui est plus robuste. L’autre objectif de cette thèse est de construire un modèle de simulation pour les températures de toute une année. A partir de modèle (2), les séries réduites Z(t) peuvent être obtenues après avoir supprimer les saisonnalités et les tendances. Z(t) n'est pas stationnaire, mais périodiquement stationnaire. Pour modéliser cette température réduite qui a des marginales de support bornés, nous précisons d’abord la théorie des extrêmes pour les diffusions à marginales bornées. Les discrétisations de ce type de modèles présentent des difficultés particulières dues au fait que le coefficient de diffusion s’annule en dehors de l’intervalle borné déterminé par les points frontières inaccessibles. Nous modifions le modèle fin de conserver les propriétés statistiques essentielles, en incluant le comportement des extrêmes mais en gardant un bruit gaussien et stationnaire. Afin de garantir alors la propriété « bornée » du processus, a est modifié pour être éliminé à l'extérieur du support borné. Les modèles vont être appliqués sur un large éventail de températures. L'ajustement de ces modèles sera considéré à travers des simulations de différents critères évalués à une date précis, ou pour un mois précis. Notre modèle, en général, montre un bon comportement et montre un meilleur ajustement comparé à d'autres modèles. Il conserve évidement cependant des faiblesses, que nous discuterons également par ailleurs.