Thèse soutenue

U - Statistiques et statistique non paramétrique pour données dépendantes

FR  |  
EN
Auteur / Autrice : Sinda Kharrat
Direction : Jérôme DedeckerCéline Duval
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 17/03/2023
Etablissement(s) : Université Paris Cité
Ecole(s) doctorale(s) : École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : MAP5 - Mathématiques Appliquées à Paris 5
Jury : Président / Présidente : Claire Lacour
Examinateurs / Examinatrices : Jérôme Dedecker, Céline Duval, Claire Lacour, Mohamed El Machkouri, Clémentine Prieur, Gabriel Lang, Florence Merlevède
Rapporteurs / Rapporteuses : Mohamed El Machkouri, Clémentine Prieur

Résumé

FR  |  
EN

Dans cette thèse, on s'intéresse à trois problèmes distincts issus de la statistique non paramétrique pour des données dépendantes: le test de corrélation de Kendall pour données dépendantes, l'estimation adaptative de densité pour des suites alpha -mélangeantes et la concentration de la mesure empirique pour la distance de Wasserstein. L'objectif a été d'étendre des résultats existants pour des données indépendantes dans un cadre dépendant. Dans le chapitre 2, nous étudions le test non paramétrique de Kendall qui nous permet de tester l'existence d'une liaison monotone entre deux variables. Nous proposons une correction robuste du test de Kendall habituel étudié pour une suite de variables aléatoires indépendantes et identiquement distribuées. Nous commençons par montrer numériquement que ce test est mal calibré dans le cas dépendant. Pour résoudre ce problème, nous démontrons un Théorème Central Limite pour la U-statistique de Kendall valable pour une large classe de suites dépendantes en utilisant des coefficients de dépendance proches de ceux introduits par Dedecker et Prieur 2007. La loi limite obtenue fait intervenir une variance limite pour laquelle nous proposons un estimateur. Ces résultats permettent la construction d'une procédure de test asymptotiquement bien calibré. Cette correction est valable pour une grande classe de suites beta_2 dépendantes, sous des conditions quasi-optimales sur ces coefficients. Les résultats sont ensuite illustrés sur plusieurs jeux de simulation. Dans le chapitre 3, nous proposons un estimateur adaptatif de la densité d'une suite de variables aléatoires réelles stationnaires et alpha-mélangeantes au sens de Rosenblatt 1956. Pour cela, nous adaptons une procédure d'estimation adaptative de densité introduite récemment dans un cadre indépendant par Duval et Kappus 2019. Cet estimateur adaptatif est basé sur l'estimation de la fonction caractéristique des observations et ses performances sont étudiées pour des pertes L2. Cette généralisation nécessite à la fois une étude précise du biais de l'estimateur non adaptatif dans le cas mélangeant, et l'utilisation d'une inégalité de Fuk-Nagaev due à Rio 2017 pour démontrer la borne oracle pour l'estimateur adaptatif. Les résultats fournissent (à un logarithmique près) les mêmes vitesses que les vitesses minimax du cas iid, pourvu que les coefficients de mélange décroissent plus vite que k^{-a} pour a>5, ce qui constitue une amélioration par rapport aux résultats existants dans ce cadre. Les résultats sont illustrés via plusieurs jeux de simulation. Dans le chapitre 4, nous étudions le comportement de la distance de Wasserstein Wp, p>1, entre la distribution empirique et la distribution marginale d'une suite strictement stationnaire de variables aléatoires à valeurs dans R^d. L'outil principal est une inégalité de Fournier et Guillin 2015. Les coefficients adaptés pour contrôler les normes de ces quantités sont des coefficients de dépendance introduits par Dedecker et Prieur 2007. Pour contrôler les moments d'ordre r \in (1, 2) on utilise une inégalité de type von Bahr-Esseen et pour contrôler les moments d'ordre r>2, on utilise une inégalité de type Burkholder. En procédant ainsi, nous obtenons des inégalités de moment qui dépendent des valeurs respectives de p, d ainsi que du moment des variables et du taux de décroissance des coefficients de dépendance. Dans le cas du moment d'ordre r=2, on retrouve les conditions de dépendance obtenues par Dedecker et Merlevède 2019 en dimension 1.