Estimation par sélection de modèle en régression hétéroscédastique

par Xavier Gendre

Thèse de doctorat en Mathématiques

Sous la direction de Yannick Baraud.


  • Résumé

    Cette thèse s'inscrit dans les domaines de la statistique non-asymptotique et de la théorie statistique de la sélection de modèle. Son objet est la construction de procédures d'estimation de paramètres en régression hétéroscédastique. Ce cadre reçoit un intérêt croissant depuis plusieurs années dans de nombreux champs d'application. Les résultats présentés reposent principalement sur des inégalités de concentration et sont illustrés par des applications à des données simulées. La première partie de cette thèse consiste dans l'étude du problème d'estimation de la moyenne et de la variance d'un vecteur gaussien à coordonnées indépendantes. Nous proposons une méthode de choix de modèle basée sur un critère de vraisemblance pénalisé. Nous validons théoriquement cette approche du point de vue non-asymptotique en prouvant des majorations de type oracle du risque de Kullback de nos estimateurs et des vitesses de convergence uniforme sur les boules de Hölder. Un second problème que nous abordons est l'estimation de la fonction de régression dans un cadre hétéroscédastique à dépendances connues. Nous développons des procédures de sélection de modèle tant sous des hypothèses gaussiennes que sous des conditions de moment. Des inégalités oracles non-asymptotiques sont données pour nos estimateurs ainsi que des propriétés d'adaptativité. Nous appliquons en particulier ces résultats à l'estimation d'une composante dans un modèle de régression additif.

  • Titre traduit

    Model selection in heteroscedastic regression


  • Résumé

    This thesis takes place within the theories of nonasymptotic statistics and model selection. Its goal is to provide data-driven procedures to estimate some parameters in heteroscedastic regression. This framework is receiving a large interest in various domains of applied mathematics. Our procedures rely in particular on some concentration inequalities and their practical efficiency is assessed on simulated data. The first part is devoted to simultaneous estimation of the mean and the variance of a Gaussian vector with independent coordinates. To this end, we introduce a model selection procedure based on some penalized likelihood criterion. We prove nonasymptotic results for this method, such as oracle type inequalities and uniform convergence rates over Hölderian balls. We also consider the problem of estimation of the regression function in an heteroscedastic regression framework with known dependencies. Model selection procedures are constructed for Gaussian errors and under moment conditions. Nonasymptotic oracle type inequalities and adaptivity are proved for the estimators. In particular, we apply these procedures to estimate a component in an additive regression model.

Autre version

Cette thèse a donné lieu à une publication en 2009 par [CCSD] [diffusion/distribution] à Villeurbanne

Estimation par sélection de modèle en régression hétéroscédastique

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (vi-77 p.)
  • Annexes : Bibliogr. p. 75-77. Résumés en français et en anglais

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Bibliothèque Sciences.
  • Non disponible pour le PEB
  • Cote : 09NICE4027
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.