Quelques problèmes de sélection de modèles : construction de tests adaptatifs, ajustement de pénalités par des méthodes de bootstrap

par Magalie Fromont

Thèse de doctorat en Mathématiques

Sous la direction de Pascal Massart.

Soutenue en 2003

à Paris 11 .


  • Résumé

    L'approche non asymptotique de la sélection de modèles par pénalisation initialement proposée par Birgé et Magsart pour l'estimation adaptative a pu s'appliquer à de nombreux problèmes statistiques. Cette thèse, consacrée à la construction de tests adaptatifs et de règles de classification dans des cadres non paramétriques, s'inscrit précisément dans cette lignée. Dans une première partie, nous considérons le cadre d'un modèle de densité, où la densité s est supposée appartenir à L2(R). Nous proposons des tests d'adéquation de s à une densité donnée ou à une famille de translation/échelle. Nous décrivons des classes d'alternatives pour lesquelles ces tests ont une puissance prescrite, puis nous montrons qu'ils sont adaptatifs au sens du minimax (à un éventuel facteur logarithmique près) sur des classes de Holder ou des boules de Besov. Une deuxième partie, motivée par une application en vibrométrie laser, traite du problème de la détection d'un signal périodique dans le cadre d'un modèle de régression gaussienne de design régulier. Après une étude des vitesses de séparation minimax sur des boules de l'espace de Sobolev périodique à variance connue, nous présentons un test valable à période et variance inconnues et adaptatif (à un facteur logarithmique près) sur ces boules de Sobolev. Dans une troisième partie, nous envisageons le cadre plus atypique de la classification binaire. Nous construisons de nouvelles règles de classification par minimisation d'un critère défini comme la somme de l'erreur de classification empirique et d'un terme de pénalité basé sur des échantillons bootstrap des observations. Ces règles vérifient des inégalités de type "oracle" et atteignent le risque minimax global sur les classes de Vapnik-Chervonenkis. Les méthodes développées dans cette thèse s'inspirent de la théorie des processus empiriques. Chaque résultat théorique avancé est par ailleurs illustré par une étude expérimentale.


  • Résumé

    The nonasymptotic approach to model selection by penalization for adaptive estimation, as initially proposed by Birgé and Massart, has been adapted to numerous statistical problems. This thesis, which is devoted to the construction of adaptive tests and classification rules in nonparametric frameworks, further developes this line of research. In the first section, we consider a density model, where the density s is assumed to belong to L2(R). We propose some goodness-of-fit tests of hypotheses such as "s equals some given density" or "s belongs to some translation/scale family". We describe classes of alternatives over which these tests have a prescribed power. Then we prove that they are adaptive in the minimax sense (up to a possible logarithmic factor) over Hölder classes or Besov balls. The second section, motivated by an application to laser vibrometry, deals with the problem of periodic signal detection in a Gaussian fixed design regression model. After studying the minimax separation rates over some periodic Sobolev balls when the variance is known, we present a testing procedure available when the variance and the period are unknown, and adaptive (up to a logarithmic factor) over the considered Sobolev balls. In the third section, we consider the binary classification framework. We build new classification rules by minimizing the sum of the empirical classification error and a penalty term based on bootstrap samples of the observations. The obtained rules satisfy "oracle" type inequalities and achieve the global minimax risk over Vapnik-Chervonenkis classes. The methods developed in this thesis are inspired by the empirical processes theory. Each theoretical result is furthermore illustrated by an experimental study.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 150 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.143-147

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : M/Wg ORSA(2003)276
  • Bibliothèque : Bibliothèque Mathématique Jacques Hadamard (Orsay, Essonne).
  • Disponible sous forme de reproduction pour le PEB
  • Cote : FROM
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.