Thèse de doctorat en Mathématiques appliquées. Statistique
Sous la direction de Michel Carbon.
Soutenue en 2003
à Rennes 2 .
Cette thèse est consacrée à l'estimation de la variance et à l'utilisation de variables auxiliaires lorsqu'on dispose de plusieurs échantillons. Le premier chapitre, extrait d'un rapport rédigé pour Eurostat, présente une revue bibliographique sur les méthodes d'estimation de la variance en sondage ainsi que leur implémentation dans le logiciel Poulpe lorsque cela est possible. Nous définissons dans le chapitre 2 les plans de sondage bidimensionnels et nous donnons une formule de la variance de type Horvitz-Thompson pour des estimateurs linéaires qui dépendent des deux échantillons. Nous exhibons le meilleur estimateur linéaire sans biais et proposons un estimateur de sa variance. Des formules explicites sont données pour certains plans bidimensionnels. Une technique de linéarisation sur deux échantillons est proposée afin de pouvoir estimer la variance de fonctions non linéaires de totaux. Ensuite, nous développons un modèle nonparamétrique basé sur les polynomes locaux permettant de tenir compte de l'information auxiliaire. Enfin, nous proposons dans le chapitre 3 une nouvelle approche nonparamétrique basée sur les splines de régression. Nous prouvons la convergence de l'estimateur proposé et validons, sur des simulations, son bon comportement dans la pratique.
Variance estimation in multi-occasions sampling and nonparametric regression estimation in order to take auxiliary information into account
Pas de résumé disponible.
This Phd deals with the variance estimation and the use of auxiliary information when we have more than one sample. The first chapter, which is a part of a report made for Eurostat, gives a review of the main techniques for estimating the variance and their implementation in the software POULPE, when it is possible. We define, in chapter 2, a bidimensional sampling design and we give a variance Horvitz-Thompson type formula for linear estimators that depend on these two samples. We derive the best linear unbiased estimator and a variance estimator is also proposed. Explicit formulas are given for particular bidimensional sampling designs. A technique of linearization on two samples is developped in order to deal with non linear statistics of totals. Then, we use auxiliary information for improving estimates by means of nonparametric regression estimators based on local polynomials. Finally, we study in chapter 3 a new approach based on regression splines for taking into account the auxiliary information for estimating the poulation total. Consistency results are proved and simulations confirm the good behaviour of this estimator in practice.