Sondages : la post-stratification et ses limites

par Iyadh Gacem

Thèse de doctorat en Mathématiques appliquées. Statistique

Sous la direction de Michel Lejeune.

Soutenue en 2006

à Grenoble 2 .


  • Résumé

    L'objectif de cette thèse est de rechercher des approximations suffisamment précises du biais et de la variance d'estimateurs post-stratifiés pour pouvoir ensuite étudier leurs comportements limites. Le travail porte sur l'estimation d'un total selon un plan simple. Le premier chapitre donne ces approximations pour la post-stratification sur un seul critère (ou sur les modalités croisées de plusieurs critères). Les formules sont validées par un échantillonnage dans un fichier réel et sur des situations construites. On peut alors mesurer les effets de l'accroissement de la finesse de la partition induite par le critère (c'est-à-dire du nombre de modalités de calage). On constate que les dégradations du biais et de la variance sont lentes. Le chapitre 2 considère la post-stratification couramment utilisée : le calage sur les marges de plusieurs critères. Les approximations établies sont validées comme précédemment. L'équivalence de toute une classe de distances de calage est démontrée. D'une façon générale le biais (au carré) de l'estimateur reste inférieur à sa variance et la dégradation de cette dernière intervient brutalement de façon très sensible lorsque l'on augmente le nombre de catégories de calage. La variété des simulations effectuées incite à une règle de précaution : ne pas dépasser un nombre égal à n/30. Finalement dans les deux derniers chapitres on étudie les cas où les marges de référence sont entachées d'erreurs aléatoires ou déterministes.

  • Titre traduit

    Poststratification and its limits in survey sampling


  • Résumé

    The purpose of the thesis is to establish approximations for the bias and the variance for post-stratified estimators, which are precise enough so as to study limiting behaviours. Estimators considered are for a total under simple random sampling. The first chapter gives approximations for poststratification on a single variable (or on cross-categories of several variables). These are validated on real data as well as on artificial situations. Thus, it is possible to measure the effects of an increasing thin partition of the population (i. E. Of the number of calibration categories). In fact bias and variance deteriorates rather slowly. Chapter 2 considers poststratification as it is mostly used, i. E. Calibration on the marginals of several variables. Approximations are validated as previously. The equivalence of a large class of calibration distances is also shown. Generally speaking, the bias (squared) remains smaller than the variance and the latter, at some point, increases strongly when the number of calibration categories increases. From the variety of simulations completed, a conservative rule to be derived is to keep that number below n/30. Finally, the last two chapters are devoted to situations where the reference margins are not perfectly known, containing either random or deterministic errors.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 2 vol. (335, 197 p.)
  • Notes : Reproduction autorisée par le jury

Où se trouve cette thèse ?

  • Bibliothèque :
  • Accessible pour le PEB
  • Cote : 205141/2006/8js
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.