Thèse soutenue

FR
Auteur / Autrice : Sébastien Markley
Direction : Anne Ruiz-Gazen
Type : Thèse de doctorat
Discipline(s) : Mathématiques. Statistiques
Date : Soutenance en 2008
Etablissement(s) : Toulouse 1

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Cette thèse CIFRE a été réalisée au sein de l’institut de sondage BVA. BVA développe des techniques de prédiction de la répartition des dépenses françaises à partir de bases de données de consommation. Dans ce cadre, nous avons construit un modèle Logit Conditionnel pour prédire les choix de magasins de grandes surfaces des ménages, puis utilisé les techniques d’imputation pour prédire les choix de produits de ces mêmes ménages. Nous montrons que les choix de magasins sont insensibles aux caractéristiques sociodémographiques des ménages. Par contre, l’utilisation des distances entre magasins et domiciles et les caractéristiques géographiques des voisinages des magasins sont essentielles pour la prédiction. Dans un premier chapitre, nous rappelons les principaux aspects des modèles Logit Conditionnels, et décrivons les données utilisées. Dans un deuxième chapitre, nous adaptons le Logit Conditionnel au problème traité. Nous explorons différentes pistes pour réduire la taille trop importante de l’ensemble de choix. Puis, après avoir étudié les propriétés des critères usuels d’évaluation de la prédiction dans les modèles de choix, nous proposons un autre critère basé sur la calibration du modèle. Dans un troisième chapitre, nous donnons une illustration à partir des données de l’enquête " Flux d’Achats " sur la Région Centre. Dans un dernier chapitre, nous utilisons les techniques d’imputation pour prédire les choix de produits selon les choix de magasins.