Theoretical study of some statistical procedures applied to complex data

par Vincent R. Cottet

Thèse de doctorat en Math?matiques appliqu?es

Sous la direction de Nicolas Chopin et de Pierre Alquier.

Soutenue le 17-11-2017

à Paris Saclay , dans le cadre de Math?matiques Hadamard , en partenariat avec ENSAE - X - Centre de recherche en ?conomie et statistique (CREST) (laboratoire) , ?cole nationale de la statistique et de l'administration ?conomique (?tablissement op?rateur d'inscription) et de Centre de recherche en ?conomie et statistique (France) (laboratoire) .

Le président du jury était Arnaud Guyader.

Le jury était composé de Nicolas Chopin, Pierre Alquier, Arnaud Guyader, Isma?l Castillo, Peter D. Gr?nwald, Olivier Catoni.

Les rapporteurs étaient Isma?l Castillo, Peter D. Gr?nwald.

  • Titre traduit

    Etude th?orique de quelques proc?dures statistiques pour le traitement de donn?es complexes


  • Résumé

    La partie principale de cette th?se s'int?resse ? d?velopper les aspects th?oriques et algorithmiques pour trois proc?dures statistiques distinctes. Le premier probl?me abord? est la compl?tion de matrices binaires. Nous proposons un estimateur bas? sur une approximation variationnelle pseudo-bay?sienne en utilisant une fonction de perte diff?rente de celles utilis?es auparavant. Nous pouvons calculer des bornes non asymptotiques sur le risque int?gr?. L'estimateur propos? est beaucoup plus rapide ? calculer qu'une estimation de type MCMC et nous montrons sur des exemples qu'il est efficace en pratique. Le deuxi?me probl?me abord? est l'?tude des propri?t?s th?oriques du minimiseur du risque empirique p?nalis? pour des fonctions de perte lipschitziennes. Nous pouvons ensuite appliquer les r?sultats principaux sur la r?gression logistique avec la p?nalisation SLOPE ainsi que sur la compl?tion de matrice. Le troisi?me chapitre d?veloppe une approximation de type Expectation-Propagation quand la vraisemblance n'est pas explicite. On utilise alors l'approximation ABC dans un second temps. Cette proc?dure peut s'appliquer ? beaucoup de mod?les et est beaucoup plus pr?cise et rapide. Elle est appliqu?e ? titre d'exemple sur un mod?le d'extr?mes spatiaux.


  • Résumé

    The main part of this thesis aims at studying the theoretical and algorithmic aspects of three distinct statistical procedures. The first problem is the binary matrix completion. We propose an estimator based on a variational approximation of a pseudo-Bayesian estimator. We use a different loss function of the ones used in the literature. We are able to compute non asymptotic risk bounds. It is much faster to compute the estimator than a MCMC method and we show on examples that it is efficient in practice. In a second part we study the theoretical properties of the regularized empirical risk minimizer for Lipschitz loss functions. We are therefore able to apply it on the logistic regression with the SLOPE regularization and on the matrix completion as well. The third chapter develops an Expectation-Propagation approximation when the likelihood is not explicit. We then use an ABC approximation in a second stage. This procedure may be applied to many models and is more precise and faster than the classic ABC approximation. It is used in a spatial extremes model.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Ecole Nationale de la Statistique et de l'Administration Economique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.