Contributions à l'inférence statistique en présence de censure multivariée

par Svetlana Gribkova

Thèse de doctorat en Statistique

Sous la direction de Gérard Biau et de Olivier Lopez.

Le jury était composé de Patrice Bertail, Wenceslao Gonzalez Manteiga, Antoine Chambaz, Agathe Guilloux, Valentin Patilea.


  • Résumé

    L'objectif de cette thèse est d'explorer plusieurs approches pour l'étude des données censurées multivariées, à savoir l'estimation non paramétrique de la fonction de répartition jointe, la modélisation de dépendance par les modèles de copules et l'étude exploratoire par des méthodes de clustering. Le Chapitre 1 introduit le contexte général de cette thèse ainsi que ses contributions. Le Chapitre 2 est consacré à l'estimation de la distribution jointe des deux variables censurées dans le cadre d'un modèle de durée simplifié où la différence entre deux variables de censure est observée. Un nouvel estimateur non paramétrique de la fonction de répartition jointe y est introduit. La normalité asymptotique a été démontrée, pour les intégrales par rapport à la mesure définie par cet estimateur. Le Chapitre 3 est dédié à la problématique de l'estimation non paramétrique de la copule bivariée, à partir d'un échantillon de données censurées. La copule est d'abord estimée par une fonction discrète qui peut être interprétée comme une extension de la copule empirique en présence de censure, puis par ses versions lisses. Les propriétés asymptotiques et des applications de des estimateurs ont été considérées. Le Chapitre 4 présente une approche exploratoire pour l'étude de données censurées. Plus précisément, une configuration multivariée est considérée où une variable est une durée sujette à la censure, et toutes les autres variables sont observées. Sous ces conditions, une nouvelle méthode de quantification de la loi jointe est introduite. La méthode est étudiée théoriquement et appliquée à la construction d'un algorithme de clustering pour des observations censurées.

  • Titre traduit

    Contributions to statistical inference in presence of multivariate censoring


  • Résumé

    The main purpose of this thesis is to explore several approaches for studying multivariate censored data: nonparametric estimation of the joint distribution function, modeling dependence with copulas and k-clustering for the exploratory analysis. Chapter 1 presents the general framework and the contributions of this thesis. Chapter 2 deals with the estimation of the joint distribution function of two censored variables in a simplified survival model in which the difference between two censoring variables is observed. We provide a new nonparametric estimator of the joint distribution function and we establish the asymptotic normality of the integrals with respect to its associated measure. Chapter 3 is devoted to nonparametric copula estimation under bivariate censoring. We provide a discrete and two smooth copula estimators along with two estimators of its density. The discrete estimator can be seen as an extension of the empirical copula under censoring. Chapter 4 provides a new exploratory approach for censored data analysis. We consider a multivariate configuration with one variable subjected to censoring and the others completely observed. We extend the probabilistic k-quantization method in the case of random vector with one censored component. The definitions of the empirical distortion and of empirically optimal quantizer are generalized in presence of one-dimensional censoring. We study the asymptotic properties of the distortion of the empirically optimal quantizer and we provide a non-asymptotic exponential bound for the rate of convergence. Our results are then applied to construct a new two-step clustering algorithm for censored data.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?