Données de survie

par Marie-Laure Martin

Thèse de doctorat en Mathématiques

Sous la direction de Pascal Massart.

Soutenue en 2001

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .


  • Résumé

    Nous considérons deux problèmes statistiques liés à l'estimation du risque de cancer des survivants d'Hiroshima. Le premier problème est l'estimation de la fonction de risque instantané quand une covariable est sujette à une erreur de mesure. Dans le chapitre 2, les données disponibles sont des données groupées. Nous supposons que l'erreur de mesure est une erreur de mauvais classement dans des intervalles et nous estimons simultanément les paramètres du risque instantané d'un modèle à risque proportionnel et les probabilités de mauvais classement. La méthode proposée est une généralisation de la méthode des moindres carrés. Nous l'appliquons aux données d'Hiroshima pour prendre en compte l'erreur de mesure de la dose de rayonnement ionisant dans l'estimation du risque de cancer. Dans le chapitre 3 les données disponibles sont les données individuelles. Nous considérons un modèle d'excès de risque relatif où la covariable est mesurée à une erreur additive gaussienne près. Nous construisons un critère d'estimation, basé sur la pseudo-vraisemblance et nous proposons un estimateur du paramètre de régression consistant et asymptotiquement gaussien. Le résultat est étendu à d'autres modélisations du risque ainsi qu'au modèle d'erreur log-normale. Le second problème est l'estimation non-paramétrique de la fonction de risque instantané par une procédure de sélection de modèle. Nous considérons une collection suffisamment riche de fonctions pour approcher le risque instantané et nous sélectionnons la meilleure fonction selon un critère pénalisé qui réalise le meilleur compromis entre la qualité de l'approximation du modèle statistique aux données, et le nombre de paramètres du modèle. Cette méthode permet d'estimer le risque instantané sans avoir à poser d'à priori sur sa forme. Nous l'appliquons pour estimer le risque de cancer induit par une faible dose de rayonnement ionisant.


  • Résumé

    We consider two statistical problems arising during the estimation of the hazard function of cancer death in Hiroshima. The first problem is the estimation of the hazard function when the covariate is mismeasured. In Chapter 2, only grouped data are available, and the mismeasurement of the covariate is modeled as a misclassification. An easily implemented estimation procedure based on a generalization of the least squares method is devised for estimating simultaneously the parameters of the hazard function and the misclassification probabilities. The procedure is applied for taking into account the mismeasurement of the dose of radiation in the estimation of the hazard function of solid cancer death in Hiroshima. In Chapter 3 available data are individual data. We consider a model of excess relative risk, and we assume that the covariate is measured with a Gaussian additive error. We propose an estimation criterion based on the partial log-likelihood, and we show that the estimator obtained by maximization of this criterion is consistent and asymptotically Gaussian. Our result extends to other polynomial regression functions, to the Cox model and to the log-normal error model. The second problem is the non-parametric estimation of the hazard function. We consider the model of excess relative and absolute risk and propose a non-parametric estimation of the effect of the covariate using a model selection procedure, when available data are stratified data. We approximate the function of the covariate by a collection of spline functions, and select the best one according to Akaike Information Criterion. By the same way we choose which model between the model of excess relative risk or excess absolute risk fits the best the data. We apply our method for estimating the solid cancer and leukemia death hazard functions in Hiroshima.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 138 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.xxx-xxx. Index

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : M/Wg ORSA(2001)335
  • Bibliothèque : Bibliothèque Mathématique Jacques Hadamard (Orsay, Essonne).
  • Disponible sous forme de reproduction pour le PEB
  • Cote : MART
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.