Modélisation bayésienne de données avec erreurs de mesure et de données manquantes dans un contexte épidémiologique

par Isabelle Deltour

Thèse de doctorat en Biostatistique, santé publique

Sous la direction de Sylvia Richardson.

Soutenue en 1999

à Paris 11 , en partenariat avec Institut national de la santé et de la recherche médicale. Unité (France822) (laboratoire) .

Le président du jury était Jean Maccario.


  • Résumé

    Nous développons une modélisation bayésienne dans un contexte de données mesurées avec erreurs ou de données manquantes. Le cadre d'application est celui d'enquêtes épidémiologiques. La modélisation baye��sienne introduit explicitement des quantités vraies inconnues qui sont traitées comme des variables aléatoires. On exprime toute l'information disponible sur le processus de mesure ou de données manquantes par des sous-modèles stochastiques. Ils sont reliés par des hypothèses d'indépendance conditionnelle. L'inférence fondée sur la loi a posteriori multidimensionnelle complexe, nécessite la programmation d'algorithmes MCMC. Les parties 1 et 2 concernent les erreurs de mesure dans un contexte de régression. Les performances de la modélisation bayésienne complète qui intègre les incertitudes sur les quantités inconnues sont comparées sur des simulations à la méthode de "régression­ calibration", naturelle mais approximative. On montre que l'inférence bayésienne complète est meilleure uniquement si les coefficients de régression sont grands. On propose aussi une modélisation intermédiaire presque aussi performante. Ensuite, on étudie le risque de cancer des survivants des bombes atomiques, en lien avec leur exposition aux irradiations. Cette exposition est mesurée avec erreur et on met en application la modélisation intermédiaire à cause de la nature groupée des données. On obtient sensiblement les mêmes résultats que ceux rapportés dans la littérature avec la méthode de "régression-calibration" , ce qui est cohérent avec les résultats de la partie 1. En partie 3, on propose une modélisation bayésienne pour prendre en compte des données aléatoirement manquantes partiellement informatives, dans un contexte longitu­ dinal. On compare notre modélisation à une méthode d'imputation multiple, l'algorithme SEM. Le cadre d 'application est un modèle markovien sur les stades d'impaludation (partiellement observés) dans une cohorte d'enfants camerounais


  • Résumé

    For epidemiologie surveys including covariates measured with errors or missing data, we propose to use Bayesian models which involve the explicit introduction of latent quantities representing true or missing variables. All available information is expressed in stochastic sub-models, which are linked under conditional independence hypotheses. The inference is based on the multidimensional posterior distribution of all unknown quantities, and requires programming of MC fC algorithms. Parts 1 and 2 of the thesis concern measurement errors in a regression context. The performances of the full Bayesian model, which integrates the uncertainty on all unknown quantities, are compared by simulation to those of the regression calibration method, natural but approximate. We show that the full Bayesian inference is better only if the regression coefficients are large. We also propose an intermediate model which shows good performances. Then we study the cancer risk of t he atomic bomb survivors in relation with their radiation exposure. This exposure is measured with error and the intermediate model is applied due to the grouped nature of the data. We get similar results than those reported in the literature with the method of regression calibration, a finding which is coherent with the results of Part 1. In Part 3, we p:-opose a Bayesian model to take into account non-ignorable missing data in a longitudinal context. We compare our model to a multiple imputation method, the SEM algorithm. The application concerns a Markov model for malaria progression with states partially observed in a cohort of Cameroonian children

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ([6]-225 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 189-199

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Paris-Saclay (Le Kremlin-Bicêtre, Val-de-Marne). Service Commun de la Documentation. Section Médecine.
  • Non disponible pour le PEB
  • Cote : TD/1999T049
  • Bibliothèque : Bibliothèque interuniversitaire de santé (Paris). Pôle pharmacie, biologie et cosmétologie.
  • Non disponible pour le PEB
  • Cote : MFTH 1658
  • Bibliothèque : Bibliothèque interuniversitaire de santé (Paris). Pôle médecine et odontologie.
  • Disponible pour le PEB
  • Cote : PARIS 11 KREMLIN BICETRE_1999_no_T049
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.