Inférence statistique dans le modèle de régression logistique avec fraction immune

par Aba Diop

Thèse de doctorat en Mathématiques et applications

Sous la direction de Aliou Diop et de Jean-François Dupuy.

Soutenue le 15-11-2012

à La Rochelle en cotutelle avec l'Université Gaston Berger de Saint-Louis Sénégal , dans le cadre de Sciences et ingénierie pour l'information .

Le président du jury était Sophie Dabo.

Le jury était composé de Emmanuelle Augeraud-Veron, Laurent Barillé, Gane Samb Lô.

Les rapporteurs étaient Avner Bar-Hen, Philippe Besse.


  • Résumé

    Les modèles linéaires généralisés sont une généralisation des modèles de régression linéaire, et sont très utilisés dans le domaine du vivant. Le modèle de régression logistique, l'un des modèles de cette classe, très souvent utilisé dans les études biomédicales demeure le modèle de régression le plus approprié quand il s'agit de modéliser une variable discrète de nature binaire. Dans cette thèse, nous nous intéressons au problème de l'inférence statistique dans le modèle de régression logistique, en présence d'individus immunes dans la population d'étude.Dans un premier temps, nous considérons le problème de l'estimation dans le modèle de régression logistique en présence d'individus immunes, qui entre dans le cadre des modèles de régression à excès de zéros (ou zéro-inflatés). Un individu est dit immune s'il n'est pas exposé à l'événement d'intérêt. Le statut d'immunité est inconnu sauf si l'événement d'intérêt a été observé. Nous développons une méthode d'estimation par maximum de vraisemblance en proposant une modélisation conjointe de l'immunité et des risques d'infection. Nous établissons d'abord l'identifiabilité du modèle proposé. Puis, nous montrons l'existence de l'estimateur du maximum de vraisemblance des paramètres de ce modèle. Nous montrons ensuite,la consistance de cet estimateur, et nous établissons sa normalité asymptotique. Enfin, nous étudions, au moyen de simulations, leur comportement sur des échantillons de taille finie.Dans un deuxième temps, nous nous intéressons à la construction de bandes de confiance simultanées pour la probabilité d'infection, dans le modèle de régression logistique avec fraction immune. Nous proposons trois méthodes de constructions de bandes de confiance pour la fonction de régression. La première méthode (méthodede Scheffé) utilise la propriété de normalité asymptotique de l'estimateur du maximum de vraisemblance, et une approximation par une loi du khi deux pour approcher le quantile nécessaire à la construction des bandes. La deuxième méthode utilise également la propriété de normalité asymptotique de l'estimateur du maximum de vraisemblance et est basée sur une égalité classique de (Landau & Sheep 1970). La troisième méthode (méthode bootstrap) repose sur des simulations, pour estimer le quantile approprié de la loi du supremum d'un processus gaussien. Enfin, nous évaluons, au moyen de simulations, leurs propriétés sur des échantillons de taille finie.Enfin, nous appliquons les résultats de modélisation à des données réelles surla dengue. Il s'agit d'une maladie vectorielle tropicale à transmission strictement inter-humaine. Les résultats montrent que les probabilités d'infection estimées à partir de notre approche de modélisation sont plus élevées que celles obtenues à partir d'un modèle de régression logistique standard qui ne tient pas compte d'une possible immunité. En particulier, les estimations fournies par notre approche suggèrent que le sous-poids constitue un facteur de risque majeur de l'infection par la dengue, indépendamment de l'âge.

  • Titre traduit

    Statistical inference in logistic regression model with immune fraction


  • Résumé

    Generalized linear models are a generalization of linear regression models, and are widely used in the field of life. The logistic regression model, one of this class of models, widely used in biomedical studies remains the most appropriate regression model when it comes to model discrete variable, binary in nature. In this thesis, we investigate the problem of statistical inference in the logistic regression model, in the presence of immune individuals in the study population.At first, we consider the problem of estimation in the logistic regression model in the presence of immune individuals that enters in the case of zero-inflated regression models. A subject is said to be immune if he cannot experience the outcome of interest. The immune status is unknown unless the event of interest has been observed. We develop a maximum like lihood estimation procedure for this problem, based on the joint modeling of the binary response of interest and the cure status. We investigate the identifiability of the resulting model. Then, we establish the existence, consistency and asymptotic normality of the proposed estimator, and we conduct a simulation study to investigate its finite-sample behavior. In a second time, we focus on the construction of simultaneous confidence bands for the probability of infection in the logistic regression model with immune fraction.We propose three methods of construction of confidence bands for the regression function. The first method (Scheffe's method) uses the asymptotic normality of the maximum like lihood estimator, and an approximation by the chi-squared distribution to approximate the necessary quantile for the construction of bands. The second method uses also the asymptotic normality of the maximum like lihood estimator and is based on a classical equality by (Landau & Sheep 1970). The third method (bootstrap method) is based on simulations, to estimate the appropriate quantile of the law of a supremum of a Gaussian process. Finally, we conduct a simulation study to investigate its finite-sample properties.Finally, we consider a study of dengue fever, which is a tropical mosquito-borneviral human disease, strictly inter-human. The results show that, the estimated probabilities of infection obtained from our approach are larger than the ones derived from a standard analysis that does not take account of the possible immunity. Inparticular, the estimates provided by our approach suggest that underweight constitutes a major risk factor for dengue infection, irrespectively of age.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de La Rochelle. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.