Analyse causale de médiation multiple et applications

par Allan Jérolon

Thèse de doctorat en Mathématiques. Mathématiques appliquées

Sous la direction de Étienne Birmelé, Flora Alarcon et de Vittorio Perduca.

Le président du jury était Agathe Guilloux.

Le jury était composé de Flora Alarcon, Vittorio Perduca, Agathe Guilloux, Anne Philippe, Nicolas Savy, Antoine Chambaz, Vivian Viallon.

Les rapporteurs étaient Anne Philippe, Nicolas Savy.


  • Résumé

    L'analyse de médiation causale est une méthode statistique permettant d'étudier les mécanismes définissant les relations entre trois entités, la première étant une cause, la deuxième une variable de réponse et la troisième un ensemble de variables intermédiaires, aussi appelés médiateurs. Cette approche est devenue populaire dans différents domaines tels que les biostatistiques, l'épidémiologie et les sciences sociales. Son objectif est de décomposer et quantifier l'effet total d'une cause T sur une variable de réponse Y en un effet direct et un effet indirect à travers le(s)médiateur(s) Mi. Dans un diagramme causal ainsi défini peuvent intervenir des covariables mesurées ou non ayant des effets sur les trois variables T, Y et Mi. Quand plusieurs médiateurs sont impliqués dans le modèle de médiation, il y a trois cas possibles de relation entre ces médiateurs : 1) Les médiateurs sont indépendants conditionnellement au traitement et aux covariables mesurées. 2) Les médiateurs sont dépendants conditionnellement au traitement et aux covariables mesurées sans pour autant que l'un affecte l'autre. 3) Les médiateurs sont liés de façon causale, c'est-à-dire que l'un affecte l'autre. Les contributions de cette thèse portent sur les deux premières configurations. Plus particulièrement, l'état de l'art pour l'estimation des effets indirects individuels des médiateurs est de faire plusieurs analyses de médiation simple en parallèle, un médiateur à la fois. Cette approche conduit à une estimation biaisée de l'effet direct et n'est pas justifiée dans la situation 2) car l'hypothèse nécessaire d'Ignorabilité Séquentielle n'est alors pas vérifiée. Le premier chapitre de la thèse propose de résoudre ce problème par l'estimation de la loi multivariée des médiateurs conditionnellement au traitement et décrit les nouvelles hypothèses sous lesquelles une telle approche est valide. Une méthode d'estimation de l'effet direct et de tous les effets indirects individuels est développée, prenant en compte la corrélation entre les médiateurs. Le second chapitre est dédié à l'analyse de médiation multiple2/6dans le cas où le nombre de médiateurs grandit. Deux stratégies sont explorées. La première repose sur une classification spectrale des médiateurs en blocs indépendants, chaque bloc pouvant être analysé avec l'approche précédente. La seconde, applicable dans des problèmes de grande dimension, repose sur la sélection de médiateurs potentiels à l'aide d'une approche de type Group-LASSO en amont de l'analyse de médiation. Le troisième chapitre présente le packageR multimediate où les trois méthodes précédentes sont implémentées. On y présente l'algorithme d'estimation en fonction des différents types de médiateurs considérés (linéaires, binaires et catégoriels). Le dernier chapitre présente des applications sur des données réelles. D'une part une application en épidémiologie pour quantifier et décomposer l'effet de la thérapie hormonal sur le cancer du sein. D'autre part une application en psychiatrie, où nous analysons les effets des tempéraments affectifs sur l'anorexie mentale

  • Titre traduit

    Causal mediation analysis with multiple mediators and applications


  • Résumé

    Causal mediation analysis is a statistical method used to study the mechanisms defining the relationships between three entities, the first being a cause, the second a response variable and the third a set of intermediate variables, also called mediators. This approach has become popular in various domains such as biostatistics, epidemiology and social sciences. The goal of such an analysis is to decompose and quantify the total effect of a cause T on a outcome Y into a direct effect and an indirect effect through the mediator(s) Mi. In a causal diagram defined in this way, measured or unmeasured covariates can intervene with effects on the three variables T, Yand Mi .When several mediators are involved in the mediation model, there are three possible situations:1) The mediators are independent conditionally on the treatment and on the measured covariates.2) Mediators are conditionally dependent on the treatment and on the measured covariates but this dependence is not of causal nature (i.e. mediators do not cause each other).3) Mediators are causally related, that is, one affects the other.The contributions of this thesis focus on the first two configurations. More particularly, the state of the art for estimating the individual indirect effects of mediators isto perform several simple mediation analyzes in parallel, one mediator at a time. This approach leads to a biased estimate of the direct effect and is not justified in situation 2) because the necessary assumption of Sequential Ignorability is then not verified.The first chapter of the thesis proposes to solve this problem by estimating the multivariate distribution of mediators conditional on the treatment and describes the new hypotheses under which such an approach is valid. A method for estimating the direct effect and all individual indirect effects is developed, taking into account the correlation between the mediators. The second chapter is dedicated to the analysis of multiple mediation in the case where the numberof mediators grows. Two strategies are explored. The first is based on a spectral classification of mediators into independent blocks, each block can be analyzed with the previous approach. The second strategy, applicable in large-scale problems, is based on the selection of potential mediators using a Group-LASSO type approach upstream of the mediation analysis. The third chapter presents the R multimediate package where the three previous methods are implemented. We present the estimation algorithm according to the different types of mediators considered (linear, binary and categorical). The last chapter presents applications on real data.On the one hand, I illustrate an application in epidemiology to quantify and disentangling the effect of hormonal therapy on breast cancer. On the other hand, I present an application in psychiatry, where I analyze the effects of affective temperaments on anorexia nervosa


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.