Apports de la modélisation causale dans l'évaluation des immunothérapies à partir de données observationnelles

par Vahé Asvatourian

Projet de thèse en Santé publique - biostatistiques

Sous la direction de Stefan Michiels et de Emilie Lanoy.

Thèses en préparation à Paris Saclay , dans le cadre de Santé Publique , en partenariat avec CESP - Centre de recherche en Epidemiologie et Santé des Populations (laboratoire) , Oncostat (Méthodologie et épidémiologie clinique en oncologie moléculaire) (equipe de recherche) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2015 .


  • Résumé

    Les lymphocytes T du système immunitaire ont la capacité d'éliminer les cellules cancéreuses. Or, il existe des protéines qui freinent leur agressivité : les cellules cancéreuses exprimant ces protéines peuvent échapper à leur destruction par les lymphocytes T. De nouvelles stratégies d'immunothérapie ont été proposées ; elles sont basées sur des molécules qui inhibent certains de ces freins, les protéines CTLA-4 ou PD-1, pour rendre le système immunitaire plus efficace contre les cellules cancéreuses. Ces immunothérapies ont été évaluées dans des essais thérapeutiques de phases I à III et, notamment, les anti-PD1/anti-PDL1 ont prouvé leur efficacité dans différentes pathologies, le mélanome métastatique, les cancers du rein métastatiques, les cancers du poumon. Tous les patients ne répondent pas à ces nouvelles immunothérapies avec la même intensité. Afin de pouvoir identifier les patients bénéficiant de ces immunothérapies, on mesure la présence de nombreux marqueurs immunologiques exprimés par les tumeurs à l'instauration du traitement et leur évolution sous traitement. Les anti-CTLA4 et les anti-PD1 ciblant des mécanismes immunologiques distincts, leur action est complémentaire. Leur administration simultanée conduit à un niveau de toxicité élevé ; on ne sait pas encore s'il est préférable de traiter d'abord par anti-CTLA4 puis par anti-PD1/anti-PDL1 ou l'inverse. Le schéma optimal de traitement par immunothérapie n'a pas encore été déterminé : fréquence des injections, traitement en continu versus phase d'induction avec ou sans maintenance versus traitement on/off. En situation observationnelle, l'évaluation de l'effet d'un traitement sur la survenue d'un événement implique de contrôler les facteurs de confusion. En l'absence de tirage au sort du traitement, traités et non traités peuvent ne pas être comparables sur leur risque de base de l'événement (absence d'interchangeabilité). L'interchangeabilité entre les traités et les non traités n'est pas garantie : leur risque de base de décès peut différer. Classiquement, les modèles multivariés ajustés sur les facteurs de confusion visent à identifier les facteurs indépendants de survenue d'un événement. Toutefois, dans certaines situations, quand le facteur est une covariable dépendante du temps ou quand les relations ordonnées entre les facteurs sont inconnues, les méthodes classiques échouent à contrôler les biais de sélection. Les méthodes d'inférence causale sur données observationnelles [1- 3] ont été introduites dans ce contexte. Après avoir identifié les sources de biais de sélection par la construction de diagrammes acycliques dirigés, des modélisations causales visent à atteindre l'interchangeabilité conditionnelle entre exposés et non exposés. Parmi elles, la pondération par l'inverse du score de propension d'exposition au facteur étudié construit à partir des données observationnelles une pseudo-population où exposés et non exposés sont interchangeables (conditionnellement). Les conditions d'application de cette méthode sont l'interchangeabilité conditionnelle qui requiert l'exhaustivité du recueil des facteurs de confusion, la positivité (existence d'exposés et de non exposés pour la même combinaison de facteurs de confusion) et la cohérence (en anglais, consistency). D'autres modélisations causales ont été proposées dont la « G-Formula paramétrique » et la « G-estimation » [4,5] notamment pour être employées quand les conditions d'application de la pondération par l'inverse du score de propension ne sont pas remplies. Dans le contexte d'exposition à des facteurs multidimensionnels (ex : marqueurs immunologiques), des méthodes causales dédiées aux données de grande dimension [6,7] ont été proposées. La thèse a pour objectifs de développer des approches causales et de les appliquer aux questions posées par l'évaluation des immunothérapies. • Axe 1 : Inférence causale dans les analyses de marqueurs immunologiques Méthodes: Théorie des graphes (Directed Acyclic Graphs (DAGs)), adaptation du Causal Stability Ranking (CStaR) dans le contexte où les biomarqeurs sont évalués à l'initiation du traitement et sous traitement (effet des valeurs de base et des pentes d'évolution sous traitement) • Axe 2 : Identifier la meilleure séquence thérapeutique entre anti-CTLA4 et anti-PD1 ou anti-PD1 puis anti-CTLA4 à partir de données observationnelles Méthodes: DAGs, Adaptation de la Pondération inverse par le score de propension (IPW), de la G-formula, de la G-estimation à l'évaluation de deux séquences de deux traitements, le second étant initié après l'échec du premier • Axe 3 : Comparer l'efficacité et la toxicité de différents schémas thérapeutiques d'immunothérapie à partir de données observationnelles Méthodes: DAG, Adaptation des méthodes IPW, G-formula, G-estimation à la comparaison de schémas thérapeutiques faisant varier la fréquence des injections Bibliographie 1. Hernán MA, Lanoy E, Costagliola D, Robins JM. Comparison of dynamic treatment regimes via inverse probability weighting. Basic Clin Pharmacol Toxicol. 2006 Mar;98(3):237-42. 2. Hernán MA, McAdams M, McGrath N, Lanoy E, Costagliola D. Observation plans in longitudinal studies with time-varying treatments. Stat Methods Med Res. 2009 3. Cain LE, Robins JM, Lanoy E, Logan R, Costagliola D, Hernán MA. When to start treatment? A systematic approach to the comparison of dynamic regimes using observational data. Int J Biostat. 2010;6(2) 4. Westreich D, Cole SR, Young JG, Palella F, Tien PC, Kingsley L, Gange SJ, Hernán MA. The parametric g-formula to estimate the effect of highly active antiretroviral therapy on incident AIDS or death. Stat Med. 2012 5. Picciotto S, Hernán MA, Page JH, Young JG, Robins JM. Structural Nested Cumulative Failure Time Models to Estimate the Effects of Interventions. J AmStat Assoc. 2012;107(499). 6. Stekhoven DJ, Moraes I, Sveinbjörnsson G, Hennig L, Maathuis MH, Bühlmann P.Causal stability ranking. Bioinformatics. 2012 28(21):2819-23. 7. Ternès N, Arnedos M, Koscielny S, Michiels S, Lanoy E. Statistical methods applied to omics data: predicting response to neoadjuvant therapy in breast cancer. Curr Opin Oncol. 2014 Nov;26(6):576-83.

  • Titre traduit

    Contribution of the causal model in the evaluation of immunotherapy based on observational data


  • Résumé

    The lymphocytes T from immune system are able to kill cancer cells. However, some proteins could limit their aggressiveness: cancer cells which exhibit these proteins could escape from their destruction by lymphocytes T. New therapeutic strategies based on immunotherapy have been proposed; they are based on molecules which inhibit some immune brakes such CTLA-4 or PD-1 proteins, leading to an immune system more efficient against cancer cells. These immunotherapies have been evaluated in therapeutic trials from phase 1 to phase III, and, for example, anti-PD-1 and anti-PD-L1 have proven their efficacy in various tumors including metastatic melanoma, renal cell carcinoma, lung cancer. All patients exposed to immunotherapies do not respond to treatment with same intensity. To identify patients who benefit from these immunotherapies, a lot of immunologic markers expressed by tumors are measured at treatment initiation and under treatment. Anti-CTLA-4 and anti-PD-1 targeting distinct immunologic processes, their action is additional. A simultaneous exposure leads to over-toxicity; best therapeutic sequence, anti-CTLA-4 followed by anti-PD-1/anti-PD-L1 or reverse sequence, has not been determined yet. Optimal injections frequency, choice of continuous treatment versus induction treatment with or without maintenance treatment versus on/off treatment is not established. In observational settings, evaluating the impact of a treatment on an event occurrence implies to control for confounding. In absence of treatment randomization, treated and untreated could not be comparable on their basal risk of the event (lack of exchangeability of the two groups). For example, if risk of death is not identical among the groups, the groups are not exchangeable. Classically, multivariable models adjusted for confounding aim to identify factors associated with event occurrence. However, in some situations, when the factor is time-varying covariate or when the ordering among factors is unknown, classical methods fail to control for selection bias. Causal inference methods applied on observational data [1- 3] have been introduced in this context. After having identified sources of selection bias in building directed acyclic graphs (DAGs), causal models aim to obtain conditional exchangeability between exposed and non-exposed. Among these methods, inverse probability of exposure weighting (IPW) build from observational data a pseudo-population in which exposed and non-exposed are (conditionally) exchangeable. The conditions of IPW application are the conditional exchangeability which requires that all confounding factors have been measured, the positivity (presence of exposed and non-exposed for each combination of confounding factors) and the consistency. Other causal models have been proposed such as the parametric G-formula and the G-estimation [4,5] and are sometimes applied in context when criteria for IPW methods are not met. When exposure factors are high dimensional (for example, immunologic markers), some causals methods for high-dimensional data [6,7] have been proposed. The PhD research aims to develop causal approaches and to apply them to address questions raised by evaluation of immunotherapies. • Axis 1 : Causal inference in analyzing immunologic markers Methods: Theory of Directed Acyclic Graphs (DAGs), adaptation of Causal Stability Ranking (CStaR) when biomarkers are evaluated at treatment initiation and under treatment • Axis 2 : To identify the best therapeutic sequence between anti-CTLA-4 followed anti-PD-1 or anti-PD-1 followed by anti-CTLA-4, from observational data Methods: DAGs, adaptation of IPW, G-formula and G-estimation in evaluating sequences of two treatment, the second one being initiated at the first one failure • Axis 3 : To compare efficacy and toxicity of different therapeutic regimen of immunotherapy from observational data Methods: DAG, adaptation of IPW, G-formula and G-estimation to the comparison of therapeutic schemes with various injections frequency References 1. Hernán MA, Lanoy E, Costagliola D, Robins JM. Comparison of dynamic treatment regimes via inverse probability weighting. Basic Clin Pharmacol Toxicol. 2006 Mar;98(3):237-42. 2. Hernán MA, McAdams M, McGrath N, Lanoy E, Costagliola D. Observation plans in longitudinal studies with time-varying treatments. Stat Methods Med Res. 2009 3. Cain LE, Robins JM, Lanoy E, Logan R, Costagliola D, Hernán MA. When to start treatment? A systematic approach to the comparison of dynamic regimes using observational data. Int J Biostat. 2010;6(2) 4. Westreich D, Cole SR, Young JG, Palella F, Tien PC, Kingsley L, Gange SJ, Hernán MA. The parametric g-formula to estimate the effect of highly active antiretroviral therapy on incident AIDS or death. Stat Med. 2012 5. Picciotto S, Hernán MA, Page JH, Young JG, Robins JM. Structural Nested Cumulative Failure Time Models to Estimate the Effects of Interventions. J AmStat Assoc. 2012;107(499). 6. Stekhoven DJ, Moraes I, Sveinbjörnsson G, Hennig L, Maathuis MH, Bühlmann P.Causal stability ranking. Bioinformatics. 2012 28(21):2819-23. 7. Ternès N, Arnedos M, Koscielny S, Michiels S, Lanoy E. Statistical methods applied to omics data: predicting response to neoadjuvant therapy in breast cancer. Curr Opin Oncol. 2014 Nov;26(6):576-83.