Analyse de données longitudinales, causalité et parcours de soin : une application aux bases médico-administratives françaises
Auteur / Autrice : | Camille Nevoret |
Direction : | Agathe Guilloux, Sandrine Katsahian, Stéphane Bouée |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 25/04/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Mathématiques et Modélisation d'Évry (Evry, Essonne) |
référent : Université d'Évry-Val-d'Essonne (1991-....) | |
graduate school : Université Paris-Saclay. Graduate School Mathématiques (2020-....) | |
Equipe de recherche : Statistique pour la Génomique et la Génétique | |
Jury : | Président / Présidente : Christophe Ambroise |
Examinateurs / Examinatrices : Vivian Viallon, Olivier Bouaziz, Cécile Proust-Lima | |
Rapporteurs / Rapporteuses : Vivian Viallon, Olivier Bouaziz |
Mots clés
Résumé
Le domaine de la santé connaît depuis plusieurs années une augmentation importante des données disponibles. En France, de nouvelles plateformes ont vu le jour pour centraliser les données de santé, en commençant par les données des bases médico-administratives. Initialement recueillies pour des besoins tarifaires, ces données sont une grande opportunité pour l'études en vie réelle des consommations de soin et leur évolution dans le temps. L'efficacité des traitements est une problématique récurrente dans les études sur données de santé. Notre première contribution porte sur un modèle d'estimation de l'effet moyen du traitement chez les patients traités (ATT) en présence de facteurs de confusion dépendants du temps. Nous avons proposé une estimation débiaisée de l'ATT basée sur une généralisation du modèle de Gran en présence de plusieurs facteurs de confusion continus et dépendants du temps et d'un résultat qui peut être répétés dans le temps, comme des réhospitalisations. Dans un second temps, une extension multivariée du modèle INGARCH a été proposée pour prendre en compte des facteurs de confusion discrets dans l'estimation de l'ATT. L'étude des parcours de soin est une autre thématique très souvent étudiée sur les données de vie réelle. Nous proposons dans nos travaux une procédure d'analyse des parcours de soin hospitalier afin d'évaluer leur association avec la mortalité. Des méthodes d'analyse de séquences prenant en compte l'ordre de la survenue des hospitalisations ont été combinées. Cette procédure d'analyse a été appliquée à l'étude de l'association des hospitalisations cardiovasculaires avec le décès chez des patients atteints d'insuffisance cardiaque.