Thèse soutenue

Développement de méthodes d’intelligence artificielle pour l’analyse de données de réseaux sociaux et à des fins de recherche médicale : cas d’utilisation sur une étude mondiale sur le diabète

FR  |  
EN
Auteur / Autrice : Adrian Ahne
Direction : Guy FagherazziThomas Czernichow
Type : Thèse de doctorat
Discipline(s) : Santé publique - épidémiologie
Date : Soutenance le 25/01/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Santé Publique
Partenaire(s) de recherche : Laboratoire : Centre de recherche en épidémiologie et santé des populations (Villejuif, Val-de-Marne ; 2010-....)
référent : Université Paris-Saclay. Faculté de médecine (Le Kremlin-Bicêtre, Val-de-Marne ; 2020-....)
graduate school : Université Paris-Saclay. Graduate School Santé publique (2020-....)
Jury : Président / Présidente : Pascale Tubert-Bitter
Examinateurs / Examinatrices : Sandra Bringay, Gayo Diallo, Adam Hulman, Marie-Aline Charles
Rapporteurs / Rapporteuses : Sandra Bringay, Gayo Diallo

Résumé

FR  |  
EN

Contexte : Le diabète et la détresse liée au diabète représentent un fardeau mondial et leur incidence est en constante augmentation. L'épidémiologie traditionnelle du diabète présente plusieurs lacunes qui pourraient être comblées avec certaines approches innovantes. En effet, cela peut prendre de nombreuses années entre l'identification et la conception d'une question de recherche, l'obtention de la validation des autorités et l'inclusion des participants aux résultats de la recherche. L'épidémiologie numérique offre ainsi une opportunité de récolter rapidement des données en croissance exponentielle dans l'espace numérique. Il s’agit d’une source de données qui n'est pas disponible dans un contexte traditionnel. En outre, les systèmes d'aide à la décision clinique basés sur l'IA ont le potentiel d'aider les professionnels de la santé à filtrer les informations essentielles dans la masse de données textuelles disponibles telles que les dossiers de santé électroniques, la littérature scientifique ou les réseaux sociaux. Objectifs:Les objectifs principaux de cette thèse étaient 1) l'exploration des réseaux sociaux, comme source de données complémentaire pour l'épidémiologie du diabète; 2) le développement et l'open-sourcing de méthodes innovantes d’intelligence artificielle pour extraire des informations; 3) et fournir un système d'aide à la décision clinique aidant les professionnels de la santé à analyser les données textuelles en constante augmentation. Résultats: Les principales préoccupations et sujets d'intérêt liés au diabète ont été identifiés, avec les émotions associées, mettant en lumière des sujets préoccupants sur l’accès aux soins, comme par exemple la frustration liée au prix de l'insuline aux États-Unis. Des associations “cause-effet” liées au diabète ont également été identifiées et visualisées dans un réseau interactif. Enfin, un système d'aide à la décision clinique interactif alimenté par une méthode d’intelligence artificielle a été développé pour améliorer l'exploration de la littérature dans le processus de prise de décision clinique, permettant une interprétabilité accrue tout en réduisant la consommation de mémoire. Conclusion: Ce travail a démontré que les données en ligne peuvent être utiles et complémentaires à celles de l'épidémiologie traditionnelle. Avec le cas d’usage du diabète, ce travail a également souligné l'importance des facteurs psychologiques et des émotions dans le quotidien et leur poids dans le fardeau de la maladie. Ce travail suggère une plus grande inclusion de ces dimensions dans les futures études épidémiologiques sur le diabète. Enfin, le besoin d'outils d’aide à la décision pour la pratique clinique pour synthétiser la littérature sur un sujet donné a été identifié et le prototype développé doit désormais être testé en situation réelle.