Thèse soutenue

Exploitation des techniques de traitement automatique du langage pour l’étude et la régulation des flux aux urgences : développement et application à l’étude des risques de traumatismes à partir des admissions aux urgences à Bordeaux

FR  |  
EN
Auteur / Autrice : Gabrielle Chenais
Direction : Emmanuel Lagarde
Type : Thèse de doctorat
Discipline(s) : Santé publique Option Informatique et Santé
Date : Soutenance le 11/09/2023
Etablissement(s) : Bordeaux
Ecole(s) doctorale(s) : École doctorale Sociétés, politique, santé publique (Bordeaux)
Partenaire(s) de recherche : Laboratoire : Bordeaux population Health
Jury : Président / Présidente : Pierre-Antoine Gourraud
Examinateurs / Examinatrices : Vianney Jouhet, Nathalie Beltzer
Rapporteurs / Rapporteuses : Aurélie Névéol, Stéfan Jacques Darmoni

Résumé

FR  |  
EN

Le projet TARPON (Traitement Automatique des Résumés de Passage aux urgences dans le but de créer un Observatoire National du traumatisme) vise à démontrer la faisabilité de la mise en place d'un observatoire français des traumatismes. Les services d'urgences génèrent un volume important de données de santé et environ un tiers des visites aux urgences sont liées à des traumatismes. La plupart des informations contenues dans les dossiers médicaux électroniques sont sous forme de texte libre, et l'extraction manuelle d'informations est une tâche chronophage qui nécessite beaucoup de ressources. L'intelligence artificielle (IA) et plus particulièrement le traitement automatique du langage naturel (TALN) pourraient optimiser ce processus. Le TALN a connu un changement de paradigme récent avec l'introduction de l'apprentissage profond et en particulier l'architecture de type Transformer. Ces larges modèles de langage (LLMs) ont atteint l'état de l'art pour la plupart des tâches de TALN et leur utilisation pour les données cliniques et médicales est prometteuse. Afin d’explorer le potentiel des Transformers dans la classification multi-classe des traumatismes, nous les avons évalués sur des notes cliniques en texte libre provenant d'un centre hospitalier universitaire (Bordeaux). Un total de 69 110 notes cliniques en texte libre générées entre 2012 et 2019 ont été annotées manuellement, parmi elles, 22 481 ont été identifiées comme des traumatismes. Nous avons comparé les performances d’outils de classification issus du machine learning traditionel à des modèles de type Transformer. Concernant ces derniers, nous avons utilisé différentes architectures (BERT et GPT-2), des tailles de modèles variables et des modèles pré-entrainés avec des langues et des tokenizers différents pour les corpus de pré-entraînement (OSCAR, Wiki et CCNET). De plus, nous avons étudié l'impact de l'ajout d'une étape de pré-entraînement sur la base de données non labelisée des urgences. Les algorithmes de bagging et le Light Gradient Boosting ont obtenu des résultats similaires aux Transformers les moins performants. De plus, nous avons découvert que des modèles plus grands n’induisaient pas nécessairement par de meilleures performances, en revanche, le choix des corpus de pré-entraînement influençait les performances en classification. Les meilleurs résultats, avec un score F1 moyen de 0,976, ont été obtenus avec une architecture de type GPT-2 comprenant deux étapes de pré-entraînement non supervisé utilisant un corpus français puis la base de données entière. Ces résultats mettent en évidence la capacité des Transformers, en particulier lorsqu'un pré-entraînement non supervisé avec un corpus spécifique au domaine est effectué, dans la classification précise des traumatismes à partir de notes cliniques en texte libre. Notre contribution au projet TARPON a posé les bases de l'utilisation des LLM pour la classification des notes cliniques. Ces modèles, de plus en plus efficaces et puissants, ont récemment entraîné un changement de paradigme dans le domaine du TALN. La plupart des applications d'IA actuellement utilisées en médecine d'urgence sont basées sur le TALN et la reconnaissance vocale automatique en raison mode de documentation privilégié (texte libre ou semi-structuré) des professionnels de santé ou de l'interaction entre le praticien et le patient. Cependant, ces applications ne bénéficient pas d’études de validation et de dérivation ou d'évaluations d'impact adéquates et effectuées de manière rigoureuse et indépendante. La construction d'une IA fiable, sûre et explicable nécessite une approche holistique englobant tous les aspects sociotechniques impliqués. Des facteurs humains tels que la conception participative et les approches transversales sont importants pour la construction de tels systèmes d'IA Dès le commencement de l'étape de conception, il est essentiel d'adopter une approche inclusive (…).