Thèse soutenue

Extraction d'événements biomédicaux basée sur des transformers et des graphes de connaissances

FR  |  
EN
Auteur / Autrice : Laura A. Zanella Calzada
Direction : Yannick Toussaint
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 15/12/2023
Etablissement(s) : Université de Lorraine
Ecole(s) doctorale(s) : École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine
Partenaire(s) de recherche : Laboratoire : Laboratoire lorrain de recherche en informatique et ses applications
Jury : Président / Présidente : Thierry Charnois
Examinateurs / Examinatrices : Yannick Toussaint, Anne Vilnat, Natalia Grabar, Mathieu Roche
Rapporteurs / Rapporteuses : Anne Vilnat, Natalia Grabar

Résumé

FR  |  
EN

L'extraction d'événements biomédicaux peut être divisée en trois sous-tâches principales : (1) la détection de déclencheurs d'événements biomédicaux, (2) l'identification d'arguments biomédicaux et (3) la construction d'événements. Dans cette étude, pour la première sous-tâche, nous analysons un ensemble de modèles de langage transformer couramment utilisés dans le domaine biomédical afin d'évaluer et de comparer leur capacité à détecter les déclencheurs d'événements. Nous affinons les modèles en utilisant sept corpus annotés manuellement pour évaluer leurs performances dans différents sous-domaines biomédicaux. SciBERT s'est révélé être le modèle le plus performant, présentant une légère amélioration par rapport aux modèles de référence. Pour la deuxième sous-tâche, nous construisons un graphe de connaissances (KG, en anglais) à partir des corpus biomédicaux et intégrons ses embeddings KG à SciBERT pour enrichir son information sémantique. Nous démontrons que l'ajout des embeddings KG au modèle améliore la performance de l'identification d'arguments d'environ 20 %, et d'environ 15 % par rapport à deux modèles de référence. Pour la troisième sous-tâche, nous utilisons le modèle génératif, ChatGPT, basé sur des invitations, pour construire l'ensemble final d'événements extraits. Nos résultats suggèrent que l'affinage d'un modèle transformateur pré-entraîné à partir de zéro avec des données biomédicales et générales permet de détecter les déclencheurs d'événements et d'identifier des arguments couvrant différents sous-domaines biomédicaux, améliorant ainsi sa généralisation. De plus, l'intégration des embeddings KG dans le modèle peut significativement améliorer la performance de l'identification d'arguments d'événements biomédicaux, surpassant les résultats des modèles de référence.