Coréférence événementielle cross-document dans les dossiers électroniques patient

par Julien Tourille

Projet de thèse en Informatique

Sous la direction de Xavier Tannier et de Aurélie Neveol.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec LIMSI - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (laboratoire) , ILES - Information, Langue Ecrite et Signée (equipe de recherche) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2015 .


  • Résumé

    Ce projet s'appuie sur les technologies de l'information et de la communication et plus particulièrement le traitement automatique de la langue, afin de proposer une analyse des documents textuels non structurés issus des dossiers électroniques patients. Le projet aborde une problématique pluridisciplinaire avec une perspective applicative en santé publique, afin de proposer une contribution à la prise en charge de pathologies chroniques. Des informations importantes sur des questions de santé publique se trouvent dans les dossiers électroniques patient rédigés en langue naturelle. Ces dossiers patient constituent un corpus considérable qui croit au rythme de plusieurs centaines de milliers de documents chaque année pour un seul établissement hospitalier. L'analyse rétrospective des parcours de santé permet aux professionnels de santé d'avoir une vue synthétique sur la prise en charge d'une pathologie au sein de leur établissement. Elle permet de comparer les prises en charge effectives avec les recommandations de bonne pratique afin d'évaluer la qualité des parcours de soin, d'identifier des éléments du parcours demandant une prise en charge spécifique, d'améliorer la démarche diagnostique ou thérapeutique. Dans ce projet, nous proposons de développer des méthodes de traitement automatique de la langue biomédicale permettant de faciliter la synthèse d'informations sur les parcours de soin dans le cadre d'analyses rétrospectives. Notre travail portera sur le contenu textuel des dossiers patients, notamment les comptes-rendus de séjour et comptes-rendus d'actes.

  • Titre traduit

    Cross-document event coreference in electronic patient records


  • Résumé

    Important information for public health is locked in Electronic Patient Records which are written in natural language. These records represent a very large corpus, which grows by several hundreds thousands of documents every year, per hospital. The retrospective analysis of these records allows health professionals to obtain a concise view of the healthcare pathways within their institutions. It allows to compare effective patient care to clinical guidelines in order i) to evaluate the quality of the healthcare pathway, ii) to highlight the steps of the pathway where specific care should be provided and iii) to further improve the diagnosis process and the therapeutic approach. In my PhD dissertation, I propose to develop natural language processing methods adapted to the clinical language, which will facilitate the summarization of information regarding healthcare pathways, in the context of retrospective analyses.