Extraction automatique des diagnostics à partir des comptes rendus médicaux textuels

par Didier Nakache

Thèse de doctorat en Informatique

Sous la direction de Elisabeth Métais.

Soutenue en 2007

à Paris, CNAM .


  • Résumé

    Pour évaluer des actions visant à améliorer la santé publique, les analyses s'appuient majoritairement sur les diagnostics des patients hospitalisés. Si celui-ci ne pose pas de problème au praticien, son codage nécessite une précision particulière. La France, comme de nombreux pays, utilise la 10ème version de la Classification Internationale des Maladies (CIM-10). La saisie des codes diagnostics est compliquée car elle nécessite une recherche laborieuse dans un catalogue comportant plus de 50 000 items. De plus, le praticien est confronté à un problème de temps et de subjectivité, en particulier eu égard à ses domaines d'expertise du praticien. Le projet CIREA (Classification Informatique pour la REAnimation) fournit un outil informatique d'aide au codage CIM-10 qui permet aux praticiens d'obtenir un codage reproductible et de meilleure qualité tout en y consacrant moins de temps. Après analyse du compte rendu d'hospitalisation (CRH) rédigé en langue naturelle, le logiciel propose automatiquement au praticien un ensemble de codes pertinents en implémentant des algorithmes d'analyse du texte (textmining). L'outil explique également la justification des choix proposés en montrant la force de la relation entre les termes ou concepts utilisés et les diagnostics proposés. Les travaux réalisés pour ce projet sont transposables à d'autres secteurs fonctionnels et peuvent se faire rétrospectivement.


  • Résumé

    Most of public health actions are based on analysis of diagnostics. Identify them is not a problem for the practitioner, but their coding need a particular attention. In France, like in many other countries, we use the 10th version of International Classification of Diseases (ICD-10). Choosing a patient’s reasons for staying in hospital among the 52,000 pathology codes listed in the ICD-10 (International Classification of Diseases) requires that the practitioner spends a lot of time for keyboarding and searching, which may discourage him. The aim of the CIREA project is to propose an automatic ICD coding approach by mining textual medical reports. Cirea can also explain the justification of the proposed codes by showing the strength of the relation between the terms or concepts used and the proposed diagnoses. Works achieved for this project are fully transposable to other sectors and algorithms can run retrospectively.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (209 p.)
  • Annexes : Bibliogr. p. 179-200

Où se trouve cette thèse ?

  • Bibliothèque :
  • PEB soumis à condition
  • Cote : Th A 560
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.