Thèse soutenue

Représentation de l'information pharmaco-thérapeutique des résumés des caractéristiques produit des médicaments : apport des méthodes de traitement automatique du langage naturel, développement, validation et utilisation de modèles

FR  |  
EN
Auteur / Autrice : Catherine Duclos Cartolano
Direction : Alain Venot
Type : Thèse de doctorat
Discipline(s) : Médecine
Date : Soutenance en 2003
Etablissement(s) : Paris 5

Mots clés

FR

Résumé

FR

@Après son autorisation de mise sur le marché, un résumé des caractéristiques produit (RCP) est publié par l'autorité de régulation des produits de santé du pays pour chaque médicament. Ce RCP décrit les propriétés du médicament comme son indication, ses contre-indications, sa pharmacocinétique, sa pharmacodynamie, ses précautions d'emploi, sa posologie. L'ensemble de ces RCP constitue un vaste corpus de textes largement diffusés auprès des professionnels de santé ainsi que le fond documentaire principal des éditeurs de bases de données sur le médicament. Ces RCP sont écrits en langage naturel ce qui limite leur intégration dans des applications informatisées proposant des fonctionnalités avancées de recherche de l'information. Afin de rendre l'information plus accessible, un travail d'identification des concepts contenus dans chaque rubrique est nécessaire. Nous nous sommes ainsi intéressés à modéliser l'information de 3 sections différentes des RCP : la pharmacologie des antibiotiques, les indications et la pharmacocinétique de tous les médicaments. Chacune de ces sections a des caractéristiques particulières qui ont conditionné la recherche d'une méthodologie adaptée à l'exploration de leur contenu. La section pharmacologie des antibiotiques a un haut niveau de standardisation d'écriture ce qui nous a permis de déduire a priori un modèle conceptuel par simple analyse de la structure du texte et de nous orienter vers une extraction automatique afin de construire la base de connaissance. L'indication représente une énumération de situations cliniques mais son format n'est pas standardisé. L'emploi d'outils de traitement du langage naturel nous a permis de repérer des candidats termes et nous a offert un support pour mener une analyse sémantique et construire un modèle de représentation de l'information ensuite validé. La pharmacocinétique quant à elle n'est ni standardisée, ni présentée de façon énumérée. Par ailleurs son domaine a déjà fait l'objet de modélisation mathématique, un ensemble de concepts basiques a pu en être déduit. Ceux-ci ont été utilisés pour sélectionner certains candidats termes issus d'un traitement automatique du langage naturel. Leur contexte d'occurrence a ensuite été exploré pour identifier leur environnement lexical. Le modèle issu de cette analyse, quoique complexe, a lui aussi été validé. L'intérêt des modèles développés a été illustré par des applications permettant de rechercher des médicaments selon des critères nouveaux.