Thèse soutenue

Couplage entre les bases de données factuelles et bases de données bibliographiques : Identification dans Medline des gènes décrits dans Flybase et application à l'extraction d'informations sur les interactions génétiques ou moléculaires à partir de publications

FR  |  
EN
Auteur / Autrice : Ambroise Ingold
Direction : Luc Quoniam
Type : Thèse de doctorat
Discipline(s) : Sciences de l'information et de la communication
Date : Soutenance en 2002
Etablissement(s) : Aix-Marseille 3

Mots clés

FR

Résumé

FR  |  
EN

La thèse propose des solutions pour mettre automatiquement en relation des informations bibliographiques avec des informations factuelles. Il s'agit de documenter des encyclopédies en ligne avec des références bibliographiques ou d'extraire des informations directement à partir de la littérature scientifique. Nous avons pris l'exemple des gènes et de leurs interactions chez la mouche (Drosophile). Nous avons mis au point un logiciel qui permet d'identifier dans Medline des gènes décrits dans Flybase (encyclopédie sur la Drosophile) et de reconnaître les textes décrivant des interactions entre ces gènes. La difficulté dans l'automatisation de cette tâche réside dans la complexité de la nomenclature (existence d'alias et d'abréviations, composition de termes utilisant des noms de gènes. Etc. ), dans la confusion possible entre certains noms de gènes et des mots du vocabulaire courant et dans l'absence de mots clefs suffisamment univoques pour marquer les phrases décrivant une interaction.