Thèse soutenue

Utilisation de l'exploration contextuelle pour l'aide à la veille technologique : réalisation du système informatique vigitext

FR  |  
EN
Auteur / Autrice : Bénédicte Goujon
Direction : Jean-Pierre Desclès
Type : Thèse de doctorat
Discipline(s) : Linguistique
Date : Soutenance en 2000
Etablissement(s) : Paris 4

Mots clés

FR

Résumé

FR

Afin de faciliter l'exploitation des données textuelles dans une veille technologique, nous avons développé une méthode basée sur des notions générales, telles que l'amélioration, l'utilisation, le changement. Les connaissances linguistiques en anglais, associées à ces notions, permettent la mise en valeur d'extraits textuels introduisant des informations de veille : description de ce qui est amélioré, description d'utilisations, descriptions de ce qui a changé. Par exemple, les extraits suivants sont associés a la notion de changement : « the oligonucleotide is chem. *modified* », « *modification* of biosynthetic pathways by genetic engineering », « *alters* fruit ripening ». La méthode, mise au point à partir d'un corpus de références de brevets sur les plantes transgéniques, s'appuie sur l'exploration contextuelle. L'étude de corpus nous a amenée à identifier seize notions. Cette méthode est utilisable sur différents domaines, et adaptée pour l'analyse de documents traitant de sujets nouveaux, tels que les références de brevets. Le système vigitext, que nous avons développé avec le langage java, s'appuie sur 170 indicateurs linguistiques des notions et 67 règles d'exploration contextuelles, et fournit des extraits accessibles en sélectionnant chaque notion sur l'interface. L'utilisateur du système vigitext est le veilleur, qui peut consulter le contenu informatif d'une base sans avoir à formuler de requête.