Étude d'un modèle computationnel pour la représentation du sens des mots par intégration des relations de contexte

par Hyungsuk Ji

Thèse de doctorat en Sciences cognitives

Sous la direction de Hélène Paugam-Moisy et de Sabine Ploux.

Soutenue en 2004

à Grenoble, INPG .

    mots clés mots clés


  • Résumé

    Dans cette thèse nous présentons une approche théorique du concept et un modèle linguistico-informatique. Cette théorie, non définitionnelle, est fondée sur une représentation gaussienne du concept. Nous introduisons le terme " contexonyme ", une formalisation de la relation de contexte entre les mots. Cette notion lie la théorie du concept au modèle informatique. Basé sur ces deux notions, notre modèle informatique apprend des contexonymes de manière automatique à partir de corpus de taille importante non annotés. Pour chaque mot donné, le modèle propose la liste de ses contexonymes et les organise par une méthode de classification hiérarchique. Les contexonymes ainsi obtenus reflètent des connaissances encyclopédiques ainsi que diverses caractéristiques langagières comme l'usage des mots ou encore les fines différences sémantiques entre synonymes. Les résultats sur des tests montrent que le modèle peut être utilisé pour des tâches de TAL ainsi que comme ressource lexicale dynamique.


  • Pas de résumé disponible.

  • Titre traduit

    A study of a computational model for word sense representation by integration of contextual relations


  • Résumé

    In this thesis, we present a theory of concepts and a related computational linguistic model. This non-definitinal theory proposes a view that considers concepts as a Gaussian representation. The term {\em contexonym}, formalized version for `contextually related words', is introduced that relates this theory of concepts and computational model. Based on these two principles, our computational model learns automatically contexonyms from a very large untagged corpus. For a given word, the model proposes a set of its contexonyms and organizes them by a hierarchical clustering method. The contexonyms thus obtained reflect encyclopedic knowledge in addition to various linguistic features like word usage or subtle difference between near-synonyms. The results on different tests show that the model could be used for natural language processing (NLP) tasks as well as a dynamic lexical reference.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : x-235 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 223-235

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS04/INPG/0108
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS04/INPG/0108/D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.