Le Traitement des unités lexicales polysémiques (l'adjectif et le verbe) : vers un système de traduction automatique

par Eun Soon You

Thèse de doctorat en Sciences du langage. Traitement automatique des langues

Sous la direction de Sylviane Cardey-Greenfield.


  • Résumé

    Notre thèse se donne comme objectif le traitement de l’adjectif polysémique applicable au domaine du traitement automatique des langues(TAL) et plus particulièrement à la traduction automatique (TA) (français-coréen). La variabilité du sens des lexiques boursiers génère plusieurs interprétations sémantiques différentes et donc plusieurs traductions. Pour résoudre ce genre de problèmes dans le cadre du TAL, nous proposons un modèle de désambiguïsation en mettant en œuvre des informations co-textuelles et plus particulièrement le nom. Ce dernier constitue un syntagme nominal en se combinant avec un adjectif et permet de lever l’ambiguïté sémantique de l’adjectif et déterminer son sens adéquat. Les indices co-textuels sur lesquels nous nous appuyons sont les suivants : l’ordre syntaxique de l’adjectif, la propriété du nom et la classe sémantique à laquelle le nom appartient. Notre travail consiste à attribuer à chacun des adjectifs polysémiques sélectionnés les informations co-textuelles ci-dessus pour que la machine puisse trouver leur sens correct. La méthodologie proposée est généralisable à d’autres parties du discours, nous l’avons nous-même appliquée au verbe et à son co-texte, le nom

  • Titre traduit

    Processing of Polysemic lexicons (adjective et verb) for an automatic translation system


  • Résumé

    Our thesis has for objective the processing of the polysemic adjective applicable to the domain of Natural Language Processing (NLP) and particularly to automatic translation (French-Korean). The various meaning of the lexicon used in the stock market generates several different semantic interpretations and therefore several translations. To resolve this problem in NLP, we propose a disambiguisation model making use of co-textual information and more particularly the noun. The latter forms a noun clause with the adjective thus allowing one to remove the semantic ambiguity of the adjective and determine its correct meaning. The co-textual hints that we have used are the following: the syntactic order of the adjective, the property of the noun and the semantic class to which the noun belongs. Our work consists in attributing to each polysemic adjective selected the co-textual information mentioned above so that the machine can find its correct meaning. The methodology can be generalized to other parts of speech, we have already applied it to the verb and its co-text, the noun

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (202 f.)
  • Annexes : Bibliogr. f. 196-202

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque universitaire. Section Lettres.
  • Disponible pour le PEB
  • Cote : 219555
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.