Annotation sémantique automatique de textes par exploration contextuelle?x : application aux relations de localisation en coréen

par Hyunzoo Chai

Thèse de doctorat en Informatique

Sous la direction de Jean-Pierre Desclès.

Soutenue le 09-07-2009

à Paris 4 , dans le cadre de École doctorale Concepts et langages (Paris) .

Le président du jury était Christian Fluhr.

Le jury était composé de Jean-Pierre Desclès, Maryvonne Abraham, André Fabre, Patrice Pognan, Aesun Yoon.


  • Résumé

    Le travail effectué au cours de ma thèse s’inscrit dans le cadre du Web Sémantique pour rendre l’annotation sémantique. La vision du Web Sémantique a pour son objectif d’avoir les informations disponibles pour que les utilisateurs puissent les exploiter selon leurs besoins. En effet, dans les systèmes d’information actuels, dont la complexité se traduit par un volume important de données, le défi n’est plus de réunir des données, mais d’en extraire des informations pertinentes. Pour cela, les données doivent être étiquetées sémantiquement. En plus, comparé aux langues flexionnelles comme le Français, la technologie dans le traitement de langue agglutinative comme le Coréen a toujours des manques à cause de la complexité des morphologies et syntaxe.

  • Titre traduit

    Automatic Semantic Annotation based on the Exploration Contextual method and Application for localization relations in Korean Text


  • Résumé

    We present an automatic semantic annotation system for Korean on the EXCOM (EXploration COntextual for Multilingual) platform. The purpose of natural language processing is enabling computers to understand human language, so that they can perform more sophisticated tasks. Accordingly, current research concentrates more and more on extracting semantic information. The realization of semantic processing requires the widespread annotation of documents. However, compared to that of inflectional languages, the technology in agglutinative language processing such as Korean still has shortcomings. EXCOM identifies semantic information in Korean text using our new method, the Contextual Exploration Method. Our system properly annotates approximately 90% of standard Korean sentences, and this annotation rate holds across text domains.

Consulter en bibliothèque

La version de soutenance existe

Informations

  • Détails : 1 vol. (205 f.)
  • Annexes : Bibliogr. f. 200-205

Où se trouve cette thèse ?

  • Bibliothèque : Université de Paris-Sorbonne Paris 4. Service commun de la documentation. Bibliothèque Serpente.
  • Consultable sur place dans l'établissement demandeur
  • Cote : BUT 7268
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.