Modélisation de la sémantique des verbes composés chinois de type V-V

par Chao-Jan (1969-....) Chen

Thèse de doctorat en Linguistique théorique, descriptive et automatique

Sous la direction de Bernard Victorri.

Soutenue en 2005

à Paris 7 .


  • Résumé

    Dans cette thèse, nous présentons un modèle de la détermination automatique du sens pour les verbes composés de type V-V en chinois. Nous explorons d'abord deux problèmes principaux pour le traitement sémantique automatique des verbes composés en V-V : 1- le recensement incomplet des sens des caractères dans les dictionnaires et l'effet Gestaltiste dans la composition du sens, 2- les sens des composants influencent celui de la construction et vice-versa. Pour régler ces problèmes nous proposons une approche qui utilise deux notions sémantiques nouvelles : les "sens latents" des caractères et le "patron sémantique de composition" associé à un composé en V-V. Nous calculons des mesures d'association entre caractères et sens pour récupérer les sens des caractères non explicitement enregistrés dans le dictionnaire source (sens latents). En se basant sur ces mesures d'association, on peut également calculer la similarité des patrons sémantiques de deux composés en V-V pour retrouver des synonymes potentiels à un composé donné. Nous avons ainsi réalisé un premier système de recherche automatique de synonymes et un deuxième système de classification sémantique automatique, basé sur le premier. Des évaluations quantitatives montrent que la performance de ces systèmes est très satisfaisante.


  • Résumé

    This thesis presents a model of automatic sense determination for the V-V compound verbs in Chinese. First, we explore two major problems in the automatic semantic processing of the V-V compounds: the incomplete collection of character senses in the source dictionaries and the Gestalt effects in the semantic composition of a V-V compound, which means that the senses of the components V influence the sense of the construction, and vice versa. To solve the problems, we propose an approach with the use of two new concepts: the "latent senses" of characters and the "compounding semantic template" associated to a V-V compound. We calculate the measures of association between characters and senses, which allows us to retrieve the character senses that are not explicitly listed in the source dictionary (the latent senses). Based on the association measures, we can also calculate the similarity between the semantic templates of two V-V compounds, which allows us to retrieve potential synonyms of a given V-V compound. We have thus irnplemented a system of automatic synonym retrieval and a system of automatic semantic classification based on the former one. The evaluation experiments show that the performance of our systems is very encouraging.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (263 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 165 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • PEB soumis à condition
  • Cote : TL (2005) 015

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Bibliothèque interuniversitaire de la Sorbonne (Paris).
  • Non disponible pour le PEB
  • Cote : MC 8339
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.