Elaboration de ressources électroniques pour les noms composés de type N (E+DET=G) N=G du grec moderne

par Anthoula Kyriakopoulou

Thèse de doctorat en Informatique et linguistique

Sous la direction de Panayota-Tita Kyriacopoulou.

Le président du jury était Eric Laporte.

Le jury était composé de Panayota-Tita Kyriacopoulou, Aggeliki Fotopoulou, Sébastien Paumier.

Les rapporteurs étaient Anna Anastassiadis-Syméonidis, Denis Maurel.


  • Résumé

    L'objectif de cette recherche est la construction manuelle de ressources lexicales pour les noms composés grecs qui sont définis par la structure morphosyntaxique : Nom (E+Déterminant au génitif) Nom au génitif, notés N (E+DET:G) N:G (e.g. ζώνη ασφαλείας/ceinture de sécurité). Les ressources élaborées peuvent être utilisées pour leur reconnaissance lexicale automatique dans les textes écrits et dans d'autres applications du TAL. Notre travail s'inscrit dans la perspective de l'élaboration du lexique-grammaire général du grec moderne en vue de l'analyse automatique des textes écrits. Le cadre théorique et méthodologique de cette étude est celui du lexique-grammaire (M. Gross 1975, 1977), qui s'appuie sur la grammaire transformationnelle harisienne.Notre travail s'organise en cinq parties. Dans la première partie, nous délimitons l'objet de notre travail tout en essayant de définir la notion fondamentale qui régit notre étude, à savoir celle de figement. Dans la deuxième partie, nous présentons la méthodologie utilisée pour le recensement de nos données lexicales et nous étudions les phénomènes de variation observés au sein des noms composés de type N (E+DET:G) N:G. La troisième partie est consacrée à la présentation des différentes sous-catégories des N (E+DET:G) N:G identifiées lors de l'étape du recensement et à l'étude de leur structure lexicale interne. La quatrième partie porte sur l'étude syntaxico-sémantique des N (E+DET:G) N:G. Enfin, dans la cinquième partie, nous présentons les différentes méthodes de représentation formalisée que nous proposons pour nos données lexicales en vue de leur reconnaissance lexicale automatique dans les textes écrits. Des échantillons représentatifs des ressources élaborées sont présentés en Annexe

  • Titre traduit

    The N (E + DET=G) N=G compound nouns in Modern Greek


  • Résumé

    The object of this research is the manual construction of lexical resources for the Greek compound nouns defined by the following morphosyntactic structure : Noun (E+Determiner in genitive) Noun in genitive, (N (E+DET:G) N:G) (e.g. ζώνη ασφαλείας/safety belt). The elaborated resources may be used for their automatic recognition in written texts and other NLP applications. Our study is part of the general lexicon-grammar for Modern Greek in view of automatic processing of written texts. Our theoretical and methodological framework is that of lexicon-grammar (M. Gross 1975, 1977), based on the Transformational Grammar principles defined by Z. S. Harris. Our study is organised into five parts. In the first part, we give an overview of the core notion governing our research : the notions of (fixed) multiword expression (MWE). In the second part, we present the methodology used to collect our lexical data and we study the variation phenomena observed within the framework of the N (E+DET:G) N:G. The third part is dedicated to the presentation of the different N (E+DET:G) N:G categories identified in the listing phase qnd to the study of their lexical composition. The fourth concerns the syntactical and semantic study of the N (E+DET:G) N:G. Finally, the fifth part deals with the formal representation methods we propose for our lexical data in view of their lexical recognition in Greek written texts. Representative samples of the elaborated resources are illustrated in Appendix


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Autre version

Cette thèse a donné lieu à une publication en 2011 par Université de Paris Est à Paris Est

Elaboration de Ressource électronique pour les noms composés de type N (E+DET=G) N=G du grec moderne


Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Communautés d’Universités et d'Etablissements Université Paris-Est. Bibliothèque universitaire.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.
Cette thèse a donné lieu à 1 publication .

Consulter en bibliothèque

Cette thèse a donné lieu à une publication en 2011 par Université de Paris Est à Paris Est

Informations

  • Sous le titre : Elaboration de Ressource électronique pour les noms composés de type N (E+DET=G) N=G du grec moderne
  • Détails : 1 vol. (279 p.)
  • Annexes : Bibliogr. p. 257-278
La version de soutenance de cette thèse existe aussi sous forme papier.

Où se trouve cette thèse ?

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.