Modélisation des expressions figées en arabe en vue de la constitution d'une base de données lexicale

par Sylver Aboubakar Minko-Mi-Nseme

Thèse de doctorat en Linguistique et sémiologie de l'arabe

Sous la direction de Joseph Dichy et de Mohamed Hassoun.

Soutenue en 2002

à Lyon 2 .


  • Résumé

    Notre travail se situe dans le cadre de la lexicologie. Il a pour but, la conception d'une classification des structures morphosyntaxiques des expressions figées en arabe, en vue de la constitution d'une base de données lexicale. Dans notre étude, les expressions figées sont appelées phrasèmes car nous avons choisi de travailler à partir de la conception de MELCUK (voir Melcuk 1995, 1997), qui s'appuyant sur la théorie sens-texte, utilise les représentations sémantiques pour créer des arbres syntaxiques. Le phrasème est défini comme étant une locution employée dans une acception bien spécifique et munie de toutes les informations justifiant son emploi dans un texte. A partir de cette définition, nous avons, dans la première partie de la thèse, étudié les différentes classes de phrasèmes. Nous en avons dénombré trois : - Le phrasème complet au sens opaque, n'incluant le signifié d'aucun des constituant du phrasème. - Le semi-phrasème au sens semi-opaque, incluant le signifié de certains éléments du phrasème. - Le quasi-phrasème au sens compositionnel, incluant le signifiés de tous les éléments du phrasème avec un surplus imprévisible. Dans notre étude, les phrasèmes ne sont pas classés selon leur fonction dans une phrase mais plutôt à partir de leur structure. Ce qui nous donne les phrasèmes à initiale nominale, les phrasèmes à initiale verbale, les phrasèmes à initiale prépositionnelle, les phrasèmes à initiale pronominale et les phrasèmes à initiale adjectivale. La seconde partie de la thèse est consacrée l'étude morphosyntaxique et sémantique des quatre cent soixante dix catégories de catégories de phrasèmes rencontrés. A partir de cette étude, nous créons, dans la troisième partie de la thèse, l'Arbre de Mise en Format des Phrasèmes que nous appelons A. MI. FO. P. Cet arbre se compose de cinq racines, trente cinq noeuds, cent neuf branches et quatre cent neuf feuilles. Ces différents éléments sont tous reliés les uns aux autres. Pour utiliser cet arbre, nous avons créé le système d'utilisation de l'A. MI. FO. P. Ce système est basé sur l'arbre élémentaire, pour la représentation syntaxique et sur l'arbre de dérivation pour la représentation sémantique. Ces arbres permettent une reconnaissance plus aisée des phrasèmes arabes lors du traitement automatique.


  • Pas de résumé disponible.

  • Titre traduit

    Classification of Arabic set phrases in order to create a lexical database.


  • Résumé

    This work is about the lexicology of Arabic set phrases. It aims for the conception of a morpho-syntactic structure classification of Arabic set phrases, in order to create a lexical database. In our study, set phrases are called "phrasemes". Our work is based on Mel'cuk's works grounded on the Meaning-Text theory. A "phraseme" is a set phrase used in a specific meaning, it contains all information that justify its use in a text. In the first part of the Doctoral dissertation, we studied three different sorts of "phrasèmes" grounded on that definition : - complete"phrasèmes" with an opaque non compositional meaning. - "semi-phrasèmes" with an opaque meaning which is only partly compositional. - "quasi-phrasèmes" with a compositional meaning to which an unpredictable meaning is added. We classified them by structures rather tan by functions. These different structures are : - "phrasèmes" with a nominal head - "phrasèmes" with a verbal head - "phrasèmes" with a prepositional head - "phrasèmes" with a pronominal head - "phrasèmes" with an adjectival head. The second part is dedicated to the morpho-syntactic and semantic study of all the four hundred and seventy "phrasèmes" categories we identified. In the third part, we created "l'Arbre de Mise en Format des Phrasèmes" called A. MI. FO. P (the tree that permit to enter "phrasèmes" in the lexical database) and grounded on that study. The tree is composed of five roots, thirty five nodes, one hundred and nine branches, and four hundred and nine leafs. All these different elements are linked. To use the tree, we created the operating system of A. MI. FO. P. In this system, the syntactic representation is based on the elementary tree and the semantic representation is based on the derivation tree.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 2 vol. (529 f.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. 416-430. Index

Où se trouve cette thèse ?

  • Bibliothèque : Université Lumière (Bron). Service commun de la documentation. Bibliothèque universitaire.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.