Etude morphologique et création d'un dictionnaire électronique pour la langue luxembourgeoise

par Francisca Luna Garcia

Thèse de doctorat en Langues germaniques

Sous la direction de François Rousselot.

Soutenue en 2005

à Strasbourg 2 .


  • Résumé

    La morphologie flexionnelle du luxembourgeois est à l'honneur dans ce travail. La flexion est un élément central de cette étude. Les mots qui ont été classés et générés automatiquement sont issus d'un corpus, rassemblé à partir de textes en langue luxembourgeoise sur Internet. Le but de cette thèse était double. Il s'agissait d'une part, d'établir un classement des catégories lexicales en paradigmes, ainsi que de constituer des classes flexionnelles à l'intérieur de ces paradigmes. Ce classement est morphologique et extra-morphologique. D'autre part, il s'agissait de créer un outil informatique permettant la génération automatique des mots luxembourgeois grâce à ces classes flexionnelles. Les formes fléchies obtenues sont alors stockées dans une base de données. Il nous a ainsi été possible de constater si la langue luxembourgeoise se prête bien à un tel traitement informatique et quels éléments posent problème lors de la génération. DicoManager est un système qui peut accueillir différents dictionnaires électroniques. Le dictionnaire luxembourgeois, Lunaf, a été développé dans un premier temps pour rendre possible la génération des mots et obtenir ainsi automatiquement toute la conjugaison des verbes, toutes les formes au pluriel des noms, toutes les formes déclinées des adjectifs et de stocker aussi toutes les autres catégories lexicales qui ne subissent pas de flexion comme les prépositions, les adverbes, les conjonctions, etc. Dans un deuxième temps, le dictionnaire électronique sert de base à un analyseur lexical. L'application du dictionnaire sur les phrases d'un texte, grâce à la reconnaissance des mots qui sont présents et au repérage de ceux qui ne s'y trouvent pas, est le but recherché par cette description et par ce classement morphologique. Cette reconnaissance se fait au niveau de la forme du mot. Dans ce travail, notre volonté a été de formaliser morphologiquement la langue luxembourgeoise, ainsi que de doter cette langue d'un outil informatique.

  • Titre traduit

    Morphological study and creation of an electronic dictionary for the luxemburgish language


  • Résumé

    Luxemburgish flexional morphology is one of the main topics of this work. The classified and automatically generated words come from a corpus gathered together from texts in luxemburgish on the Internet. The aim of this work was double. On the one hand, a classification of lexical categories has bee established in form of paradigms. This classification is morphological and extra-morphological. On the other hand, a data-processing tool has been created allowing the automatic generation of luxemburgish words thantks to these flexional classes. The resulting inflected forms are then stored in a database. This allowed us to note if the data-processing fits the luxemburgish language and which elements cause problems in the generation. DicoManager is a system which can host various electronic dictionaries. The luxemburgish electronic dictionary, the Lunaf, was built to make word generation possible, so as to obtain automatically all the verb conjugations, all the plural forms of the nouns, all the inflected forms of the adjectives and to store all the other lexical categories which are not inflected like prepositions, adverbs, conjunctions, etc. Too. The electronic dictionary is used then a base for a lexical tagger? The aim of this description and of this classification is to apply the dictionary on the sentences of a text so as to tag its words. Our motivation was to morphologically describe the luxemburgish language, as well as to give it a data-processing tool.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (293 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 289-293

Où se trouve cette thèse ?