Analyse morphologique du russe : définition d'une automatisation avec un minimum de données : implémentation d'une maquette en Prolog

par Jean-Paul Horn

Thèse de doctorat en Traitement automatique des langues

Sous la direction de Patrice Pognan.

Soutenue en 1986

à Paris, INALCO .


  • Résumé

    Ce travail évalue les possibilités d'automatisation d'une analyse morphologique des mots de la langue russe. Cette analyse est soumise à deux contraintes principales : - elle ne peut s'appuyer que sur la connaissance du mot seul et non du contexte dont il a été tiré. - aucune racine n'est connue a priori, à l'exception des racines entrant dans la formation : de dérives homonymes, de dérives dont la segmentation ne peut être contrôlée par des règles simples. Une grande partie de ce travail consiste tout naturellement à définir les facteurs autorisant une réduction sensible de cet ensemble de racines. L'analyse est conduite à l'aide : 1) de trois ensembles de morphèmes (préfixes, suffixes, désinences) auxquels viennent s'ajouter les deux formes du pronom réfléchi postposé, 2) de règles de reconnaissance des mots n'appartenant pas au fond slave (mots étrangers). La dérivation de ces mots suit, en effet, un ensemble de règles particulières et limitées. L'analyse doit aboutir à la production d'un grammatème (fiche signalétique) des mots analysés aussi réduit que possible. La réduction du grammatème résulte de l'intersection des ensembles d'informations liées à chacun des éléments morphémiques entrant dans la composition des mots à analyser.

  • Titre traduit

    Morphological analysis of the Russian language. Definition of an automatisation with a minimum of data. Implementation of a model in Prolog


  • Résumé

    This thesis is an evaluation of the possibilities of automatising a morphological analysis of the Russian words. This analysis is submitted to two major constraints : 1) it can rely only on the knowledge of the word itself and not on the context from which it is extracted, 2) no stem is known a priori, with the exception of the roots forming part of : - homonym derivatives, - derivatives whose segmentation cannot be controlled by simple rules. An important part of this work consists in defining factors leading to an appreciable reduction of this set of stems. This analysis is done with the aid of : three sets of morphemes (prefixes, suffixes and endings) and the two forms of the reflexive pronoun, rules of recognition of foreign words, morphological incompatibilities. The analysis produces grammatemes (sort of identification sheet of the word) of the analysed word, as reduced as possible. The reduction of this grammateme is the result of the intersection of the sets of information bound to each one of the morphemic elements forming the word to be analysed.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (531 f.)

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque universitaire des langues et civilisations (Paris).
  • Non disponible pour le PEB
  • Cote : TH.113
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.