Analyse morphosyntaxique automatique du Dari (persan d'Afghanistan) et mise au point d'un système d'interrogation de bases de données textuelles en langage naturel

par Said Abdoul Razeq Afzali

Thèse de doctorat en Linguistique

Sous la direction de Denise François-Geiger.

Soutenue en 1986

à Paris 5 .

Le président du jury était Denise François-Geiger.

Le jury était composé de Martine Desi, Charles-Martin Kieffer, Alexandre Andreewsky, Christian Fluhr.


  • Résumé

    Ce travail entre dans le cadre d'une étude de linguistique automatique appliquée au dari (persan d’Afghanistan) et comprend les points suivants : I. Un certain nombre de précisions sur la situation géographique, historique et linguistique de l’Afghanistan. II. Toute étude linguistique et périinformatique permettant de réaliser une interrogation en dari d'une base de données textuelle. Cela comprend : -une transcription du dari compatible avec les contraintes des claviers d'ordinateurs. -une énumération exhaustive de tous les mots fonctionnels du dari (prépositions, conjonctions, articles, pronoms, locutions prépositives et conjonctives). -une étude de la suffixation des substantifs, adjectifs, verbes et adverbes. -une description des règles permettant de "normaliser" les mots sémantiques (substantifs, adjectifs, verbes) du dari. -la constitution d'une base de textes de 60000 mots. III. Une étude détaillée du problème du filtrage syntaxique et des hyper formes composées. Vingt-cinq filtres sont construits et ont été testes sur une partie importante et suffisamment représentative du corpus. De ce fait, lorsque les formes courtes binaires et ternaires fournissent des mots composés, on a la certitude qu'ils ne font pas partie de formes plus longues susceptibles de modifier leur statut. Elles peuvent donc être directement intégrées au système spirit. Enfin, les formes longues peuvent obtenues par itération des formes courtes. Une pré-étude de cette particularité est effectuée.

  • Titre traduit

    Automatic morphosyntaxic analysis of dari (Persian from Afghanistan) and realisation of a system of interrogation of textual data bank intonatural language


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (248 f.)
  • Annexes : Bibliogr. f. 240-248

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris Cité - BU St-Germain-des-Prés. Direction générale déléguée aux bibliothèques et musées. Bibliothèque universitaire Saint-Germain-des-Prés.
  • Consultable sur place dans l'établissement demandeur
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : MSH TH 3583
  • Bibliothèque : Bibliothèque Universitaire des Langues et Civilisations. Bibliothèque James Darmesteter.
  • Non disponible pour le PEB
  • Cote : Th LP 1

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université Grenoble Alpes (Saint-Martin-d'Hères, Isère). Bibliothèque et appui à la science ouverte. Bibliothèque universitaire Droit-Lettres.
  • Non disponible pour le PEB
  • Cote : MFL 200243/1986/245
  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : MC 5417-1986-250
  • Bibliothèque : Bibliothèque universitaire Lettres et Sciences humaines (Montpellier).
  • Non disponible pour le PEB
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • Disponible pour le PEB
  • Bibliothèque : Bibliothèque interuniversitaire de la Sorbonne. Fonds général.
  • Non disponible pour le PEB
  • Cote : TMC 86-441
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.