Analyse morphosyntaxique automatique du Dari (persan d'Afghanistan) et mise au point d'un système d'interrogation de bases de données textuelles en langage naturel

par Said Abdoul Razeq Afzali

Thèse de doctorat en Linguistique

Sous la direction de Denise François-Geiger.

Soutenue en 1986

à Paris 5 .


  • Résumé

    Ce travail entre dans le cadre d'une etude de linguistique automatique appliquee au dari (persan d'afghanistan) et comprend les points suivants : i. Un certain nombre de precisions sur la situation geographique, historique et linguistique de l'afghanistan. Ii. Toute etude linguistique et preinformatique permettant de realiser une interrogation en dari d'une base de donnees textuelles. Cela comprend : -une transcription du dari compatible avec les contraintes des claviers d'ordinateurs. -une enumeration exhaustive de tous les mots fonctionnels du dari (prepositions, conjonctions, articles, pronoms, locutions prepositives et conjonctives). -une etude de la suffixation des substantifs, adjectifs, verbes et adverbes. -une description des regles permettant de "normaliser" les mots semantiques (substantifs, adjectifs, verbes) du dari. -la constitution d'une base de textes de 60000 mots. Iii. Une etude detaillee du probleme du filtrage syntaxique et des hyperformes composees. Vingt-cinq filtres sont construits et ont ete testes sur une partie importante et suffisamment representative du corpus. De ce fait, lorsque les formes courtes binaires et ternaires fournissent des mots composes, on a la certitude qu'ils ne font pas partie de formes plus longues susceptibles de modifier leur statut. Elles peuvent donc etre directement integrees au systeme spirit. Enfin, les formes longues peuvent obtenues par iteration des formes courtes. Une preetude de cette particularite est effectuee.

  • Titre traduit

    Automatic morphosyntaxic analysis of dari (persian fromafghanistan) and realisation of a system of interrogation oftextual data bank intonatural language


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 248 f.
  • Annexes : Bibliogr. fr. 240-248

Où se trouve cette thèse ?

  • Bibliothèque :
  • Consultable sur place dans l'établissement demandeur
  • Bibliothèque :
  • Disponible pour le PEB
  • Cote : MSH TH 3583
  • Bibliothèque :
  • Non disponible pour le PEB
  • Cote : Th LP 1

Cette version existe également sous forme de microfiche :

  • Non disponible pour le PEB
  • Cote : MFL 200243/1986/245
  • Non disponible pour le PEB
  • Cote : MC 5417-1986-250
  • Disponible pour le PEB
  • Disponible pour le PEB
  • Disponible pour le PEB
  • Non disponible pour le PEB
  • Cote : TMC 86-441
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.