De la synthese lexicographique a la detection et correction des graphies fautives arabes

par CHIRAZ BEN OTHMANE ZRIBI

Thèse de doctorat en Sciences appliquées

Sous la direction de FATHI DEBILI.

Soutenue en 1998

à Paris 11 .

    mots clés mots clés


  • Résumé

    Dans ce travail nous nous attaquons a deux problematiques distinctes, mais etroitement liees et complementaires. La premiere est la construction de dictionnaires electroniques pour la langue arabe. La seconde est la detection et la correction des erreurs orthographiques dans les textes arabes. Le premier dictionnaire que nous nous sommes proposes de construire est oriente vers les applications d'analyse et de traitement automatiques de donnees textuelles. Il contient tous les mots de la langue arabe sous leurs formes flechies et voyellees, accompagnes d'informations linguistiques les decrivant. Devant l'impossibilite constatee d'une generation completement automatique, nous avons edifie une chaine de generation semi-automatique. En ce sens qu'elle comporte des procedures automatiques et d'autres manuelles. Ces dernieres permettent, par l'utilisation d'outils logiciels intelligents, d'introduire, de verifier voire meme de corriger les donnees linguistiques collectees. Par ailleurs, une autre voie d'experimentation a ete exploree. Elle consiste a ne plus se contenter d'un dictionnaire de formes flechies mais de proceder a la generation d'un dictionnaire contenant l'ensemble des formes agglutinees arabes. L'idee etant que l'usage d'un tel dictionnaire aurait au moins comme avantage de simplifier les algorithmes d'analyse morphologique et de correction orthographique. Pour ce qui concerne le second objectif vise par ce travail, nous nous sommes interesses aux erreurs lexicales portant aussi bien sur les consonnes que sur les voyelles des mots arabes. La detection des erreurs est effectuee lors de l'analyse morphologique. La correction, quant a elle, se fait par une version amelioree (dite tolerante) de l'analyseur morphologique. Les candidats a la correction d'un mot errone sont trouves grace a des algorithmes particuliers de parcours d'arbre.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 197 P.
  • Annexes : 54 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : TH2014-014004
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.