La conception et la réalisation d'un système d'analyse morpho-syntaxique robuste pour l'arabe : utilisation pour la détection et le diagnostic des fautes d'accord

par Riadh Ouersighni

Thèse de doctorat en Sciences de l'information et de la communication

Sous la direction de Mohamed Hassoun et de Joseph Dichy.

Soutenue en 2002

à Lyon 2 .


  • Résumé

    Cette thèse s'inscrit dans le cadre du traitement automatique du langage naturel (TALN). Elle concerne la conception et la réalisation effective d'un noyau d système d'analyse morpho-syntaxique robuste de l'arabe de grandeur réelle, qui puisse être utilisé dans les applications à grande échelle. Baptisé AraParse (Arabic Parser). AraParse est basé sur des ressources linguistiques (lexiques et grammaires) à large couverture et permet de traiter de l'arabe voyellé, non-voyellé ou partiellement voyellé. La thèse présente tout d'abord les problèmes posés par l'analyse morphologique, l'analyse syntaxique et l'intégration de ces deux types d'analyse dans un système opérationnel. Le système réalisé, baptisé AraParse, conçu suivant une architecture modulaire, permet un traitement des textes arabes voyellés, non voyellés et partiellement voyellés et utilise des ressources linguistiques (lexiques et grammaires) à large couverture. Nous aborderons ensuite le problème de la robustesse du système. La robustesse caractérise la capacité de l'analyseur à produire un résultat satisfaisant même devant une situation inattendue. Nous avons adopté une démarche tolérante basée sur la distinction entre le noyau et la périphérie de la grammaire. Le noyau décrit des propriétés essentielles de la langue. La périphérie englobe l'ensemble des phénomènes extra-linguistiques. Notre objectif est aussi de concevoir un système qui peut être réutilisé dans d'autre application. La vérification grammaticale en est une. Le système AraCheck, directement déduit de AraParse permet la détection et le diagnostic des fautes d'accord en arabe. Il est basé sur une approche tolérante par une analyse complète en un seul passage, par relâchement de contrainte au niveau des règles de contrôle de la grammaire

  • Titre traduit

    The conception and the realisation of a robust morpho-syntactic analyser for arabic and an agreement error checker system


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XII-266 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. 203-218. Glossaire

Où se trouve cette thèse ?

  • Bibliothèque : Université Lumière (Bron). Service commun de la documentation. Bibliothèque universitaire.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.