Etude et implantation de la coordination en vue de l'analyse automatique du francais ecrit dans le cadre de la grammaire lexicale fonctionnelle

par Caroline Brun

Thèse de doctorat en Sciences de l'information et de la communication

Sous la direction de JACQUES ROUAULT.

Soutenue en 1998

à Grenoble 3 .


  • Résumé

    Cette these se situe dans le domaine du traitement automatique des langues (taln). Le cadre de cette recherche est le developpement d'une grammaire lexicale fonctionnelle (lfg) automatique pour le francais. Nous nous interessons clans ce travail a l'analyse syntaxique de la coordination. Il s'agit a la fois d'un phenomene complexe a analyser quel que soit le modele choisi, mais aussi d'un phenomene tres largement represente dans les corpus de toutes natures. La coordination s'applique a tous les constituants d'une grammaire s'ils ont les memes fonctions syntaxiques. Compte tenu de cette contrainte, nous avons implante un ensemble de regles generales visant a l'analyse syntaxique des cas les plus frequents de coordination, c'est-a-dire les coordinations d'elements de meme categories. Afin d'ameliorer la couverture de la grammaire, nous avons decrit des regles permettant de prendre en compte des phenomenes marginaux, comme la coordination d'elements de categories differentes, certains cas d'emergence du noeud droit et d'ellipses. Nous avons egalement implante dans la gram, maire des contraintes linguistiques et des heuristiques visant a la reduction des solutions parasites. Dans le premier chapitre, nous conduisons une etude linguistique sur corpus qui nous permet de constater que la coordination s'applique sur tous les types de constituants de meme fonction. Nous etudions dans le second chapitre differents traitements de la coordination proposes pour dif, ferents formalismes. Le troisieme chapitre consiste en une presentation succincte du cadre formel de notre implantation, la formalisme lfg. Le quatrieme chapitre nous permet d'exposer une modelisation generale de notre traitement de la coordination. Le cinquieme chapitre expose le modele de traitement de la coordination dans le formalisme lfg et les modifications necessaires a l'implantation du modele general. Le dernier chapitre decrit l'implantation realisee dans un environnement informatique pour l'analyse syntaxique automatique et expose differents resultats concernant l'analyse de corpus.


  • Résumé

    This thesis is in the field of natural language processing. The framework of the work presented here is the development of a lexical functional grammar for french. The thesis focuses on syntactic analysis of coordination. Coordination is a complex phenomenon to deal with, within any kind of linguistic formalism, but is widely represented in corpora. Coordination can a priori apply on all constituents of the grammar, if they share the same syntactic function. A set of rules aiming at analyzing most frequent cases, i. E. Same category constituent coordination, is implemented. In order to increase grammar coverage, we extend the rules in order to deal with phenomena such as coordination of unlike constituents, right node raising and ellipsis. A computational grammar must do a compromise between linguistic coverage and multiplicity of analysis : any treatment integrated in the grammar to deal with new phenomena may apply to other ones and trigger a proliferation of parasitic solutions. Moreover, coordination is often ambiguous considering the multiplicity of possible attachments in the phrase structure tree. Some linguistics constraints and heuristics are therefore applied on coordination in order to reduce the number of invalid analysis one gets from the parser. After a short reminder on fundamental notions, a corpus study of coordination is conducted: coor, dination applies on all constituents of the grammar, which share the same grammatical function. The second chapter discusses several treatments of coordination in different formalisms for natural language processing. The third chapter consists in a brief description of the lexical functional grammar formalism. The fourth chapter describes the general model chosen to treat coordination. The fifth chapter first provides an explanation of the general treatment of coordination within lfg and of the modifications needed to implement the general model. The last chapter describes the implantation of the coordination analysis in a computational envi, ronment for syntactic analysis. The different choices made for tokenization, morphological analysis and syntactic analysis are explained. To conclude, an evaluation of parsing results on corpora is given.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol., 330 p.
  • Notes : Publication autorisée par le jury
  • Annexes : 121 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Service Interétablissement de la documentation (Saint-Martin-d'Hères, Isère). Bibliothèque universitaire Droit-Lettres.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.