Synchronisation des connaissances syntaxiques et sémantiques pour l'analyse d'énoncés en langage naturel à l'aide des grammaires d'arbres adjoints lexicalisés

par Djamé Seddah

Thèse de doctorat en Informatique

Sous la direction de Jean-Marie Pierrel.


  • Résumé

    Une interface entre la syntaxe et la sémantique vise à proposer une formalisation logique des relations entre les segments d'un énoncé. Dans cette thèse, nous proposons une approche basée sur l'analyse de phénomènes linguistiques problématiques dans le paradigme des grammaires d'arbres adjoints lexicalisées (TAG). Les TAG sont un formalisme linguistique proposant deux structures de représentations (arbre dérivé et arbre de dérivation) dont l'une est une structure quasi idéale pour servir de canevas à une analyse sémantique. Or cette structure, l'arbre de dérivation, ne peut représenter de façon autonome des co-indiciations. A partir de l'analyse des phénomènes induits par les verbes à contrôle, nous proposons une solution algorithmique basée sur le parcours synchrone de l'arbre dérivé et de l'arbre de dérivation (via une forêt partagée) afin d'inférer les liens argument aux témoignant d'une co-indiciation. Nous avons ajouté au formalisme initial une information lexicale (le canevas de contrôle) permettant une formalisation complète de ces phénomènes. Nous proposons un algorithme de reconstruction dynamique reposant sur des règles d'inférences exécutées lors de l'extraction des arbres de dérivation de la forêt partagée. Utilisant des techniques tabulaires, nous pouvons extraire d'une seule forêt partagée toutes les analyses qu'elle décrit au sein d'un graphe de dépendance.


  • Résumé

    A interface between syntax and semantic aims to propose a logical formalization of the relations between the parts of a sentence. This thesis is a proposaI based upon the analysis of problematic linguistic phenomnas in the Lexicalized Tree Adjunct Grammars (LTAG) framework. LTAG is a linguistic formalism which provides two structures of representation, derived tree and derivation tree. The last one is an almost perfect structure to be used as a canvas for semantic analysis. However, the derivation tree cannot represent coindexations in a autonomous way. We based our proposition upon the study of linguistic phenomnas induced by control verbs. Ln order to allow their treatment and their complete formalization, we modify the initial LTAG formalism by introducing a new lexical information : the control canvas. !ts purpose is to integrate }nference of missing argumentaI links into a synchronous course of derived trees and derivations trees via a shared forest. We propose a dynamic reconstruction algorithm based on inference rules. These rules are executed during the derivation tree extraction process from the shared forest. As we use tabular technics, we can extract, into a dependancy graph, aU the argumentaI relations described by one shared forest.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (206 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 201-206

Où se trouve cette thèse ?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation et de l'Edition - BU Sciences et Techniques.
  • Disponible pour le PEB
  • Cote : SC N2004 205
  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : SEDDAH s
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.