Création d'analyseurs de dépendance par combinaison d'analyseurs synthaxiques

par Francis Brunet-Manquat

Thèse de doctorat en Informatique

Sous la direction de Christian Boitet et de Damien Genthial.

Soutenue en 2004

à l'Université Joseph Fourier (Grenoble) .

    mots clés mots clés


  • Résumé

    L'objectif de cette thèse est de définir et développer des outils génériques permettant de combiner les résultats de différents analyseurs syntaxiques pour produire une analyse de dépendance plus pertinente et plus couvrante que chacune des analyses utilisées. Ces outils sont regroupés dans la plate-forme logicielle DepAn (Dependency Analysis). Après avoir étudié les analyseurs syntaxiques robustes existants et présenté les travaux antérieurs portant sur l'approche par combinaison en analyse syntaxique, nous spécifions le formalisme de dépendance et les différents outils de combinaison supportés par DepAn. La deuxième partie de cette thèse est consacrée à la description du processus permettant de créer, pour chaque analyseur disponible, un "normaliseur" des analyses qu'il produit. Un normaliseur découpe une analyse en un ensemble d'informations linguistiques élémentaires et "projette" ces informations dans un ensemble de structures de dépendance normalisées. Le processus de création d'un normaliseur est fondé sur des techniques de compilation et permet un gain de temps lors de l'ajout d'un analyseur à la plate-forme. La dernière partie de cette thèse présente une nouvelle approche par combinaison, dont l'originalité réside dans l'utilisation de méthodes statistiques et de méthodes de reconstruction. Toutes les analyses d'une phrase sont combinées au sein d'une unique représentation de dépendances. Des évaluations effectuées lors d'un prétraitement servent alors à pondérer les informations contenues dans cette représentation. Enfin, une ou plusieurs nouvelles structures de dépendances sont produites grâce à une des méthodes de reconstruction


  • Pas de résumé disponible.

  • Titre traduit

    Dependency parser creation by combination of syntactic parsers


  • Résumé

    The goal of this thesis is to define and develop generic tools for combining the results of different parsers so as to produce a dependency analysis, which is more relevant and has larger coverage th an its component parsers. These tools are merged into a software platform, named DepAn (Dependency Analysis). The first part of this thesis studies the existing robust parsers and presents the previous works about the combination approach. Lastly, we specify the dependency formalism and the different combination tools used into the platform. The second part of this thesis describes the process which creates for each parser available a "normalizer" of the produced analyses. A normalizer splits an analysis in elementary linguitic information pieces and "projects" these information pieces in a set of standardized dependency structures. The creating process is based on compilation techniques and allows to save time when adding a new parser into the platform. The last part of this thesis presents a new combination approach the originality of which lies in the use of statistical and construction methods. All analyses of a sentence are combined in a single dependency structure. Some evaluations made du ring a preprocessing stage serve to weight the information contained in this representation. Lastly, one or more new dependency structures are produced with one of the construction methods.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (xii-153 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 137-144

Où se trouve cette thèse ?

  • Bibliothèque : Université Savoie Mont Blanc (Annecy-le-Vieux). Bibliothèque de Polytech'Annecy-Chambéry, site d'Annecy.
  • Disponible pour le PEB
  • Cote : T P2004/206
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS04/GRE1/0206
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS04/GRE1/0206/D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.