Analyse syntaxique automatique du français écrit : applications à l'indexation automatique

par Geneviève Lallich-Boidin

Thèse de doctorat en Informatique en sciences sociales

Sous la direction de Jacques Rouault.


  • Résumé

    L'analyse syntaxique d'une langue naturelle consiste à définir une grammaire de cette langue, grammaire nécessairement ambiguë, à choisir un algorithme d'analyse non déterministe et à élaborer une stratégie d'analyse afin d'éviter la construction de structures syntaxiques parasites. Dans le cadre de ce travail, nous définissons une grammaire du syntagme nominal du français écrit. Nous étudions les analyseurs hors contexte et non déterministes de Cocke-Younger-Kosomi et d'Earley, et retenons ce dernier. Puis, au dessus de cet analyseur, nous élaborons une stratégie d'analyse qui, à partir des données linguistiques portées par le texte à analyser, permet de prédire localement la structure juste et qui limite de ce fait le nombre de solutions parasites. L'indexation automatique de documents à partir des syntagmes nominaux contenus dans leur résumé est une application de l'analyseur construit

  • Titre traduit

    Automatic parsing of french texts : applications to automatic indexing


  • Résumé

    Natural language parsing consists in defining a grammar, necessarily ambiguous, choosing a non deterministic parsing algorithm and working out a parsing strategy in order to avoid build parasite structures. In this thesis, we define a context free grammar for french noun phrases. We study two non-deterministic parsers : Cocke-Younger-Kasami's and Early's parsers. On the Early's algorithm we propose a prediction parsing algorithm based on the linguistic data included in the input string. Automatic indexing of documents by noun phrases extracted from abstracts is presented as a potential application of this parser

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (167 p.)

Où se trouve cette thèse ?

  • Bibliothèque : Université de Caen Normandie. UFR Humanités et Sciences Sociales. Bibliothèque Pierre Barbéris.
  • Disponible sous forme de reproduction pour le PEB
  • Cote : A440
  • Bibliothèque : Service Interétablissement de la documentation (Saint-Martin-d'Hères, Isère). Bibliothèque universitaire Droit-Lettres.
  • Disponible pour le PEB
  • Cote : 205141/1986/59
  • Bibliothèque : Université Paris-Est Marne-la-Vallée. Bibliothèque.
  • Consultable sur place dans l'établissement demandeur
  • Cote : 1986 LAL
  • Bibliothèque : Ecole nationale supérieure des mines. Centre de documentation et d'information.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.