Apprentissage et filtrage syntaxico-sémantique de syntagmes nominaux pertinents pour la recherche documentaire

par Naulleau, Elie

Thèse de doctorat en Sciences appliquées

Sous la direction de Daniel Kayser.

Soutenue en 1998

à Paris 13 .

    mots clés mots clés


  • Résumé

    Nous proposons un systeme d'extraction de groupes nominaux qui s'appuie sur la syntaxe et la semantique, et qui aide a la mise a jour de thesaurus ou la creation d'index libres. L'originalite du systeme tient a la possibilite de faire varier la forme des groupes nominaux recherches, relativement a un centre d'interet. Ce dernier est concretise par un profil de filtrage. Il est ainsi possible de definir plusieurs points de vue sur un seul document, qui se traduisent par autant d'ensembles differents de groupes nominaux extraits du document. Le systeme doit donc etre calibre pour un champ d'investigation determine (domaine d'activite, type de document) avant d'etre exploite. Il requiert de l'operateur (documentaire, terminographe,. . . ) une participation active pour la mise au point des profils de filtrage. Ces profils sont definis en fournissant au systeme des exemples de groupes nominaux recherches (dits pertinents) et de groupes nominaux non pertinents. Une procedure d'apprentissage construit ensuite une modelisation linguistique des syntagmes consideres pertinents. L'evaluation de la pertinence des syntagmes nominaux repose sur une description syntaxicosemantique de leurs dependances lexico-syntaxiques elementaires. Le filtrage des dependances syntaxiques non pertinentes est effectue en procedant a des elagages syntaxiques dans les arbres des syntagmes a filtrer. Les groupes nominaux sont ainsi depouilles de proprietes linguistiques declarees non pertinentes dans le profil de filtrage. Notre experimentation montre que l'utilisation d'informations semantiques combinees avec des informations de structure syntaxique accroit notablement les performances du filtrage des syntagmes nominaux.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 196 p.
  • Annexes : 105 ref.

Où se trouve cette thèse ?

  • Bibliothèque : École Supérieure du Professorat et de l’Éducation de l'académie de Créteil (Saint-Denis).
  • Disponible pour le PEB
  • Bibliothèque : Université Paris 13 (Villetaneuse, Seine-Saint-Denis). Bibliothèque universitaire. Section Sciences.
  • Disponible pour le PEB
  • Cote : TH 1998 039
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.