Vers une indexation structurée basée sur des syntagmes nominaux : impact sur un SRI en vietnamien et la RI multilingue

par Bao-Quoc Ho

Thèse de doctorat en Informatique

Soutenue en 2004

à l'Université Joseph Fourier (Grenoble) .

    mots clés mots clés


  • Résumé

    Notre travail a pour objectif de proposer un modèle unifié pour la recherche d'information multilingue. Nous proposons un modèle d'indexation structurée basée sur des syntagmes nominaux dans le but d'augmenter la précision du système. Ce modèle a été étendu pour le multilinguisme. Nous avons utilisé un analyseur morpho-syntaxique pour extraire et structurer des syntagmes nominaux des documents et des requêtes, sous la forme [Tête, modifieurs]. Cette structure permet de pondérer l'importance d'un terme selon son rôle dans le syntagme. De plus, nous proposons un ensemble de règles de décomposition de syntagmes en ensemble de sous syntagmes plus petits, qui sont organisés sous la forme de réseau Bayésiens qui servent de base pour la phase d'interrogation. La fonction de correspondance est calculée en se basant sur les probabilités de déduire les syntagmes de requête, à partir leurs sous syntagmes présents dans un document donné. Pour le multilinguisme, le réseau de la requête est transformé d'une langue source vers une autre langue cible en se basant sur les nœuds qui composent deux termes, en utilisant un dictionnaire bilingue et un thésaurus de co-occurrences de termes.


  • Pas de résumé disponible.

  • Titre traduit

    To a noun phrase based structured indexing model : apply to a information retrieval system in vietnamese and cross-language information retrieval


  • Résumé

    The purpose of our work is to propose a unified model for cross-language information retrieva. We propose a noun phrase-based structured indexing model, in order to inscrease the precision of system. This model is extended for cross-language information retrieval. We used a morpho-syntactic analyzer to extract and structure the noun phrases od documents and queries, in the form [head, arguments]. This structure makes it possible to weight the importance of a term according to its role in the noun phrase. Moreover, we propose a set of decompostion rules, that are used to break up a noun phrase inot a set of sub noun phrases,organized in a Bayesian network, which is used at query time. The matching fuction is calculated based on the probabilities od deducing the noun phrases of the query from the ierms existing in a give document. The cross-language extension consists in a transformation of the query network from a source language to a target language, based on nodes composing the two termes, by using a bilingual dictionary and a terms co-occurences thesaurus.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (157 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 152-157

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS04/GRE1/0180
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS04/GRE1/0180 /D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.