Modèle flexible pour la recherche d'information dans des corpus de documents semi-structurés

par Karen Sauvagnat

Thèse de doctorat en Informatique

Sous la direction de Claude Chrisment et de Mohand Boughanem.

Soutenue en 2005

à Toulouse 3 .


  • Résumé

    L'information structurelle des documents semi-structurés sert à affiner le concept de granule documentaire. Le but pour les "Systèmes de recherche d'information" est alors de retrouver des unités d'information (et non plus de documents) pertinentes à des requêtes utilisateur. Ceci nous conduit à proposer le modèle XFIRM (XML Flexible Information Retrieval Model) reposant sur: (i) Un modèle de représentation des données générique, permettant de modéliser des documents possédant des structures différentes ; (ii) Un langage de requête flexible, permettant à l'utilisateur d'exprimer son besoin selon divers degrés de précision, en exprimant ou non des conditions sur la structure des documents ; (iii) Un modèle de recherche basée sur une méthode de propagation de la pertinence, ayant pour but de trouver les unités d'information les plus exhaustives et spécifiques à la requête. L'évaluation de notre modèle, grâce au prototype que nous avons développé, montre l'intérêt de nos propositions.

  • Titre traduit

    Flexible information retrieval model for semi-structured documents


  • Résumé

    Structural information contained in semi-structured documents can be used to focus on relevant information. The aim of Information Retrieval System is then to retrieve relevant information units instead of whole documents. We propose here the XFIRM model (XML Flexible Information Retrieval model), which is based on: (i) a generic data representation model, allowing the modelling of documents having heterogeneous structures; (ii) a flexible query language that allows the expression of users needs according to many precision degrees, by expressing (or not) conditions on the documents structure; (iii) a retrieval model based on a relevance propagation method, which aims at finding the most exhaustive and specific information units answering the query. The interest of our propositions has been shown thanks to the prototype we developed.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ( 219 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 205-219

Où se trouve cette thèse ?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 2005TOU30071
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.