Indexation conceptuelle guidée par ontologie pour la recherche d'information

par Mustapha Baziz

Thèse de doctorat en Informatique

Sous la direction de Mohan Boughanem et de Nathalie Aussenac-Gilles.

Soutenue en 2005

à Toulouse 3 .


  • Résumé

    Ce travail de thèse rentre dans le cadre de l'utilisation des ontologies dans le processus de recherche d'information de manière générale, et plus particulièrement pour une représentation conceptuelle de l'information textuelle (documents/requêtes). Deux principales propositions sont détaillées. La première proposition consiste en une approche de représentation basée sur les réseaux sémantiques et la seconde sur des structures arborescentes. Dans la première approche, DocCore, la projection d'un document sur l'ontologie permet de construire le Noyau Sémantique de Document où les nœuds représentent les concepts "importants" du document et les arcs, une valeur de proximité sémantique entre ces nœuds. Dans la deuxième approche de représentation, DocTree, on exploite la hiérarchie de concepts que procure le lien de subsomption d'une ontologie (is-a) pour décrire un document/requête sous une forme arborescente. Un prototype a été réalisé étayant le bien fondé de ce type d'approche.

  • Titre traduit

    Conceptual indexing driven by ontology for information retrieval


  • Résumé

    This thesis deals with the use of ontologies in information retrieval. More precisely, we aim at representing textual information (documents/queries) by means of concepts (rather than a bag of single words). This conceptual representation is based on matching document/query with ontology. Roughly, two principle propositions are developed within this framework. The first one, DocCore, proposes to represent information by means of semantic networks (called Document Semantic Cores) where the nodes represent the “most salient” concepts extracted from the document, and the arcs semantic similarity values between these nodes. In the second approach, DocTree, we use the concept hierarchy provided by the subsumption link of an ontology (is-a) to describe a document or a query by mean of sub-trees. A prototype is built and the two approaches are successfully used in the IR process.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ([206] p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 173-185

Où se trouve cette thèse ?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Accessible pour le PEB
  • Cote : 2005TOU30265
  • Bibliothèque : Université de Lorraine. Direction de la Documentation et de l'Edition. Bibliothèque universitaire Lettres et sciences humaines.
  • Consultable sur place dans l'établissement demandeur
  • Cote : LT 005/2
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.