Indexation semantique pour les systemes de recherche d'informations

par AMALIA TODIRASCU

Thèse de doctorat en Sciences et techniques communes. Terre, océan, espace

Sous la direction de Bernard Keith.

Soutenue en 2001

à Strasbourg 1 .

    mots clés mots clés


  • Résumé

    Les systemes de recherche documentaire bases sur des methodes statistiques fournissent des resultats peu satisfaisants pour l'utilisateur moyen. Les methodes d'indexation basees sur la linguistique qui proposent d'inclure la semantique dans les index, sont encore peu utilisees dans des systemes de recherche documentaire reels, mais elles promettent d'ameliorer la precision et le rappel des systemes de recherche. On se propose d'etudier plusieurs methodes d'indexation conceptuelle pour les integrer dans un systeme de recherche d'information concernant un domaine limite. On s'appuie sur une ontologie specifique au domaine. A titre experimental, on essaye plusieurs choix d'indexation : l'utilisation des concepts de l'ontologie comme index, une methode lsi (d'indexation semantique latente) modifiee pour utiliser des concepts et a la place des termes, et une methode classique d'indexation combinee avec une methode de filtrage utilisant l'ontologie du domaine. La troisieme methode se revele etre la meilleure, apres quelques experimentations limitees. On propose une methode d'extraction automatique d'une ontologie specifique a un domaine a partir d'un corpus representatif. L'ontologie est modelisee en logique de description, choisie comme formalisme de representation des connaissances pour ses proprietes de manipulation des donnees incompletes ou incorrectes et ses mecanismes logiques d'inference et ses tests de coherence. Quant au reperage des occurences d'index dans les textes, des techniques de traitement automatique flexibles et tolerantes aux fautes (basees sur les automates finis) sont proposees. On propose des regles (basees sur des connaissances linguistiques et sur l'ontologie du domaine) pour identifier des nouveaux concepts et les valider.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 263 p.
  • Annexes : 181 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Strasbourg. Service commun de la documentation. Bibliothèque Danièle Huet-Weiller.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.