La recherche d'informations sur le World Wide Web : utilisation des méta-informations dans une architecture de systèmes de recherche coopérants

par Bich-Liên Doan

Thèse de doctorat en Informatique

Sous la direction de Jean-Jacques Girardot.

Soutenue en 2000

à Saint-Etienne .


  • Résumé

    Deux types d'outils de recherche sont actuellement utilisés pour aider l'utilisateur à trouver des informations sur le Web : les moteurs de recherche (Google) et les annuaires thématiques (Yahoo). Cependant les réponses sont fortement entachées de bruit pour les outils universels, et de silence pour les outils thématiques. De plus, le problème qui se pose est de suivre l'augmentation constante du volume de pages Web : la scalabilité. Pour réduire le bruit et le silence nous introduisons un niveau logique avec la notion de document Web au dessus du niveau physique matérialisé par les pages Web. Les documents Web sont organisés en DAG (Directed Acyclic Graph) et sont décrits par des méta-informations. Dans la hiérarchie de documents, nous utilisons la technique de propagation des attributs de méta-informations le long de la hiérarchie de documents. Ceci nous permet de diminuer à la fois le bruit et le silence en combinant des recherches qui portent sur les attributs de m éta-informations avec la recherche traditionnelle dans le texte intégral, tout en exploitant la structure logique des documents Web. Pour le problème de scalabilité, nous proposons une architecture fondée sur 2 nouvelles classes d'outils de recherche. Les outils généralistes ont vocation à parcourir, indexer et connaître tout le Web mais d'une façon superficielle, ils sont par exemple capables d'indiquer tous les sites dont un des domaines concerne l'environnement. Les outils spécialistes ont pour but de collationner et d'indexer toutes les pages de tous les sites d'un domaine de connaissance particulier (par exemple l'environnement). Nous proposons enfin un modèle de dialogue entre ces nouveaux composants permettant de fournir un service global qui adresse à la fois les problèmes de bruit, de précision et de scalabilité. Un spécialiste devient à son tour un document qui s'auto-décrit et participe à l'architecture des systèmes coopérants.

  • Titre traduit

    Information retrieval on the World Wide Web : use of the metadata in an architecture of cooperative search tools


  • Résumé

    Two types of search tools are currently used to help the user to find information on the Web : the search engines (Google) and the directories (Yahoo). However the answers are strongly soiled by noise for the search engines, and by silence for the directories. Moreover the problem which arises with these tools is to remain efficient as the volume of Web pages is growing continuously : it is the scalability. . . [etc. ]

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (180 p.)
  • Notes : Thèse reproduite
  • Annexes : Bibliographie p.155-161

Où se trouve cette thèse ?

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : D-DOA
  • Bibliothèque : Université Jean Monnet. Service commun de la documentation. Section Sciences.
  • Disponible pour le PEB
  • Bibliothèque : Ecole nationale supérieure des mines. Centre de documentation et d'information.
  • Disponible pour le PEB
  • Cote : 004.6 DOA
  • Bibliothèque : Mines ParisTech. Bibliothèque.
  • Disponible pour le PEB
  • Cote : EMP 149.427 CCL.TH.1010
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.