Une approche adaptative pour la recherche d'information sur le Web

par Cédric Pruski

Thèse de doctorat en Informatique

Sous la direction de Nicolas Guelfi et de Chantal Reynaud.

Soutenue en 2009

à l'Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) en cotutelle avec l'Université du Luxembourg .


  • Résumé

    Nous nous sommes interesses a la prise en compte de l'evolution des donnees du web dans le but d'ameliorer, en terme de pertinence, la recherche documentaire sur le web. La solution proposee s’appuie sur les ontologies, fondement du web semantique, pour representer les connaissances du domaine de recherche vise par des requetes ainsi que les vues des utilisateurs sur ce domaine. Dans la solution preconisee, les ontologies sont vues comme des connaissances evoluant au cours du temps. Ainsi, l'evolution des ontologies est envisagee sous deux aspects: de maniere generale par rapport au domaine vise par la requete et de maniere particuliere par rapport aux connaissances des utilisateurs. Nous proposons d’abord, base sur des idees emises en psychologie, un modele d'ontologies adaptatives ainsi qu'un processus permettant aux ontologies de s'adapter aux evolutions des connaissances du domaine. Ensuite, nous proposons une exploitation de ces ontologies pour ameliorer la recherche de donnees sur le web. Nous introduisons, les wpgraphs et w3graphs pour la representation du contenu du web, puis le langage de requete ask adapte a ces structures pour l'extraction des donnees pertinentes. Nous proposons egalement un ensemble de regles d'enrichissement des requetes ask base sur les relations ontologiques et les elements des ontologies adaptatives des ontologies representant le domaine vise et celle des vues des utilisateurs sur le domaine. Enfin nous proposons un outil pour la gestion de ces ontologies et la recherche documentaire sur le web et une validation experimentale des concepts introduits basee sur un cas d'etude realiste pour la recherche d'articles scientifiques.

  • Titre traduit

    An adaptative approach for web information retrieval


  • Résumé

    In this work, we address the problem of knowledge evolution for improving web search in the sense of relevance of the returned results. The advocated solution implements ontologies, cornerstone of the semantic web, for representing both the domain targeted by the query and the profile of the user who entered the query. Ontologies are considered as knowledge that is evolving over time. Hence, the ontology evolution problem is tackled as regard the evolution of the targeted domain but also with respect to the evolution of users' profile. First, based on the adaptation of ideas developed in psychology to the knowledge engineering field, we introduce a new paradigm: adaptive ontology and a process for making adaptive ontologies smoothly follow the evolution of a domain. Then, we propose an approach exploiting adaptive ontologies for improving web information retrieval. To this end, we first introduce data structures, wpgraphs and w3graphs, for representing web data. We then introduce the ask query language tailored to the extraction of relevant information from these structures. We also propose a set of query enrichment rules based on the exploitation of ontological relations as well as adaptive ontologies elements of the ontology representing the domain targeted by the query and the one representing the view of the user on the domain. Lastly, we present a tool for managing adaptive ontologies and for searching relevant information on the web as well as an experimental validation of the introduced concepts. We based our validation on the definition of a realistic case study devoted to the retrieval of scientific articles published at the www series of conference.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XIV-191 p. )
  • Annexes : Bibliogr. p. 167-178

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2009)41
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.