Answering SPARQL Queries using Views

by Gabriela Montoya

Doctoral thesis in Informatique et applications

Under the supervision of Pascal Molli and Hala Skaf.

Thesis committee President: Philippe Lamarre.

Thesis committee members: Pascal Molli, Hala Skaf, Philippe Lamarre, Bernd Amann, Fabien Gandon, Pascale Kuntz-Cosperec.

Examiners: Bernd Amann, Fabien Gandon.


  • Abstract

    The Semantic Web allows data publishers to make available an increasing number of datasets concerning the whole society. SPARQL queries can be written to consume the datasets data. In this context, the effective execution of SPARQL queries on the relevant datasets is a critical issue. Unfortunately, SPARQL does not allow to access data from the Deep Web, and this significantly reduces the search space. In addition, the existing infrastructures to execute the SPARQL queries do not provide good data availability. To address these two problems, we have used views in the Semantic Web context to optimize the query execution and also the access to the Deep Web. SemLAV is a mediator that allows for executing SPARQL queries over data sources on the Web. SemLAV is based on views that relate external data to the mediator global schema. SemLAV avoids generating and executing an exponential number of query rewritings by computing the materialization order for the selected views. FEDRA considers a federation of SPARQL endpoints that have partially replicated datasets. FEDRA optimizes the execution of federated queries by selecting the endpoints in a way that the transferred data are minimized.

  • Alternative Title

    Répondre aux Requêtes SPARQL grâce aux Vues


  • Abstract

    Le web sémantique permet à des fournisseurs de données de mettre en ligne un nombre toujours croissant de jeux données concernant l’ensemble de la société. Ces données peuvent être ensuite consommées en écrivant des requêtes SPARQL. Dans ce cadre, l’exécution efficace de requêtes SPARQL sur l’ensemble des données pertinentes est un enjeu crucial. Malheureusement, SPARQL ne permet pas d’accéder aux données du web profond, réduisant considérablement l’espace de recherche. De plus, l’infrastructure pour exécuter les requêtes SPARQL n’assure pas une bonne disponibilité des données. Afin de traiter ces deux problèmes, nous nous sommes intéressés à l’utilisation des vues dans le web sémantique afin d’optimiser l’exécution des requêtes ainsi que l’accès au web profond. SemLAV est un médiateur permettant d’exécuter des requêtes SPARQL sur des sources de données sur le WEB. SemLAV s’appuie sur de vues liant les données externes au schéma global du médiateur. SemLAV évite le problème de l’explosion combinatoire de la réécriture de requêtes en calculant un ordre de matérialisation des vues incriminées. FEDRA considère une fédération de serveurs SPARQL ayant répliqués partiellement des données. FEDRA optimise l’exécution de requêtes fédérées en sélectionnant les sources de données tel que les données transférées soient minimisés.

Consult library

Version is available as a paper

Informations

  • Details : 1 vol. (110 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.111-120

Where is this thesis?

  • Library : Université de Nantes. Service commun de la documentation. BU Sciences.
  • Unvailable for PEB
See the Sudoc catalog libraries of higher education and research.