Thèse soutenue

Répondre aux Requêtes SPARQL grâce aux Vues

FR  |  
EN
Auteur / Autrice : Gabriela Montoya
Direction : Pascal MolliHala Skaf
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance en 2016
Etablissement(s) : Université Bretagne Loire (2016-2019)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche : Laboratoire : Laboratoire d’Informatique de Nantes Atlantique (UMR 6241) (Nantes)
Jury : Président / Présidente : Philippe Lamarre
Examinateurs / Examinatrices : Pascal Molli, Hala Skaf, Philippe Lamarre, Bernd Amann, Fabien Gandon, Pascale Kuntz-Cosperec
Rapporteurs / Rapporteuses : Bernd Amann, Fabien Gandon

Mots clés

FR

Résumé

FR  |  
EN

Le web sémantique permet à des fournisseurs de données de mettre en ligne un nombre toujours croissant de jeux données concernant l’ensemble de la société. Ces données peuvent être ensuite consommées en écrivant des requêtes SPARQL. Dans ce cadre, l’exécution efficace de requêtes SPARQL sur l’ensemble des données pertinentes est un enjeu crucial. Malheureusement, SPARQL ne permet pas d’accéder aux données du web profond, réduisant considérablement l’espace de recherche. De plus, l’infrastructure pour exécuter les requêtes SPARQL n’assure pas une bonne disponibilité des données. Afin de traiter ces deux problèmes, nous nous sommes intéressés à l’utilisation des vues dans le web sémantique afin d’optimiser l’exécution des requêtes ainsi que l’accès au web profond. SemLAV est un médiateur permettant d’exécuter des requêtes SPARQL sur des sources de données sur le WEB. SemLAV s’appuie sur de vues liant les données externes au schéma global du médiateur. SemLAV évite le problème de l’explosion combinatoire de la réécriture de requêtes en calculant un ordre de matérialisation des vues incriminées. FEDRA considère une fédération de serveurs SPARQL ayant répliqués partiellement des données. FEDRA optimise l’exécution de requêtes fédérées en sélectionnant les sources de données tel que les données transférées soient minimisés.