Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données

par David Célestin Faye

Thèse de doctorat en Informatique

Sous la direction de Patrick Valduriez et de Mary Teuw Niane.


  • Résumé

    La société de l'information demande un accès complet et efficace à un ensemble d'informations qui sont souvent hétérogènes etdistribuées. Dans le but d'un partage efficace cette information, plusieurs solutions techniques ont été proposées. L'infrastructure Pair-à-Pair (P2P) est un paradigme émergent et offrant de nouvelles opportunités pour la mise en place de systèmes distribués à grande échelle. D'autre part, le concept de base de données distribuée a été introduit dans le but d'organiser une collection multiple de bases de donne��es logiquement liées et distribuées sur un réseau d'ordinateurs. Récemment, les systèmes P2P de gestion de données communément appelés PDMS (Peer DataManagement System) ont vu le jour. Ils combinent les avantages des systèmes P2P avec ceux des bases de données distribuées. Dans le but de contribuer à la problématique de la gestion de données dans un contexte P2P, nous proposons le PDMS SenPeer. SenPeer suit une topologie super-pair basée sur l'organisation des pairs en communautés sémantiques en fonction de leurs thèmes d'intérêts. Pour faciliter l'échange de données entre pairs nous établissons des processus de découverte de correspondances sémantiques et de reformulation de requêtes en présence de plusieurs modèles de données. Ces correspondances sémantique, en combinaison avec les schémas des pairs sont à la base d'une topologie sémantique au dessus du réseau physique et utilisée pour un routage efficace des requêtes. Les requêtes sont échangées à travers un format commun d'échange de requête et un processus d'optimisation distribué permet de choisir le meilleur plan d'exécution de la requête en fonction des caractéristiques du PDMS. Une validation expérimentale par la mise en place d'un simulateur permet d'affirmer l'utilité et la performance des techniques proposées.


  • Résumé

    The so-called information society needs a complete and efficient access to the available information which is often heterogeneous and distributed. In order to make information sharing efficient, some technical solutions have been proposed. The concept of distributed database has been introduced in order to organize a collection of multiple and logically bound databases spread across a computer network. The Peer-to-Peer (P2P) infrastructure is an emergent paradigm offering new opportunities for the conception of large scale distributed systems. Recently the P2P data management systems (Peer Data Management System have appeared). They combine the advantages of the P2P systems with those of the distributed databases. In order to contribute to the problem of data management in a P2P context, we propose the SenPeer PDMS. SenPeer is based on a super-peer topology organizing the peers into semantic communities according to their topics of interests. To facilitate data exchange in the presence of heterogeneous schemas and multiple data models, we establish semantic mapping discovery and query reformulation processes. The semantic mappings, in combination with the peer schemas are the basis of a semantic overlay, on top on the underlying physical network and which is used for intelligent query routing. Queries are exchanged through a query exchange format. A distributed optimisation process has the responsibility of finding the best execution plan for the query by taking into account the data distribution and the characteristics of the PDMS. We describe an experimental validation through a simulator to illustrate the feasibility and the performance of the proposed techniques.

Autre version

Cette thèse a donné lieu à une publication en 2010 par [CCSD] [diffusion/distribution] à Villeurbanne

Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (141 p.)
  • Annexes : 118 références bibliographiques

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. BU Sciences.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.