Efficient web resource management in structured peer-to-peer networks

by Nicoleta Preda

Doctoral thesis in Informatique

Under the supervision of Serge Abiteboul and Ioana Gabriela Manolescu Goujot.

defended on 2008

in Paris 11 , in a partnership with Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .


  • Abstract not available

  • Alternative Title

    La gestion efficace des ressources du web dans les réseaux pair-à-pair structurés


  • Abstract

    Les entreprises, et plus généralement les communautés concentrées sur un intérêt commun reposent de plus en plus sur le partage d'informations communes et complexes (e. G. , des rapports, des catalogues, des annuaires téléphoniques), par le biais du réseau. Touts ces articles représentent des ressources du Web. D'autre part, l'accès à l'information se fonde aujourd'hui principalement sur des moteurs de recherche basés sur des mots clés - un inconvénient principal, en particulier pour les applications utilisées dans l'industrie. Nous proposons le système KadoP reposant sur la technologie DHT, des techniques d'indexation des documents XML, et des nouveaux algorithmes développés garantissant l'interrogation les ressources partagées du Web par des requêtes complexes, à base de motifs d'arbre. Pour modéliser des données à la fois irrégulières et arborescentes, nous avons suivi le langage XML : la norme du Web, que nous enrichissons afin de tenir compte de ressources plus complexes comme les services Web ou des documents avec des liens entre eux. Notre étude est parmi les premières réalisées sur une plateforme réelle de gestion de données XML au-dessus d'un réseau P2P, par opposition aux simulations. Les solutions que nous avons apportées peuvent bénéficier à n'importe quel outil de gestion des données basé sur un réseau DHT. Par exemple, nous avons introduit une structure distribuée, inspirée des arbres B+, qui adresse le problème des entrées d'index très populaires qui limitent le passage a l'échèle du système. Cette nouvelle structure nous a permis de développer des algorithmes parallèles d'évaluation de requêtes.


  • Abstract

    Enterprises, and more generally communities centered around some common interest increasingly rely on the networks, on the peer-to-peer (P2P) networks, for sharing content. Community members publish reports, e-mails, contracts, catalogs, phone books as Web resources. On the other hand, access to Web information today primarily relies on keyword-based search engines - a main drawback, in particular for industry applications. In this thesis, we propose KadoP - a system that relies on the technology of Distributed Hash Tables, XML indexing techniques, and new developed algorithms, in order to support complex queries over the shared Web resources. Because the shared data is typically rather irregular and often tree-structured, we take XML, the Web standard, to encode Web resources. We have implemented the proposed techniques in KadoP and present experimental results, on real-life data sets, demonstrating that the system scales gracefully to large data volumes. Furthermore, the development of DHT technology has opened new opportunities for querying intensional XML documents in P2P systems. In this direction, this work studies the problem in the P2P networks based on the DHT technology.

Consult library

Version is available as a paper

Informations

  • Details : 1 vol. (147 p.)
  • Annexes : Bibliogr. p. 139-147

Where is this thesis?

  • Library : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Available for PEB
  • Odds : 0g ORSAY(2008)75
See the Sudoc catalog libraries of higher education and research.