Efficient web resource management in structured peer-to-peer networks

par Nicoleta Preda

Thèse de doctorat en Informatique

Sous la direction de Serge Abiteboul et de Ioana Gabriela Manolescu Goujot.

Soutenue en 2008

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .

  • Titre traduit

    La gestion efficace des ressources du web dans les réseaux pair-à-pair structurés


  • Résumé

    Les entreprises, et plus généralement les communautés concentrées sur un intérêt commun reposent de plus en plus sur le partage d'informations communes et complexes (e. G. , des rapports, des catalogues, des annuaires téléphoniques), par le biais du réseau. Touts ces articles représentent des ressources du Web. D'autre part, l'accès à l'information se fonde aujourd'hui principalement sur des moteurs de recherche basés sur des mots clés - un inconvénient principal, en particulier pour les applications utilisées dans l'industrie. Nous proposons le système KadoP reposant sur la technologie DHT, des techniques d'indexation des documents XML, et des nouveaux algorithmes développés garantissant l'interrogation les ressources partagées du Web par des requêtes complexes, à base de motifs d'arbre. Pour modéliser des données à la fois irrégulières et arborescentes, nous avons suivi le langage XML : la norme du Web, que nous enrichissons afin de tenir compte de ressources plus complexes comme les services Web ou des documents avec des liens entre eux. Notre étude est parmi les premières réalisées sur une plateforme réelle de gestion de données XML au-dessus d'un réseau P2P, par opposition aux simulations. Les solutions que nous avons apportées peuvent bénéficier à n'importe quel outil de gestion des données basé sur un réseau DHT. Par exemple, nous avons introduit une structure distribuée, inspirée des arbres B+, qui adresse le problème des entrées d'index très populaires qui limitent le passage a l'échèle du système. Cette nouvelle structure nous a permis de développer des algorithmes parallèles d'évaluation de requêtes.


  • Pas de résumé disponible.


  • Résumé

    Enterprises, and more generally communities centered around some common interest increasingly rely on the networks, on the peer-to-peer (P2P) networks, for sharing content. Community members publish reports, e-mails, contracts, catalogs, phone books as Web resources. On the other hand, access to Web information today primarily relies on keyword-based search engines - a main drawback, in particular for industry applications. In this thesis, we propose KadoP - a system that relies on the technology of Distributed Hash Tables, XML indexing techniques, and new developed algorithms, in order to support complex queries over the shared Web resources. Because the shared data is typically rather irregular and often tree-structured, we take XML, the Web standard, to encode Web resources. We have implemented the proposed techniques in KadoP and present experimental results, on real-life data sets, demonstrating that the system scales gracefully to large data volumes. Furthermore, the development of DHT technology has opened new opportunities for querying intensional XML documents in P2P systems. In this direction, this work studies the problem in the P2P networks based on the DHT technology.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (147 p.)
  • Annexes : Bibliogr. p. 139-147

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2008)75
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.