Large scale diffusion of information in publish-subscribe systems

par Raphaël Chand

Thèse de doctorat en Informatique

Sous la direction de Ernst W. Biersack et de Pascal Felber.

Soutenue en 2005

à Nice .

  • Titre traduit

    Dissémination d'information à large échelle dans les systèmes de type publication-abonnement


  • Résumé

    This work focuses on publish/subscribe systems, where producers publish information and consumers express their interests for certain types of information. The data is disseminated according to its nature and the interests of the consumers. Publish/subscribe systems have become a hot research topic, because the strong decoupling that they offer between the participants makes them well adapted to large scale distributed information systems. We first present a publish/subscribe system that we specifically designed to implement efficient and reliable distribution of structured xml content to very large populations of consumers. For that purpose, our system integrates several novel technologies, such as subscription aggregation. We have analyzed its efficiency by the means of various simulations and, to experiment with the conditions of the real internet, we have performed a large scale deployment in the planetlab testbed. Experimental results demonstrate that our system offers very good performance and salability under normal operation and can quickly recover from system failures. We then present a novel approach to building a publish/subscribe system based on the peer-to-peer paradigm. Our system features an extremely simple routing process. The price to pay for this simplicity is that routing may not be perfectly accurate. However, by organizing the peers in "semantic communities'', i. E. , by organizing them according to their interests with adequate proximity metrics, we can minimize the routing inaccuracy. Experimental results demonstrate that the routing process is indeed very accurate and highly efficient in the presence of large consumer populations.


  • Résumé

    Cette these est consacree a l'etude de reseaux de type publication/abonnement dans lesquels des producteurs publient de l'information a l'intention de consommateurs. Les donnees sont diffusees selectivement en fonction de leur nature et des interets des consommateurs. Les reseaux de ce type sont devenus un theme de recherche tres populaire car ils offrent un grand decouplage entre les elements du systeme, permettant de passer aisement a l'echelle. Dans un premier temps, nous presentons un systeme de type publication/abonnement que nous avons specialement concu pour la diffusion efficace et fiable de documents xml a large echelle. Notre systeme integre plusieurs technologies et algorithmes novateurs, tels que l'agregation de souscriptions. Nous avons realise de nombreuses simulations et nous avons deploye notre systeme sur la plate-forme experimentale mondiale planetlab. Les resultats montrent que notre systeme est efficace et passe aisement a l'echelle, et est capable de se reconstituer rapidement suite a des pannes de liens ou de routeurs. Dans un deuxieme temps, nous proposons une approche originale pour concevoir un systeme de type publication/abonnement. Notre systeme est base sur le concept pair-a-pair. La principale innovation est l'utilisation d'un protocole de routage extremement simple. Il en resulte une certaine perte de precision, que nous pouvons cependant minimiser en organisant les pairs en fonction de leurs interets dans des ''communautes semantiques'', au moyen de metriques de proximite adequates. L'evaluation experimentale montre que le routage est effectivement precis et tres efficace en presence de grandes populations de consommateurs.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (159 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 149-156

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Bibliothèque Sciences.
  • Disponible pour le PEB
  • Cote : 05NICE4039
  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Bibliothèque Sciences.
  • Non disponible pour le PEB
  • Cote : 05NICE4039bis
  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : CHAND l
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.