Spécification et optimisation de sites Web à usage intensif de données

par Khaled Yagoub

Thèse de doctorat en Informatique

Sous la direction de Patrick Valduriez.

Soutenue en 2001

à Versailles-St Quentin en Yvelines .


  • Résumé

    Un site Web à usage intensif de données (SWID) est un site Web qui gère un nombre important de pages dont le contenu est construit dynamiquement, à partir de grandes bases de données. C'est à dire que l'ensemble des pages Web constituant le site n'est pas construit et stocké une fois pour toutes, sur le serveur Web, pour être utilisé ; mais au contraire, les pages Web sont regénérées dynamiquement lorsque le site est parcouru par les utilisateurs. . Cette création demande d'extraire des données d'une base de données et de construire les pages HTML correspondantes. Dans ce contexte, la demande d'une page par un client peut n"cessiter une interaction coûteuse avec le système de gestion de base de données, pour la connexion à la base et l'exécution des requêtes nécessaires à la récupération des données, risquant ainsi d'augmenter considérablement le temps d'attente du client. Dans cette thèse nous adressons ce problème de performance en nous appuyant sur la spécification déclarative de sites Web. Nous proposons une architecture configurable de caches à plusieurs niveaux et sa mise en oeuvre dans le cadre de Weave, un système de gestion de sites Web développé à l'INRIA. Dans notre approche, il est possible de cacher des données extraites d'une base de données (sous forme de vues matérialisées), des fragments XML et/ou des pages HTML. Pour spécifier et personnaliser différentes stratégies de caching, nous offrons un langage de haut niveau, appelé WeaveRPL. Nous développons aussi une infrastructure de base permettant de compiler une spécification déclarative d'un site Web et de générer automatiquement une stratégie de caching optimale. Nous illustrons notre approche à l'aide d'un site Web construit à partir de la base de données TCP/D. Puis, nous évaluons expérimentalement, les performances de différentes stratégies de caching en utilisant notre plate-forme de test WeaveBench. Les résultats obtenus montrent clairement qu'une stratégie mixte est généralement la meilleure.

  • Titre traduit

    Data-intensive Web sites specification and optimization


  • Pas de résumé disponible.


  • Résumé

    A data-intensive web site (DIWS) is a Web site that accesses large numbers of pages whose content is dynamically extracted from a database. In this context, returning a Web page may require a costly interaction with the database system, for connection and querying, to dynamically extract its content. The database interaction cost adds up to the non-negligible base cost of Web page delivery, thereby increasing much the client waiting time. In this thesis, we address this performance problem. Our approach relies on the declarative specification of the Web site. We propose a customized cache system architecture and its implementation, in the context of Weave, a Web site managment system developed at INRIA. The system can cache database data (as materialized views), XML fragments, or HTML files. In addition, Weave comes along with the WeaveRPL langage for specifying both the Web site's content and customized data materialization within the site. We also develop a basic framework for automatic compilation of Web site specifications into optimal caching strategies. Our solution has been illustrated using a Web site derived from TCP/D benchmark database. Based on experiments using our test platform WeaveBench, we assess the performance of various caching strategies. The results clearky show that a mixed strategy is generally optimal.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 147 p.
  • Notes : Publication autorisée par le jury
  • Annexes : 122 REF. Bibliogr. p. 123-130

Où se trouve cette thèse ?

  • Bibliothèque : Université de Versailles Saint-Quentin-en-Yvelines. Direction des Bibliothèques et de l'Information Scientifique et Technique-DBIST. Bibliothèque universitaire Sciences et techniques.
  • Disponible pour le PEB
  • Cote : 005.7 YAG
  • Bibliothèque : Université de Versailles Saint-Quentin-en-Yvelines. Direction des Bibliothèques et de l'Information Scientifique et Technique-DBIST. Bibliothèque universitaire Sciences et techniques.
  • Non disponible pour le PEB
  • Cote : T010007
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.