Thèse de doctorat en Sciences. Informatique
Sous la direction de Zhen Liu.
Soutenue en 2000
à Nice .
Cette thèse porte sur l'évaluation de performances des serveurs Web et sur la caractérisation du trafic Web. Un modèle de haut niveau du processus de génération de trafic HTTP est proposé. Sur la base de ce modèle, qui prend en compte les éléments clé dans la génération de trafic HTTP, nous avons développé un outil -WAGON-qui offre plusieurs fonctionnalités dont la principale est la génération de trafic HTTP avec des caractéristiques très semblables à celles du trafic réel. Des paramètres réalistes du modèle peuvent être déterminés à partir de l'analyse statistique de fichiers de traces des serveurs Web. Afin de faciliter cette tâche, WAGON comporte un module d'analyse statistique avec estimation de paramètres pour mélanges de distributions, au moyen de l'algorithme EM, ainsi que des tests d'ajustement. Des résultats des expérimentations qui ont été conduits à l'aide de cette outil sont présentés. Nous comparons les performances des différentes versions du protocole HTTP sous différentes conditions du réseaux et configurations des clients. Nous avons validé l'utilité de la politique de gestion de connexions persistantes du côté des clients, connue comme È̀arly Close'', pour l'amélioration de la performance des serveurs Web. Nous proposons aussi une mesure pour avoir une notion de la performance du Web telle qu'il est perçue par les utilisateurs. Nous avons comparé avec cette mesure la performance subjective des protocoles HTTP. Une autre partie de ce travail a été l'analyse statistique de fichiers de traces de plusieurs serveurs Web. Nous avons trouvé les distributions de probabilité de plusieurs variables du trafic Web. Afin d'étendre l'éventail de possibilités nous avons modélisé, à l'aide de l'algorithme EM, la distribution de ces variables comme un mélange de distributions et non comme une distribution simple. Nous avons montré comment cette nouvelle approche améliore notablement la qualité de l'ajustement de la distribution hypothétique avec la distribution empirique des données.
Modeling and optimisation of the web
The main subjects of this thesis are the performance evaluation of Web servers and the characterisation of the Web traffic. A high level model of the HTTP traffic generation process is proposed. On the basis of this model, which takes into account the key elements involved in the generation of HTTP traffic , we have developed a tool -WAGON-. This tool offers several functionalities, the principal one of which is the generation of HTTP traffic with characteristics very similar to those of real traffic. Realistic parameters of the model can be obtained from the statistical analysis of Web server l̀̀ogfiles''. In order to facilitate this task, WAGON includes a statistical analysis module implementing the EM algorithm for the estimation of mixed distributions parameters and several goodness of fit tests. Results of experiments carried out by using this tool are presented. We compare the performances of the various versions of the HTTP protocol under various network conditions and customer configurations. We have validated the utility of the management policy of persistent connections used on the customer side, known as È̀arly Close' ', in the improvement of the performance of Web servers. We propose a measure enabling us to have a notion of the Web performance as perceived by the users. We have used this measure to compare the subjective performance of HTTP protocols. Another part of this work has been the statistical analysis of l̀̀ogfiles'' from several Web servers. We have found the probability distributions of several variables of the Web traffic. In order to extend the range of possibilities, we have modelled the distribution of these variables as a mixture of distributions, and not as a simple distribution, using the algorithm EM. We have showed how this new approach notably improves the quality of fit of the hypothetical distributions with the empirical distributions of the data.