Thèse soutenue

Systeme de caches cooperatifs pour les systemes d'informations distribuees a grande echelle

FR
Auteur / Autrice : JEAN-MARC MENAUD
Direction : Michel Banâtre
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2000
Etablissement(s) : Rennes 1

Résumé

FR

Depuis ces dernieres annees, l'emergence de nouvelles technologies a fait naitre une nouvelle classe de services nommee service en-ligne. La particularite de ces services est d'interagir avec leurs clients et de diffuser de l'information au travers d'un medium de communication informatique partage. L'ensemble forme par les services en-ligne, les reseaux de communication et les utilisateurs, forme un systeme d'information. Ce systeme est dit distribue et a grande echelle (ladis pour large scale distributed information system), lorsque le nombre de services et d'informations mis a disposition, n'est plus apprehendable. L'exemple le plus connu de ladis est le world wide web. Malheureusement, ces systemes d'informations sont victimes de leurs succes, si bien qu'ils n'offrent de nos jours que de pietres temps de reponse. Nous nous interessons dans ce document a l'amelioration du temps de reponse dans les ladis. Nous montrons, apres etude, que cet objectif peut etre atteint en utilisant une methode de distribution et replication dynamique d'informations (appelee mise en cache) au niveau du reseau informatique. Un cache reseau permet de sauvegarder dans un espace local un ensemble d'informations accedees par ses utilisateurs proches. En interceptant les requetes des utilisateurs et en fournissant l'information recherchee, si cette derniere est presente dans l'espace local, le cache reseau permet de diminuer le temps de reponse aux informations, de reduire l'utilisation du reseau, et de soulager la charge du service en-ligne. Malheureusement, les caches reseaux ne possedent qu'une faible efficacite. Pour pallier ce probleme, nos propositions consistent a augmenter virtuellement la taille, a affiner la politique de remplacement d'objets et a augmenter virtuellement le nombre de clients d'un cache reseau. La premiere solution, nommee lru-qos, reside en la degradation des informations, sauvegardees localement, les moins accedees, car, en reduisant leurs tailles, le comportement fonctionnel d'un cache degrade avoisine celui d'un de plus grande capacite. La seconde proposition, nommee lru-hot, consiste a affiner la politique de remplacement d'objets d'un cache en determinant les informations possedant un fort potentiel de re-acces, par integration des frequences d'acces de ces dernieres, delivrees par le service en-ligne les maintenant. Finalement, nous augmentons le nombre de clients en realisant une cooperation entre differents caches reseaux du systeme d'informations. De ce fait, nous augmentons le nombre de profils utilisateurs, donc les probabilites de profils communs. Le point difficile fut de definir un protocole de cooperation extensible, nomme scoops, car le benefice de l'approche ne se fait sentir que pour un tres grand nombre de caches. La solution regroupant l'ensemble de nos propositions, nommee scoops++, permet, en comparaison a un systeme classique, de diminuer, au niveau des utilisateurs, le temps de reponse de pres de 30%.