Stockage Distribué et ses applications

par Guillaume Ruty

Projet de thèse en Informatique

Sous la direction de Jean-Louis Rougier.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec LTCI - Laboratoire de Traitement et Communication de l'Information (laboratoire) , INFRES/RMS : Réseaux, Mobilité et Services (equipe de recherche) et de Télécom ParisTech (établissement de préparation de la thèse) depuis le 16-02-2016 .


  • Résumé

    Contexte Les nouvelles architectures de type Internet cloud et de data-centres nécessitent une grande flexibilité dans le déploiement de services de stockage [1]. C'est dans ce contexte qu'apparaît la notion de plateformes de stockage virtualisées (Software Defined Storage, SDS) [2]. Cette approche permet d'allouer les demandes de services de stockage sur les équipements les plus adaptés, sur un ensemble hétérogène de ressources de stockage (dans différents data-centres, et sur des équipements de « caching » dans le réseau, etc.). Cette allocation de ressource peut être dynamique, ce qui peut induire des déplacement de fonctions de stockage et de « workloads » dans différents points du réseau, en fonction des besoins des utilisateurs, de leur déplacement dans le réseau (pour des terminaux mobiles), des variations dans les disponibilités de ressources, etc. Les flux qui participent au service sont ainsi sélectionnés/classés dynamiquement et redirigés vers les services de stockage appropriés. Objectifs. Les déploiements de systèmes SDS actuels sont le plus souvent centralisés au niveau d'un 'contrôleur '. L'optimisation dynamique des ressources allouées pour chaque demande de stockage pose un problème critique de passage à l'échelle. Nous proposons donc d'étudier la faisabilité, la robustesse et la stabilité d'un système SDS totalement distribué. La thèse vie à apporter une solution globale couvrant l'architecture (comment distribuer les fonctions entre les nœuds), les aspects protocolaires et algorithmiques (détection de panne, maintien de la connectivité, garantie d'accès aux données, etc.). Les solutions proposées pourront être validées sur une plateforme expérimentale. L'accent sera mis en particulier sur la fiabilité du système. Ceci inclut, par exemple, la gestion de la redondance au niveau du stockage [2] et du réseau (duplication des flux), mais aussi la re-direction de flux en cas de panne. Etat de l'art et pistes de recherche Le stockage distribué est un sujet récent qui reçoit un intérêt énorme de la part de l'Industrie. Des groupes de travail tels que SNIA commencent à émerger mais, globalement, tout reste à faire. En particulier, ce sujet n'a pas encore fait l'objet d'études académiques. Les offres actuelles correspondent principalement à un service de provisionnement centralisé, offrant un certain niveau d'abstraction permettant de masquer l'hétérogénéité des ressources de stockage (voir par exemple [4]). Mais, à ce jour, ces solutions n'adressent pas l'optimisation dynamique des ressources (c'est à dire l'allocation conjointe au niveau stockage et réseau). Nous pourrons étudier si la distribution de ces optimisations est possible, afin d'être plus simple à mettre en œuvre. Des solutions heuristiques seront également explorées. Dans les cas où les échanges d'information seraient prohibitifs, l'utilisation de méthodes d'apprentissage (machine learning) pourra constituer une piste d'exploration. L'idée est de sélectionner stratégiquement les solutions efficaces en fonction de paramètres mesurées localement — sans forcément connaître les relations complexes reliant ces paramètres. A niveau architectural, des études ont été menées sur la distribution du plan contrôle dans le cadre des réseaux SDN (Software Defined Networks) [5][6]. Il existe généralement un compromis entre cohérence des états et passage à l'échelle [7]. L'idée serait d'adapter ces précédentes études dans le contexte spécifique des SDS (en introduisant par exemple des « domaines de stockage » par exemple). Un autre aspect que nous proposons d'étudier est l'apport possible du chaînage de service [8]. L'idée serait de caractériser les possibilités de relocalisation partielle des unités de stockages dans le réseau — et les mécanismes permettant au système de stockage de continuer à fonctionner durant cette reconfiguration. Le « service chaining » est abordé dans différents groupes de (pré-)standardisation comme par exemple à l'IETF ou au sein du groupe ETSI NFV (Network Function Virtualization). De nouvelles extensions de IPv6 permettent notamment d'introduire des fonctionnalités très utiles pour ce chainage de service [9]. L'application et la généralisation des nouvelles fonctionnalités de IPv6 (extensions pour le Segment Routing, Service Chaining, ...) dans le contexte de SDS sont des champs encore à explorer car pratiquement vierges.

  • Titre traduit

    Distributed Storage and applications


  • Pas de résumé disponible.