Scalable and Efficient Data Management in Distributed Clouds : Service Provisioning and Data Processing | Theses.fr

Jad Darrous

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Gestion de données efficace et à grande échelle dans les clouds distribués : Déploiement de services et traitement de données

FR |

EN

Auteur / Autrice :	Jad Darrous
Direction :	Christian Pérez
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 17/12/2019
Etablissement(s) :	Lyon
Ecole(s) doctorale(s) :	École doctorale en Informatique et Mathématiques de Lyon (2009-....)
Partenaire(s) de recherche :	établissement opérateur d'inscription : École normale supérieure de Lyon (2010-...)
	Laboratoire : Laboratoire de l'informatique du parallélisme (Lyon ; 1988-....) - Algorithms and Software Architectures for Distributed and HPC Platforms
Jury :	Président / Présidente : Guillaume Pierre
	Examinateurs / Examinatrices : Christian Pérez, Guillaume Pierre, Pierre Sens, María S. Pérez-Hernández, Ibrahim Shadi, Patricia Stolf
	Rapporteurs / Rapporteuses : Pierre Sens, María S. Pérez-Hernández

Mots clés

FR |

EN

Mots clés contrôlés

Hadoop (plate-forme informatique)

Systèmes de gestion de données techniques

Données massives

Mots clés libres

Gestion de données

Systèmes de stockage à grande échelle

Clouds geo-distribués

Edge/Fog computing

Déploiement de services

Images des machines virtuelles et des conteneurs

Hadoop

Codage d'effacement

Résumé

FR |

EN

Cette thèse porte sur des solutions pour la gestion de données afin d'accélérer l'exécution efficace d'applications de type « Big Data » (très consommatrices en données) dans des centres de calculs distribués à grande échelle. Les applications de type « Big Data » sont de plus en plus souvent exécutées sur plusieurs sites. Les deux principales raisons de cette tendance sont 1) le déplacement des calculs vers les sources de données pour éliminer la latence due à leur transmission et 2) le stockage de données sur un site peut ne pas être réalisable à cause de leurs tailles de plus en plus importantes.La plupart des applications s'exécutent sur des clusters virtuels et nécessitent donc des images de machines virtuelles (VMI) ou des conteneurs d’application. Par conséquent, il est important de permettre l’approvisionnement rapide de ces services afin de réduire le temps d'attente avant l’exécution de nouveaux services ou applications. Dans la première partie de cette thèse, nous avons travaillé sur la récupération et le placement des données, en tenant compte de problèmes difficiles, notamment l'hétérogénéité des connexions au réseau étendu (WAN) et les besoins croissants en stockage pour les VMIs et les conteneurs d’application.Par ailleurs, les applications de type « Big Data » reposent sur la réplication pour fournir des services fiables et rapides, mais le surcoût devient de plus en plus grand. La seconde partie de cette thèse constitue l'une des premières études sur la compréhension et l'amélioration des performances des applications utilisant la technique, moins coûteuse en stockage, des codes d'effacement (erasure coding), en remplacement de la réplication.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Gestion de données efficace et à grande échelle dans les clouds distribués : Déploiement de services et traitement de données

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Gestion de données efficace et à grande échelle dans les clouds distribués : Déploiement de services et traitement de données

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses