Thèse soutenue

Ordonnancement et réplication de données bioinformatiques dans un contexte de grille de calcul

FR
Auteur / Autrice : Antoine Vernois
Direction : Frédéric DesprezChristophe Blanchet
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2006
Etablissement(s) : École normale supérieure (Lyon ; 1987-2009)

Résumé

FR  |  
EN

Au cours de cette thèse, nous nous sommes placés dans le contexte bien > particulier d'une catégorie d'applications bioinformatiques dont les > caractéristiques sont d'utiliser des banques de données de références en > lecture seule et d'avoir un coût en temps de calcul affine en la taille des > données. Une autre caractéristique concernant l'utilisation de ces > applications est que leur schéma d'utilisation reste constant dans le > temps. Dans ce cadre, nous avons défini un algorithme basé sur un programme > linéaire permettant de calculer un ordonnancement et un placement statique > des données optimisant le rendement d'une plate-forme de type grille de > calcul. Grâce au simulateur Optorsim que nous avons largement modifié, nous > avons montré les bons résultats de notre algorithme lorsque l'espace de > stockage sur les noeuds de calcul ou le débit du réseau connectant les > différents sites sont des points critiques. > Nous avons ensuite établi un ensemble d'heuristiques dont le but est de > palier à d'éventuels changements dans les schémas d'utilisation des banques > de données. Là encore, nous avons utilisé Optorsim pour montrer et > comprendre l'impact de ces différentes heuristiques. Il en découle que dans > la plupart des cas, nous sommes en mesure de conserver une utilisation > presque optimale de la plate-forme, même lorsque les requêtes qui arrivent > sont très différentes du schéma d'utilisation utilisé pour le placement > initial. Enfin, nous avons réalisé un prototype du système basé sur > l'ordonnancement et le placement statique au sein de l'intergiciel de > grille DIET. Ce prototype, déployé sur un ensemble de noeuds de la > plate-forme Grid 5000, nous a permis de montrer l'efficacité de notre > méthode dans un environnement réel.