Calcul itératif asynchrone à grande échelle sur des architectures hétérogènes et volatiles

par Jean-Claude Charr

Thèse de doctorat en Informatique

Sous la direction de Raphaël Couturier.

Soutenue en 2009

à Besançon , en partenariat avec Université de Franche-comté. UFR des sciences et techniques (autre partenaire) .


  • Résumé

    Avec l'émergence de nouvelles architectures distribuées, comme les grappes de calcul distantes et les architectures de calcul volontaire, il apparaît important de définir des algorithmes et des intergiciels bien adaptés à ces architectures. En effet, l'utilisation de ces plate-formes introduit plusieurs nouvelles contraintes par rapport à un contexte de grappes locales homogènes : hétérogénéité des machines, hétérogénéité des réseaux, volatilité des nœuds de calcul, etc. Dans ce contexte, plusieurs travaux montrent que pour les algorithmes itératifs il peut être préférable d'utiliser les algorithmes IACA (Itérations Asynchrones avec Communications Asynchrones) pour lesquels les communications sont recouvertes par du calcul et la perte des messages de données est tolérée. Les travaux présentés dans cette thèse concernent la conception et la mise en oeuvre d'une plate-forme dédiée à l'exécution d'algorithmes IACA sur des architectures distribuées, hétérogènes et volatiles. Cette plate-forme, JACEP2P-V2, est tolérante aux pannes et décentralisée. Elle offre un mécanisme de communications asynchrones et un mécanisme de détection de la convergence globale adapté aux caractéristiques des algorithmes IACA. De plus, nous reportons des expérimentations sur grappes hétérogènes volatiles et distantes afin de tester l'efficacité et la robustesse de notre plate-forme. Les résultats obtenus, avec plus de 1000 cœurs de calculs, sont très encourageants et montrent que JACEP2P-V2 est extensible et performante. Nous terminons ce document par la présentation d'une étude comparative de plusieurs méthodes de résolutions de systèmes non linéaires (comme la multi-décomposition et la relaxation d'ondes) implémentées avec JACEP2P-V2.

  • Titre traduit

    Large scale iterative asynchronous computing over distributed heterogeneous volatil architectures


  • Résumé

    With the emergence of new distributed architectures, such as distributed clusters and volunteer computing architectures, it seems important to design algorithms and middlewares that are well adapted to these architectures. Indeed, when using these architectures, developers are faced with many new constraints that they do not encounter when using local clusters, like the heterogeneity of the machines and the networks that interconnect them, the volatility of the computing nodes, etc. In this context, many research works show that for iterative methods, it is preferred to use the AIAC (Asynchronous iterations with Asynchronous Communications) model where the communications are overlapped by the computations and the loss of data messages is tolerated. The research work, presented in this document, concerns the design and the implementation of a platform dedicated to executing AIAC algorithms over distributed heterogeneous volatile architectures. This platform, JACEP2P-V2, is fault tolerant and decentralized. It offers an asynchronous communication mechanism and a global convergence detection mechanism well adapted to the characteristics of AIAC algorithms. Moreover, we present many experiments that we have conducted over volatile distributed heterogeneous architectures using JACEP2P-V2 in order to test the efficiency and robustness of our platform. The experiments' results are very encouraging and prove that JACEP2P-V2 is scalable and powerful. We end this document with a comparative study of many methods that solve nonlinear systems (such as Multisplitting and Waveform relaxation) and are implemented according to JACEP2P-V2's APl.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (118 p.)
  • Notes : Reproduction de la thèse autorisée
  • Annexes : Bibliogr. p.[111] - 116

Où se trouve cette thèse ?