Étude de transformations et d’optimisations de code parallèle statique ou dynamique pour architecture "many-core"

Camille Gallet

Thèse Année : 2016

Study of transformations and static or dynamic parallel code optimization for manycore architecture

Étude de transformations et d’optimisations de code parallèle statique ou dynamique pour architecture "many-core"

(1)

Camille Gallet

Fonction : Auteur

DAM Île-de-France

Résumé

Since the 60s to the present, the evolution of supercomputers faced three revolutions : (i) the arrival of the transistors to replace triodes, (ii) the appearance of the vector calculations, and (iii) the clusters. These currently consist of standards processors that have benefited of increased computing power via an increase in the frequency, the proliferation of cores on the chip and expansion of computing units (SIMD instruction set). A recent example involving a large number of cores and vector units wide (512-bit) is the co-proceseur Intel Xeon Phi. To maximize computing performance on these chips by better exploiting these SIMD instructions, it is necessary to reorganize the body of the loop nests taking into account irregular aspects (control flow and data flow). To this end, this thesis proposes to extend the transformation named Deep Jam to extract the regularity of an irregular code and facilitate vectorization. This thesis presents our extension and application of a multi-material hydrodynamic mini-application, HydroMM. Thus, these studies show that it is possible to achieve a significant performance gain on uneven codes.

L’évolution des supercalculateurs, de leur origine dans les années 60 jusqu’à nos jours, a fait face à 3 révolutions : (i) l’arrivée des transistors pour remplacer les triodes, (ii) l’apparition des calculs vectoriels, et (iii) l’organisation en grappe (clusters). Ces derniers se composent actuellement de processeurs standards qui ont profité de l’accroissement de leur puissance de calcul via une augmentation de la fréquence, la multiplication des cœurs sur la puce et l’élargissement des unités de calcul (jeu d’instructions SIMD). Un exemple récent comportant un grand nombre de cœurs et des unités vectorielles larges (512 bits) est le co-proceseur Intel Xeon Phi. Pour maximiser les performances de calcul sur ces puces en exploitant aux mieux ces instructions SIMD, il est nécessaire de réorganiser le corps des nids de boucles en tenant compte des aspects irréguliers (flot de contrôle et flot de données). Dans ce but, cette thèse propose d’étendre la transformation nommée Deep Jam pour extraire de la régularité d’un code irrégulier et ainsi faciliter la vectorisation. Ce document présente notre extension et son application sur une mini-application d’hydrodynamique multi-matériaux HydroMM. Ces travaux montrent ainsi qu’il est possible d’obtenir un gain de performances significatif sur des codes irréguliers.

Mots clés

Vectorization HPC Manycore Parallelism Benchmark Algorithm

Vectorisation HPC Manycore Parallélisme Benchmark Algorithme

Domaines

Autre [cs.OH]

Fichier principal

these_archivage_3160365.pdf (6.83 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-02406318

Soumis le : jeudi 12 décembre 2019-09:28:06

Dernière modification le : mercredi 3 avril 2024-11:24:09

Archivage à long terme le : vendredi 13 mars 2020-16:16:34

Dates et versions

tel-02406318 , version 1 (12-12-2019)

Identifiants

HAL Id : tel-02406318 , version 1

Citer

Camille Gallet. Étude de transformations et d’optimisations de code parallèle statique ou dynamique pour architecture "many-core". Autre [cs.OH]. Université Pierre et Marie Curie - Paris VI, 2016. Français. ⟨NNT : 2016PA066747⟩. ⟨tel-02406318⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CEA UPMC THESES-UPMC STAR DAM SORBONNE-UNIVERSITE THESES-SU SU-SCIENCES

105 Consultations

215 Téléchargements

Study of transformations and static or dynamic parallel code optimization for manycore architecture

Étude de transformations et d’optimisations de code parallèle statique ou dynamique pour architecture "many-core"

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager