Amélioration des performances HPC de simulations en astrophysique

par Harris ludwig Boudi

Projet de thèse en Informatique

Sous la direction de Philippe Langlois et de Guillaume Revy.

Thèses en préparation à Perpignan , dans le cadre de École doctorale Énergie environnement (Perpignan) , en partenariat avec Laboratoire d'informatique, de robotique et de micro-électronique (Montpellier ; 199.-....) (laboratoire) et de Département Informatique (equipe de recherche) depuis le 31-08-2018 .


  • Résumé

    Le projet CTA (Cherenkov Telescope Array) [1] a pour objectif la construction et l'exploitation d'un réseau d'une centaine de télescopes Cherenkov situés sur les sites de La Palma (Canaries, Espagne) et Paranal (ESO, Chili). CTA ouvre une nouvelle ère dans l'astronomie gamma de très haute énergie. Un premier grand télescope est en cours d'installation à La Palma et l'acquisition des premières données est prévue pour fin 2018. Le consortium de CTA regroupe environ 1200 membres, une centaine d'instituts de recherche de 25 pays. Des simulations Monte Carlo détaillées des gerbes induites par les rayons cosmiques et la réponse des télescopes à la lumière Cherenkov, sont nécessaires tout au long du projet afin de calculer les fonctions de réponse des télescopes. Pour la simulation des gerbes atmosphériques CTA utilise le logiciel corsika [2], un logiciel de référence dans la communauté étudiant les rayons cosmiques Le temps de calcul associé aux simulations est et restera très important, i.e. environ 200 millions d'heures CPU normalisées par an. La réduction du temps de calcul nécessaire aux simulations est donc un enjeu majeur pour le projet. L'objectif de cette thèse est d'obtenir les performances « maximales » lors de l'exécution des codes de simulation. Une étude préliminaire réalisée dans le cadre du PEPS Astro-Informatique [3], nous a permis de montrer que les outils d'optimisation automatique présentent des limites lorsqu'ils sont confrontés à des codes comme ceux de CTA [4]. L'idée principale est donc d'explorer tout l'espace des opportunités d'optimisation en évitant toute contrainte. Nous souhaitons donc nous affranchir des contraintes liées aux limites des analyses statiques et aux heuristiques des compilateurs, à celles liées aux informations manquantes sur les jeux de données, ainsi qu'à celles liées aux informations manquantes sur la micro-architecture cible. Pour parvenir à cette fin, le candidat devra d'abord donc réaliser des transformations de programme « manuelles » qui prendront en compte des informations sur les jeux de données et sur la micro-architecture cible. Ces transformations lui permettront d'atteindre des performances maximales. Il s'agira ensuite de mesurer et de quantifier les améliorations de performance liées aux différentes contraintes et de mettre en évidence les voies les plus prometteuses pour lever les verrous de l'optimisation automatique. Ce travail s'effectuera dans un contexte international en étroite collaboration avec les astrophysiciens, membres de la collaboration CTA, ce qui permettra d'assurer la validité des résultats obtenus avec les versions du code optimisées.

  • Titre traduit

    Performance improvement of HPC astrophysics simulations


  • Résumé

    The CTA (Cherenkov Telescope Array) [1] project aims to build and operate a network of about 100 Cherenkov telescopes located in the La Palma (Canary Islands, Spain) and Paranal (ESO, Chile) sites. . CTA opens a new era in very high energy gamma astronomy. A first large telescope is being installed in La Palma and the acquisition of the first data is planned for the end of 2018. The consortium of CTA has about 1200 members, about a hundred research institutes from 25 countries. Detailed Monte Carlo simulations of cosmic ray sheaves and the response of telescopes to Cherenkov light are needed throughout the project to calculate telescope response functions. For the simulation of air showers, CTA uses the software corsika [2], a reference software in the community studying cosmic rays. The computation time associated with the simulations is and will remain very high, ie about 200 million normalized CPU hours per year. Reducing this computation time required for simulations is therefore a major challenge for the project. The objective of this thesis is to provide the 'maximum' performances during the execution of the simulation codes. A preliminary study carried out in the framework of the Astro-Informatique PEPS [3], allowed us to show that the automatic optimization tools have limits when confronted with codes like those of CTA [4]. The main idea is to explore the entire space of optimization opportunities by avoiding any constraints. We want to overcome the limitations of static analysis and compiler heuristics, missing dataset information, and missing information on the target microarchitecture. To achieve this end, the candidate will have to make 'manual' program transformations that will take into account information on the datasets and the target micro-architecture. These transformations will allow him to achieve maximum performance. To achieve this end, the candidate will first have to make 'manual' program transformations that will take into account information about the datasets and the target micro-architecture. These transformations will allow him to achieve maximum performance. It will then be necessary to measure and quantify performance improvements related to different constraints and to highlight the most promising ways to remove the locks of automatic optimization. This work will be carried out in an international context in close collaboration with the astrophysicists, members of the CTA collaboration, which will ensure the validity of the results obtained with the optimized versions of the code.