Thèse soutenue

Simulations stochastiques en environnements distribués : application aux grilles de calcul

FR  |  
EN
Auteur / Autrice : Romain Reuillon
Direction : David R. C. HillMamadou Kaba Traoré
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2008
Etablissement(s) : Clermont-Ferrand 2

Résumé

FR

La révolution informatique initiée lors de la 2e partie du 20e siècle place la simulation informatique en tant que paradigme très populaire pour l'investigation scientifique, pour la prévision et la compréhension des mécanismes dans des systèmes complexes. Parmi les critères de classification des spécialistes de la simulation, on peut distinguer les modèles déterministes et les modèles stochastiques. Contrairement au déroulement d'un modèle déterministe, le déroulement et donc les résultats issus d'un modèle stochastique sont conditionnés par la réalisation de variables aléatoires. Ainsi, ils utilisent des sources de hasard pour en tirer un avantage afin d'estimer statistiquement un résultat. Ce type de modèle produit ainsi en un temps raisonnable une approximation pour un résultat souvent incalculable de manière déterministe. En contrepartie, il est nécessaire d'estimer l'espérance et les intervalles de confiance associés aux quantités aléatoires en sortie du modèle stochastique. Ce calcul nécessite l'exécution de plusieurs réplications indépendantes de la même expérience et, de ce fait, une importante somme de calcul. Pour cela, il n'est plus rare que l'exécution de larges simulations stochastiques aux échelles actuelles nécessitent plusieurs dizaines d'années sur un ordinateur en séquentiel. L'indépendance des réplications est ainsi un aspect primordial, d'une part pour la qualité des résultats finaux, et d'autre part parce qu'il permet l'accélération de calculs stochastiques par le biais d'une exécution parallèle. Toutes les similations stochastiques comprennent par conception un aspect naturellement parallèle. De ce fait, les simulations stochastiques, représentent une des applications phares pour l'utilisation d'environnements de calculs distribués extensifs, de type grilles de calcul. Les grilles de calcul servent en quelque sorte de super-calculateur pour exploiter en parallèle la puissance de dizaine de milliers d'ordinateurs situés dans le monde. Plus de 50% des cycles de super-calculateurs de la planète sont maintenant consommés par des calculs stochastiques, il existe encore malheureusement de mauvaises pratiques en ce qui concerne l'utilisation de générateurs de nombres pseudo-aléatoires (comme par exemple l'utilisation de générateurs de faible qualité par rapport aux attentes du 21e, ou encore la disponibilité même dans des bibliothèques et des logiciels de simulation de renom de générateurs contenant des erreurs d'implémentation). De plus, et c'est plus particulièrement la raison d'être de ce sujet, nous constatons une méconnaissance des techniques de parallélisation de générateurs de nombres pseudo-aléatoires. Nous montrons qu'il existe un risque bien réel de produire des résultats de simulations stochastiques incohérents du fait d'un manque de rigueur et d'une mauvaise compréhension des mécanismes de parallélisation des simulations stochastiques. Cette thèse présente ainsi une contribution au développement de méthodes et d'outils logiciels permettant de distribuer de manière rigoureuse les réplications de simulations stochastiques. Elle propose des méthodes novatrices permettant d'assurer une traçabilité dans le processus complexe de distribution de simulations stochastiques. Ces méthodes ont été intégrées dans des outils logiciels libres mis à la disposition de la communauté scientifique. L'utilisation de ces outils associés à la grille de calcul auvergnate "Auvergrid" a permis l'exécution de simulations stochastiques dans les domaines de l'imagerie médicale nucléaire et de simulations environnementales. Le temps nécessaire à la réalisation de ces simulations est équivalent à plus de 70 années de calcul sur un ordinateur séquentiel. Grâce aux propositions de cette thèse, nous montrons des résultats sur des applications permettent aussi bien d'explorer les possibilités de colonisation de la Méditerranée par l'algue Caulerpa taxifolia, que d'améliorer considérablement la reconstruction d'images pour la détection de petites tumeurs avec des scanners PET ou SPECT