Gestion du cycle de vie de services déployés sur une infrastructure de calcul distribuée en neuroinformatique

par Javier Rojas Balderrama

Thèse de doctorat en Informatique

Sous la direction de Johan Montagnat et de Diane Lingrand.

Soutenue en 2012

à Nice .


  • Résumé

    L’intérêt va croissant parmi les communautés scientifiques pour le partage de données et d’applications qui facilitent les recherches et l’établissement de collaborations fructueuses. Les domaines interdisciplinaires tels que les neurosciences nécessitent particulièrement de disposer d’une puissance de calcul suffisante pour l’expérimentation à grande échelle. Malgré les progrès réalisés dans la mise en œuvre de telles infrastructures distribuées, de nombreux défis sur l’interopérabilité et le passage à l’échelle ne sont pas complètement résolus. L’évolution permanente des technologies, la complexité intrinsèque des environnements de production et leur faible fiabilité à l’exécution sont autant de facteurs pénalisants. Ce travail porte sur la modélisation et l’implantation d’un environnement orienté services qui permettent l’exécution d’applications scientifiques sur des infrastructures de calcul distribué, exploitant leur capacité de calcul haut débit. Le modèle comprend une spécification de description d’interfaces en ligne de commande ; un pont entre les architectures orientées services et le calcul globalisé ; ainsi que l’utilisation efficace de ressources locales et distantes pour le passage à l’échelle. Une implantation de référence est réalisée pour démontrer la faisabilité de cette approche. Sa pertinence est illustrée dans le contexte de deux projets de recherché dirigés par des campagnes expérimentales de grande ampleur réalisés sur des ressources distribuées. L’environnement développé se substitue aux systèmes existants dont les préoccupations se concentrent souvent sur la seule exécution. Il perme la gestion de codes patrimoniaux en tant que services, prenant en compte leur cycle de vie entier. De plus, l’approche orientée services aide à la conception de flux de calcul scientifique qui sont utilisés en tant que moyen flexible pour décrire des applications composées de services multiples. L’approche proposée est évaluée à la fois qualitativement et quantitativement en utilisant des applications réelles en analyse de neuroimages. Les expériences qualitatives sont basées sur l’optimisation de la spécificité et la sensibilité des outils de segmentation duc cerveau utilisés pour traiter des Images par Résonnance Magnétique de patients atteints de sclérose en plaques. Les expériences quantitatives traitent de l’accélération et de la latence mesurées pendant l’exécution d’études longitudinales portant sur la mesure d’atrophie cérébrale chez des patients affectés de la maladie d’Alzheimer.

  • Titre traduit

    Services lifecycle management using distributed computing infrastructures in neuroinformatics


  • Résumé

    There is an increasing interest among scientific communities for sharing data and applications in order to support research and foster collaborations. Interdisciplinary domains like neurosciences are particularly eager of solutions providing computing power to achieve large scale experimentation. Despite all progresses made in this regard, several challenges related to interoperability, and scalability of Distributed Computing Infrastructures are not completely resolved though. They face permanent evolution of technologies, complexity associated to the adoption of production environments, and low reliability of these infrastructures at runtime. This work proposes the modeling and implementation of a service-oriented framework for the execution of scientific applications on Distributed Computing Infrastructures taking advantage of High Throughput Computing facilities. The model includes a specification for description of command-line applications, a bridge to merge-service-oriented architectures with Global computing, and the efficient use of local resources and scaling. A reference implementation is proposed to demonstrate the feasibility of the approach. It shows its relevance in the context of two application-driven research projects executing large experiment campaign on distributed resources. The framework is an alternative to existing solutions that are often limited to execution consideration only, as it enables the management of legacy codes as services and takes into account their complete lifecycle. Furthermore, the service-oriented approach helps designing scientific workflows which are used as a flexible and way of describing application composed with multiple services. This approach proposed is evaluated both qualitatively and quantitatively using concrete applications in the area of neuroimaging analysis the qualitative experiments are based on the optimization of specificity and sensibility of the brain segmentation tools used in the analysis of Magnetic Resonance Images of patient affected by Multiple Sclerosis. On the other hand, quantitative experiments deal with speedup and latency measured during the execution of longitudinal brain atrophy detection in patients impaired by Alzheimer’s disease.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (xvii-122 p.)
  • Annexes : Bibliogr. p. [115]-122. Résumés en français et en anglais

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Bibliothèque Sciences.
  • Non disponible pour le PEB
  • Cote : 12NICE4053
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.