Simulations moléculaires de Monte Carlo : amélioration de l'éfficacité statistique de l'échantillonnage grâce aux algorithmes d'évolution artificielle

par Benoît Leblanc

Thèse de doctorat en Informatique

Sous la direction de Évelyne Lutton.

Soutenue en 2002

à Paris 11, Orsay .


  • Résumé

    Le domaine de la simulation moléculaire a pour but de simuler un ensemble de particules en interaction représentant un système physico-chimique. Les algorithmes de Monte Carlo par chaîne de Markov appliqués dans ce cas peuvent rencontrer des problèmes d'efficacité statistique analogues à celles rencontrés par la dynamique moléculaire lors de la simulation de molécules complexe, comme par exemple des polymères. Le but étant d'échantillonner l'ensemble des configurations possibles, en accord avec la distribution de Boltzmann-Gibbs, l'efficacité statistique de tels algorithmes réside dans la capacité à fournir plus rapidement des états décorrélés couvrant l'espace des configurations, constituant ainsi un échantillonnage statistiquement valide. Nous sommes intéressés aux possibilités offertes par l'évolution artificielle (EA, classe d'algorithmes d'optimisation stochastique inspirés du principe biologique de l'évolution darwinienne) pour contribuer à améliorer cette efficacité. Ayant exploré l'utilisation de différentes mesures comme critère d'optimisation, nous avons identifié les fréquences relatives des différents mouvements de Monte Carlo, applicables conjointement lors d'une même simulation, comme degrés de liberté pouvant être optimisés. Nous avons combiné des simulations parallèles avec un ''Serveur'' génétique afin d'effectuer un échantillonnage tout en optimisant simultanément les fréquences des mouvements de Monte Carlo. Nos simulations ont montré qu'il était possible d'obtenir des amélioration par rapport à des réglages de références, pour les critères considérés. Adaptant cet outil au cadre du Monte Carlo avec thermalisation parallèle (parallèle tempering) nous avons pu améliorer certains de ses paramètres et indiqué des pistes pour améliorer encore le choix des températures additionnelles.


  • Résumé

    Molecular simulation aims at simulating particles in interaction, describing a physico-chemical system. When considering Markov Chain Monte Carlo sampling in this context, we often meet the same problem of statistical efficiency as with Molecular Dynamics for the simulation of complex molecules (polymers for example). The search for a correct sampling of the space of possible configurations with respect to the Boltzmann-Gibbs distribution is directly related to the statistical efficiency of such algorithms (i. E. The ability of rapidly providing uncorrelated states covering all the configuration space). We investigated how to improve this efficiency with the help of Artificial Evolution (AE). AE algorithms form a class of stochastic optimization algorithms inspired by Darwinian evolution. Efficiency measures that can be turned into efficiency criteria have been first searched before identifying parameters that could be optimized. Relative frequencies for each type of Monte Carlo moves, usually empirically chosen in reasonable ranges, were first considered. We combined parallel simulations with a "genetic server" in order to dynamically improve the quality of the sampling during the simulations progress. Our results shows that in comparison with some reference settings, it is possible to improves the quality of samples with respect to the chosen criterion. The same algorithm has been applied to improve the Parallel Tempering technique, in order to optimize in the same time the relative frequencies of Monte Carlo moves and the relative frequencies of swapping between sub-systems simulated at different temperatures. Finally, hints for further research in order to optimize the choice of additional temperatures are given.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 160 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.151-155.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : M/Wg ORSA(2002)35
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.