Caractérisation de structures explorées dans les simulations de dynamique moléculaire.

par Sana Bougueroua

Thèse de doctorat en Informatique

Sous la direction de Dominique Barth et de Marie-Pierre Gaigeot.

Soutenue le 13-12-2017

à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec Données et algorithmes pour une ville intelligente et durable (DAVID) (laboratoire) , Université de Versailles-Saint-Quentin-en-Yvelines (établissement de préparation de la thèse) et de Données et algorithmes pour une ville intelligente et durable - DAVID (laboratoire) .

Le président du jury était Jean-Michel Fourneau.

Le jury était composé de Delphine Flatters, Franck Quessette.

Les rapporteurs étaient Anne-Claude Camproux, Olivier Poch.


  • Résumé

    L’objectif de cette thèse est d’analyser et prédire les conformations d’un système moléculaire en combinant la théorie des graphes et la chimie computationnelle.Dans le cadre des simulations de dynamique moléculaire, une molécule peut avoir une ou plusieurs conformations au cours du temps. Dans les trajectoires de simulation de dynamique moléculaire, on peut avoir des trajectoires n’explorant qu’une seule conformation ou des trajectoires explorant plusieurs conformations, donc plusieurs transitions entre conformations sont observées. L’exploration de ces conformations dépend du temps de la simulation et de l'énergie (température) fixée dans le système. Pour avoir une bonne exploration des conformations d’un système moléculaire, il faut générer et analyser plusieurs trajectoires à différentes énergies. Notre objectif est de proposer un algorithme universel qui permet d’analyser la dynamique conformationnelle de ces trajectoires d’une façon rapide et automatique. Les trajectoires fournissent les positions cartésiennes des atomes du système moléculaire à des intervalles de temps réguliers. Chaque intervalle contenant un ensemble de positions est appelé image. L’algorithme utilise des règles de géométrie (distances, angles, etc.) sur les positions pour trouver les liaisons (liaisons covalentes, liaisons hydrogène et interactions électrostatiques) créées entre les atomes, permettant par la suite d’obtenir le graphe mixte qui modélise une conformation. Nous ne considérons un changement conformationnel que s’il y a un changement dans les liaisons calculées à partir des positions données. L’algorithme permet de donner l’ensemble des conformations explorées sur une ou plusieurs trajectoires, la durée d’exploration de chaque conformation, ainsi que le graphe de transitions qui contient tous les changements conformationnels observés.Les conformations se caractérisent par une énergie appelée énergie potentielle. Cette énergie est représentée par une courbe appelée surface d’énergie potentielle. En chimie théorique et computationnelle, certains s’intéressent à trouver des points particuliers sur cette surface. Il s'agit des minima qui représentent les conformations les plus stables et des maxima ou états de transition qui représentent les points de passage d'une conformation à une autre. En effet, d'une part, la conformation la plus stable est celle de plus basse énergie. D'autres part, pour aller d’une conformation à une autre il faut une énergie supplémentaire, le point maximum représente l'état de transition. Les méthodes développées pour calculer ces points nécessitent une connaissance de l’énergie potentielle ce qui est coûteux en temps et en calculs. Notre objectif est de proposer une méthode alternative en utilisant des mesures ah doc basées sur des propriétés des graphes qu’on a utilisées dans le premier algorithme et sans faire appel à la géométrie ni aux calculs moléculaires. Ces mesures permettent de générer des conformations avec un classement énergétique ainsi de définir le coût énergétique de chaque transition permise. Les conformations possibles avec les transitions représentent respectivement les sommets et les arcs de ce qu’on appelle le “graphe des possibles”. Les hypothèses utilisées dans le modèle proposé est que seules les liaisons hydrogène peuvent changer entre les conformations et que le nombre de liaisons hydrogène présentes dans le système permet de déterminer son coût énergétique.L’algorithme d'analyser des trajectoires a été testé sur trois types de systèmes moléculaires en phase gazeuse de taille et de complexité croissantes. Bien que la complexité théorique de l’algorithme est exponentielle (tests d’isomorphisme) les résultats ont montré que l’algorithme est rapide (quelques secondes). De plus, cet algorithme peut être facilement adapté et appliqué à d’autres systèmes. Pour la prédiction conformationnelle, le modèle proposé a été testé sur des peptides isolés.

  • Titre traduit

    Characterization of structures explored in molecular dynamics simulations.


  • Résumé

    This PhD is part of transdisciplinary works, combining graph theory and computational chemistry.In molecular dynamics simulations, a molecular system can adopt different conformations over time. Along a trajectory, one conformation or more can thus be explored. This depends on the simulation time and energy within the system. To get a good exploration of the molecular conformations, one must generate and analyse several trajectories (this can amount to thousands of trajectories). Our objective is to propose an automatic method that provides rapid and efficient analysis of the conformational dynamics explored over these trajectories. The trajectories of interest here are in cartesian coordinates of the atoms that constitute the molecular system, recorded at regular time intervals (time-steps). Each interval containing a set of positions is called a snapshot. At each snapshot, our developed algorithm uses geometric rules (distances, angles, etc.) to compute bonds (covalent bonds, hydrogen bonds and any other kind of intermolecular criterium) formed between atoms in order to get the mixed graph modelling one given conformation. Within our current definitions, a conformational change is characterized by either a change in the hydrogen bonds or in the covalent bonds. One choice or the other depends on the underlying physics and chemistry of interest. The proposed algorithm provides all conformations explored along one or several trajectories, the period of time for the existence of each one of these conformations, and also provides the graph of transitions that shows all conformational changes that have been observed during the trajectories. A user-friendly interface has been developed, that can de distributed freely.Our proposed algorithm for analysing the trajectories of molecular dynamics simulations has been tested on three kinds of gas phase molecular systems (peptides, ionic clusters). This model can be easily adapted and applied to any other molecular systems as well as to condensed matter systems, with little effort. Although the theoretical complexity of the algorithm is exponential (isomorphism tests), results have shown that the algorithm is rapid.We have also worked on computationally low cost graph methods that can be applied in order to pre-characterize specific conformations/points on a potential energy surface (it describes the energy of a system in terms of positions of the atoms). These points are the minima on the surface, representing the most stable conformations of a molecular system, and the maxima on that surface, representing transition states between two conformers. Our developed methods and algorithms aim at getting these specific points, without the prerequisite knowledge/calculation of the potential energy surface by quantum chemistry methods (or even by classical representations). By avoiding an explicit calculation of the potential energy surface by quantum chemistry methods, one saves computational time and effort. We have proposed an alternative method using ad doc measures based on properties of the graphs (already used in the first part of the PhD), without any knowledge of energy and/or molecular calculations. These measures allow getting the possible conformations with a realistic energy classification, as well as transition states, at very low computational cost. The algorithm has been tested on gas phase peptides.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.