Développements algorithmiques pour l'analyse et la prédiction de la structure des protéines

par Guillaume Pages

Projet de thèse en Informatique

Sous la direction de Valentin Gordeliy et de Sergei Grudinin.

Thèses en préparation à Grenoble Alpes , dans le cadre de Mathématiques, Sciences et technologies de l'information, Informatique , en partenariat avec Laboratoire Jean Kuntzmann (laboratoire) et de EDP (equipe de recherche) depuis le 01-04-2016 .


  • Résumé

    Le but global de ce doctorat est d'identifier et de développer de nouveaux canaux et transporteurs photo-sensibles. Deux approches complémentaires vont être utilisées : (1) l'identification de nouvelles protéines ou de protéines mutantes en analysant l'évolution des rhodopsines chez différentes espèces et phyla; et (2) la modélisation et la simulation au niveau moléculaire des processus de perméation et de transport dans des canaux activés par la lumière et des transporteurs dont les structures cristallines sont connues, pour acquérir une meilleure compréhension des mécanismes mis en jeu dans le transport d'ions et pour prédire les mutations. Les organismes provenant d'environnements variés, en particulier ceux adaptés à des conditions extrêmes (e.g. températures extrêmes, faible lumière, forte salinité, pH très acide ou très basique) devraient exprimer des variantes de rhodopsine avec de nouvelles propriétés. Ainsi, la première tâche consistera à inspecter les éco-systèmes extrêmes à la recherche de gènes de rhodopsines. Plusieurs méthodes d'apprentissage seront explorées, comme les machines à vecteurs de support (SVM) ou les modèles de Markov cachés (HMMs), pour explorer les génomes, en utilisant les séquences de rhodopsines connues comme données d'entrainement. Les séquences de rhodopsines ainsi découvertes seront évaluées en fonction : i) des propriétés de la séquence, ii) des relations phylogénétiques, iii) de la présence de résidus inattendus ou prometteurs dans la poche rétinienne ou au niveau d'autres parties critiques de la protéine, et iv) des prédictions réalisées sur ses propriétés fonctionnelles. A ce stade, les séquences les plus prometteuses seront présélectionnées pour réaliser des études fonctionnelles et structurelles, puis apporter des optimisations en utilisant des outils computationnels pour des mutations ponctuelles ou multiples. Nous nous appuierons en particulier sur les structures de rhodopsines récemment résolues. Enfin, nous réaliserons des simulations des structures sélectionnées pour comprendre les mécanismes physiques de perméation et de transport.

  • Titre traduit

    Novel computational developments for protein structure analysis and prediction


  • Résumé

    The overall goal of the PhD project is to identify and develop novel light-sensitive channels and transporters. We will be using two complementary approaches: (1) identification of novel proteins or specific mutant proteins by analysing the evolution of rhodopsins from different species and phyla; and (2) molecular modeling and simulations of permeation and transport processes in light-gated channels and transporters of known crystal structure in order to gain deeper mechanistic insight into the mechanisms underlying ion transport and to predict mutations on a systematic and informed basis Organisms from a wide range of environments, especially those that are adapted to extreme conditions (e.g. extreme high or cold temperatures, low light, high salinity, extremely high or low pH) are expected to express rhodopsins with novel properties. Thus, the first sub-task consists in screening extreme ecosystems for the presence of rhodopsin genes. We will use machine-learning approaches, such as support vector machines (SVM), and probabilistic models, such as hidden Markov model (HMMs), to screen the genomes. We will use the known sequences of rhodopsins as the training set for these knowledge-based methods. These rhodopsin sequences will be further assessed by: i) sequence properties, ii) phylogenetic relationships, iii) presence of unexpected or promising residues at the retinal pocket and other critical segments of the protein, and iv) prediction of functional properties. At this stage we will preselect the most promising sequences for the functional and structural studies and then further optimize the sequences using computational tools for point and multiple mutations. In particular, we will rely on the structures of rhodopsins that we have recently solved. Finally, we will conduct molecular simulations of the selected structures to understand physical mechanisms of permeation and transport processes.