Exploration et modélisation structurale d'interactions protéiques guidées par l'information évolutive

par Chloé Quignot

Thèse de doctorat en Biochimie et biologie structurale

Sous la direction de Raphaël Guerois.

Thèses en préparation à université Paris-Saclay , dans le cadre de École doctorale Innovation thérapeutique : du fondamental à l'appliqué , en partenariat avec Institut de Biologie Intégrative de la Cellule (laboratoire) , Faculté de pharmacie (référent) et de Université Paris-Saclay. Graduate School Santé et médicament (2020-....) (graduate school) .


  • Résumé

    Les protéines sont des acteurs centraux du vivant et agissent rarement seules. La structure 3D de leurs interactions aide à mieux comprendre les mécanismes des processus biologiques dans lesquels elles sont impliquées. L'objectif de cette thèse était d'améliorer la performance des méthodes de prédiction structurale, notamment en utilisant l'information de (co-)évolution. J'ai participé à des évolutions majeures de notre serveur de docking, InterEvDock2, qui, à partir de deux protéines, propose 10 modèles d'interface en croisant des scores aux propriétés différentes. Le serveur accepte désormais aussi en entrée des structures oligomériques ou des séquences protéiques, pour lesquelles il modélise la structure monomérique, ainsi que des contraintes connues a priori sur l'interaction. Sur un large ensemble de 812 cas test, InterEvDock2 prédit une structure de complexe correcte dans 32 % des cas. J'ai ensuite recherché un moyen plus explicite d'intégrer dans les fonctions de score l'information évolutive contenue dans les alignements de séquences. J'ai rendu cette information compatible avec l'utilisation de scores atomiques par la modélisation 3D des interfaces homologues. Ceci améliore la performance prédictive de 32 à 40% sur notre large base de test. De plus, durant ma thèse, j'ai pu participer à 10 tests de docking à l'aveugle via CAPRI (Critical Assessment of Predicted Interactions). Les stratégies qui ont permis à notre équipe d'être classée première sur la période 2016-2019 sont décrites dans le dernier chapitre de ce manuscrit. Ce travail vise à aider les biologistes à étudier les protéines ou voies biologiques d'intérêt en utilisant des méthodes de prédiction performantes et constitue un pas en avant dans l'objectif final de la prédiction des interactomes.

  • Titre traduit

    Exploration and structural modelling of protein interactions using evolutionary information 


  • Résumé

    Protein complexes are of fundamental importance in most biological processes and mainly carry out their function in networks. The structure of their interface can give us crucial information to understand the mechanisms behind these processes. This thesis focuses on the improvement of the performance of structural prediction methods, in particular by exploiting co-evolutionary information. As part of my PhD project, I participated in major developments in our docking server, InterEvDock2, which suggests 10 interface models for a pair of input proteins using a mix of different scoring properties. InterEvDock2 now also accepts oligomeric structure inputs or sequence inputs, for which it can model monomeric structures, as well as user constraints taken from prior knowledge of the interaction. I validated the performance of InterEvDock2 on a large benchmark of 812 docking cases and found that InterEvDock2 was capable of finding a correct complex structure in as much as 32 % of these cases. My work then focused on finding a more efficient and explicit way of integrating implicitly defined evolutionary information into scoring. I made this information directly compatible with atomic-scale scoring thanks to homologous interface modelling. This strongly increases predictive power, from 32% to 40% on our large benchmark. Moreover, throughout my PhD, I was able to participate in 10 blind-test docking challenges through CAPRI (Critical Assessment of Predicted Interactions). The strategies applied by our team, which enabled us to rank first in the latest CAPRI round for 2016-2019, are described in the last chapter of this manuscript. This work aims at helping biologists study their proteins or biological pathways of interest using well performing prediction methods. It constitutes a step towards the final goal of interactome prediction.