Exploring the use of Deep Mutational Scanning and of Evolution for the Structural Prediction of Protein Complexes

par Aravindan Nadaradjane

Thèse de doctorat en Biochimie et biologie structurale

Sous la direction de Raphaël Guerois.

Le président du jury était Sylvie Nessler.

Le jury était composé de Pierre Tuffery, Juliette Martin, Anne Lopes, Dirk Stratmann.

Les rapporteurs étaient Pierre Tuffery, Juliette Martin.

  • Titre traduit

    exploration de l’utilisation d’une technologie de mutagenèse à haut débit et de l’évolution pour la prédiction structurale des complexes protéiques


  • Résumé

    L’objectif de cette thèse a été de développer des stratégies computationnelles permettant d’exploiter les informations issues des technologies de mutagenèse à haut débit (deep mutational scanning, DMS) pour prédire le mode d’assemblage des protéines. Pour cela, j’ai cherché à améliorer l’accord entre les modèles simulés par les techniques d’amarrage moléculaire et les contraintes expérimentales. Deux complexes de référence dont les structures ont été résolues expérimentalement et pour lesquels les données de DMS ont été publiées ont été utilisés pour la mise au point de ces méthodes, les complexes parD3-parE3 et dockerin-cohesin. Pour chacun des nombreux mutants générés par DMS, une mesure expérimentale de score de liaison quantifiant l’affinité des partenaires en complexe a pu être extraite. Pour la modélisation, différents protocoles basés sur le logiciel Rosetta ont été explorés pour prédire l’effet des mutations sur la stabilité des interfaces. Un compromis entre efficacité et précision a été identifié, permettant d’estimer de façon satisfaisante l’effet des mutations sur les structures natives des complexes. L’accord entre prédiction et données expérimentales a été quantifié en utilisant deux métriques, la corrélation entre les scores d’affinité prédits et mesurés et l’aire sous la courbe ROC (Receiver Operating Characteristic) définissant l’efficacité du prédicteur à classer correctement les mutations ayant le plus fort impact. Appliquées sur un ensemble de 1000 modèles de complexes issus des simulations d’amarrage, ces deux métriques ont été évaluées dans leur capacité à discriminer les modèles corrects des modèles faux. Pour les deux systèmes étudiés, la deuxième métrique apparaît comme la mieux adaptée. La méthodologie a ensuite été appliquée à un cas de complexe antigène-anticorps dans le cadre d’une collaboration avec l’équipe de B. Maillère. Mon travail de thèse a également été consacré au traitement des données de DMS générées avec nos collaborateurs O. Pereira-Ramos et L. Martin dans un cas de design de peptides à haute affinité pour la protéine Asf1 et pour le criblage des surfaces d’interaction de cette protéine avec ses partenaires. Enfin, j’ai participé tout au long de mon doctorat aux différentes cibles proposées par les organisateurs du 7ème concours CAPRI, concours international pour l’évaluation des méthodes de prédiction des structures de complexes protéiques. Le manuscrit détaille l’ensemble des stratégies mises en oeuvre qui ont permis à notre équipe de se classer en tête de ce concours en générant le plus grand nombre de modèles corrects et précis.


  • Résumé

    The thesis project aimed at developing computational strategies to exploit the information generated by deep mutational scanning (DMS) technologies to predict the structures of protein assemblies. In that scope, I explored how to improve the agreement between the models simulated by molecular docking and experimental constraints. From the literature, two reference complexes whose structures have been solved experimentally and for which DMS data were published could be used for the methodological development: the parD3-parE3 and dockerin-cohesin complexes. For each of the many mutants generated by DMS, an experimental score quantifying the affinity of the complex could be extracted from the available data. For the simulations, a number of protocols based on the Rosetta software were tested and optimized to predict the effect of mutations on interface stability. A compromise was found between efficiency and precision, allowing for a fair estimation of the effect of mutations on native complex structures. The agreement between the predicted and the experimental data was quantified using two different metrics, either the correlation between the predicted and experimental binding scores or the area under the ROC (Receiver Operating Characteristic) curve, defining how efficiently the predictor could sort out the most impacting mutations. Applied to a set of 1000 decoys of complexes generated by docking, both metrics were assessed for their ability to discriminate correct from wrong models. For both reference systems, the second metrics based on ROC curves was found most useful. This methodology was further applied to an antibody-antigen complex which was studied by DMS in the group of B. Maillère. My PhD work was also dedicated to the processing of the raw data from DMS experiments which were generated by our collaborators, O. Pereira-Ramos and L. Martin, in order to design a high affinity peptide for the protein Asf1 and to screen interaction surfaces between Asf1 and its binding partners. Last, throughout my PhD I had the opportunity to participate in all targets submitted to the docking community by the organizers of CAPRI, an international challenge for the assessment of methods for the structural prediction of protein interactions. The manuscript details all the strategies which were set up to tackle these challenges for which our team eventually ranked first by generating the highest number of both correct and precise models.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris-Saclay. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.