PREDICTION STRUCTURALE DES COMPLEXES BASEE SUR LA COEVOLUTION ARTIFICIELLE ET NATURELLE DES PROTEINES

par Aravindan Nadaradjane

Projet de thèse en Biochimie et biologie structurale

Sous la direction de Raphaël Guerois et de Jessica Andreani.

Thèses en préparation à Paris Saclay , dans le cadre de Innovation thérapeutique : du fondamental à l'appliqué , en partenariat avec Institut de Biologie Intégrative de la Cellule (I2BC) (laboratoire) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2016 .


  • Résumé

    Il existe actuellement un énorme enjeu à identifier et caractériser rapidement les modes de reconnaissances entre protéines. Ces interactions physiques assurent les régulations croisées entre de multiples machineries et voies de signalisation cellulaire. Le développement de méthodes bioinformatiques permettant de modéliser avec précision la structure de ces assemblages constitue une étape importante pour révéler les compétitions et synergies qui façonnent la logique moléculaire associée à ces interactions. Notre projet s'inscrit directement dans cette perspective avec une problématique en radiobiologie structurale visant à comprendre le fonctionnement des machineries impliquées dans la réparation de l'ADN et le contrôle de l'information épigénétique [1,2]. Les méthodes de modélisation des structures de complexes, appelées docking moléculaire, comportent deux étapes. Une première dite d'écrémage « gros-grain », permet de réduire le nombre de possibilités de 100000 à quelques dizaines de solutions. Elle est suivie d'une seconde étape d'affinement qui permet de converger vers un seul modèle. Au cours des dernières années, notre équipe a contribué à améliorer les méthodes docking en intégrant la dimension évolutive lors de la première étape « gros-grain » [3,4]. En 2014, la qualité de nos modèles a été soulignée lors du concours international de prédiction CASP/CAPRI où nous sommes arrivés en tête du classement des équipes de prédicteurs [5]. Pour dépasser les limites des méthodes actuelles, il est désormais important d'améliorer la seconde étape du docking, d'affinement des modèles. Cet objectif constituera le premier axe de recherche de la thèse. En parallèle, le doctorant explorera de nouvelles approches de modélisation des interactions protéine-protéine intégrant les contraintes de coévolution issues des séquences naturelles mais aussi extraites d'expériences de coévolution artificielle aux interfaces de complexes. L'objectif consistera à développer des outils hybrides, alliant bioinformatique et criblage expérimental des interfaces pour élucider les modes d'interactions protéine-protéine.

  • Titre traduit

    COUPLING NATURAL AND A​​RTIFICIAL COEVOLUTION FOR THE STRUCTURAL PREDICTION OF COMPLEXES


  • Résumé

    Protein complexes are the working horses of most cellular processes. Our project aims at uncovering how interaction surfaces control the cross-talks between cell machineries with a specific interest for the field of radiobiology and epigenetics [1,2]. Over the past five years, our team developed prediction programs for the structural modelling of protein complexes with the specificity of exploiting evolutionary information [3,4] (InterEvDock server). These methologies were very well ​ranked at the international prediction challenge CAPRI (ranked first for the number of correctly predicted interfaces)[5]. ​IrtelisPicture.png ​The aim of the current PhD project will be to integrate novel type of constraints arising from the 'Deep Mutational Scanning' technologies benefiting from the rise of next generation sequencing technologies [6]. These approaches consist in combining the high-throughput generation of protein mutants (>10 of billions) and the screening of these mutants to assess their folding and binding properties. In addition to the information recovered in natural sequence alignments, these methodologies will provide key constraints to increase the precision in intergrative structural modeling. There are a number of computational challenges that remain to be solved in the statistical treatment of the generated data, the accurate and efficient modeling of the mutations effects and in the integration of important détails such as the organisation of the solvent at complex interfaces. The PhD work will involve working on original datasets built or derived in our lab; which should considerably help increasing the precision of current methods.