Thèse soutenue

Développement et évaluation de méthodes pour la modélisation de boucles protéiques : application aux boucles CDR d'anticorps

FR  |  
EN
Auteur / Autrice : Amelie Barozet
Direction : Juan CortésMarc Bianciotto
Type : Thèse de doctorat
Discipline(s) : Informatique et Telecommunications
Date : Soutenance le 18/10/2019
Etablissement(s) : Toulouse, INSA
Ecole(s) doctorale(s) : École Doctorale Mathématiques, Informatique et Télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : LAAS - Laboratoire d'Analyse et d'Architecture des Systèmes - Laboratoire d'analyse et d'architecture des systèmes / LAAS
Jury : Président / Présidente : Lionel Mourey
Examinateurs / Examinatrices : Juan Cortés, Marc Bianciotto, Charlotte Deane, Pablo Chacon, Chantal Prevost
Rapporteurs / Rapporteuses : Charlotte Deane, Pablo Chacon

Résumé

FR  |  
EN

Cette thèse porte sur la modélisation d'anticorps et de leurs boucles hypervariables. Ces boucles protéiques assurent la reconnaissance spécifique de l'antigène et la formation du complexe anticorps-antigène. La spécificité et l'affinité de cette interaction sont permises par une grande variabilité de séquence et par la plasticité de ces fragments protéiques. En effet, contrairement à d'autres éléments de structures plus stables comme les hélices alpha et les feuillets beta, les boucles protéiques possèdent une flexibilité s'avérant cruciale pour certaines fonctions biologiques. La première contribution de la thèse analyse les changements structurels d'anticorps survenant suite à la liaison avec l'antigène. Cette étude s'appuie sur l'analyse de données structurales expérimentales et établit que les changements conformationnels de l'anticorps (principalement dans les boucles) peuvent être substantiels et sont insuffisamment pris en compte. La prédiction de l'amarrage anticorps-antigène est particulièrement mise en difficulté par la flexibilité des boucles hypervariables. Fort de ce constat, le travail de thèse s'est ensuite concentré sur la modélisation plus générale de boucles protéiques. Ces régions flexibles représentent un défi pour la biologie structurale puisque la grande majorité des données expérimentales liées aux structures protéiques proviennent de cristallographie aux rayons X. Cette technique ne peut fournir qu'une structure unique, inadaptée à la réalité des boucles protéiques qui peuvent adopter un ensemble de conformations différentes, avec diverses probabilités associées. Divers travaux soulignent l'insuffisance des méthodes actuelles de modélisation de boucles protéiques, qui s'effectuent généralement en deux étapes. La première, appelée échantillonnage, doit générer les conformations possibles de la boucle de manière exhaustive, afin de représenter ce fragment protéique de manière globale. L'étape suivante, l'évaluation, consiste à associer un score à chacune de ces conformations, censé représenter leur énergie. L'échantillonnage et l'évaluation restent des problèmes ouverts, les méthodes développées jusqu'à présent dans ce domaine se concentrant en majorité sur la prédiction d'une unique conformation stable, insuffisamment représentative. C'est dans ce contexte que se positionnent les deux contributions suivantes de la thèse. La première propose une méthode d'échantillonnage exhaustif, intégrant une composante d'apprentissage par renforcement pour accélérer la génération de modèles de boucles. Cette méthode inspirée de la robotique utilise une modélisation géométrique interdisant les collisions entre atomes et utilise des fragments protéiques issus d'une base de données. La seconde contribution analyse en profondeur les performances de diverses méthodes d'évaluation sur plusieurs boucles flexibles pour lesquelles des données expérimentales sont disponibles. La combinaison de l'échantillonnage et de l'évaluation permet de reconstituer une visualisation des paysages énergétiques modélisés par ces méthodes et d'identifier plus précisément les insuffisances de l'échantillonnage et les limites de l'évaluation. Enfin, ces méthodes ont été appliquées à un anticorps dont une boucle hypervariable subit un changement conformationnel lors de sa liaison avec l'antigène. Les résultats montrent qu'il est possible de reconstituer un paysage énergétique cohérent pour cette boucle, qui identifie les conformations connues. Cela souligne une application intéressante de ces méthodes pour le design d'anticorps, en prédisant la stabilité d'une conformation de boucle donnée et en éliminant les séquences insuffisamment stables ou adoptant des conformations indésirables. Bien qu'appliquées aux anticorps, les contributions du travail de thèse se généralisent parfaitement à l'analyse de boucles protéiques appartenant à d'autres systèmes, les méthodes développées n'étant pas spécifiques au cas des anticorps.