Thèse soutenue

Comparaison des structures protéiques au moyen d'un alphabet structural
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Agnel Praveen Joseph
Direction : Alexandre de Brevern
Type : Thèse de doctorat
Discipline(s) : Analyse de génomes et modélisation moléculaire
Date : Soutenance en 2011
Etablissement(s) : Paris 7

Mots clés

FR

Résumé

FR

Une grande partie de mon travail de thèse porte sur le développement de méthodes efficaces pour l'alignement par paires et multiples protéines structurelles. Ceci est basé sur l'utilisation de la protéine Blocks qui est le plus largement utilisé alphabet structural [1, 2]. Une structure de la protéine complète peut être représenté par une séquence d'alphabets, où chaque alphabet correspond à un PB. L'alignement des séquences PB donne une comparaison de la structure des protéines. Basé sur des stratégies classiques d'alignement de séquences, un outil efficace pour l'alignement de séquences PB a été développé. Matrices de substitution PB raffinés et une ancre approche de programmation dynamique ont été utilisées pour améliorer l'efficacité de cette approche. Un gain significatif de la qualité de l'alignement, d'environ 82% a été obtenue et l'efficacité des mines a été amélioré de 6,8% [3, 4]. La méthode a été encore renforcée par l'ajout de poids de substitution qui correspondent à des régions structurellement similaires identifiés comme des ancres dans alignements. Comme pour iPBA, l'alignement des séquences de BPs est guidé par les équivalences entre couplée à un raffinement itératif par le logiciel Profit. La structure la plus semblable à d'autres structures au sein du groupe a été choisie comme référence lors de l'affinage 3D et de raffinements. Lorsque comparé à MULTIPROT, MUSTANG et HOMSTRAD, notre méthode d'alignement multiple basée sur les BPs (mulPBA) était meilleure dans plus de 85% des cas. La stratégie d'alignement iPBA a également été utilisée pour évaluer la performance d'une méthode de reconnaissance de la structure basée sur la séquence prédite des BPs. Les données sur les structures secondaires prédites et l'accessibilité au solvant prédite ont été utilisés pour améliorer l'exactitude de reconnaissance de la structure. L'influence des données sur les espèces sur la relation séquence-structure a également été analysées en utilisant les BPs [5]. Les relations observées dans les séquences caméléons [6] qui adoptent des conformations différentes dans les structures de protéines, ont également été étudiés en détail. Un protocole efficace et utile a également été développé pour l'attribution des hélices PolyProline II qui peuvent être facilement incorporés dans DSSP, outil largement utilisé pour l'affectation structure secondaire [7].