Bioinformatique appliquée à la prédiction de structure de peptides

par Yimin Shen

Thèse de doctorat en Analyse de Génomes et Modélisation moléculaire

Sous la direction de Pierre Tuffery.

Soutenue en 2012

à Paris 7 .


  • Résumé

    Les peptides sont devenus, au cours des années récentes, une alternative de plus en plus crédible aux petits composés chimiques. Une première partie de cette thèse porte sur l'optimisation de PEP-FOLD, une approche rapide et précise de prédiction de novo de la structure des peptides. Nous montrons qu'il est possible de biaiser la recherche conformationnelle à moins de 20% de l'espace total tout en conservant la conformation native. Ce biais résulte d'une analyse a posteriori des trajectoires d'alphabet structural utilisées pour la génération 3D par PEP-FOLD. Sur la base de ce biais, nous montrons que PEP-FOLD2 peut être validé pour des tailles jusqu'à 50 acides aminés avec une précision de 2. 6 À, soit légèrement mieux qu'une approche de référence comme Rosetta, ce qui constitue une amélioration majeure par comparaison à PEP-FOLD1 qui pouvait générer des modèles tridimensionnels de peptides jusqu'à 30 acides aminés avec une précision de l'ordre de 2-3 À. Une deuxième partie a porté sur la recherche de fragments. J'ai développé une approche de comparaison de profils d'alphabet structural pour l'identification de fragments similaires à faible taux d'identité de séquence. Les résultats obtenus montrent d'une part qu'il est possible, à partir d'une collection de structures à faible taux d'identité de séquences (25%), d'identifier des fragments de taille comprise entre 6 et 27 acides aminés pour 90% des structures. La comparaison avec une autre méthode profil-profil récente, HHfrag, montre que l'information de la structure locale prédite sous la forme d'alphabet structural permet un gain en précision important de 27%, tout en ayant un taux de couverture légèrement supérieur.

  • Titre traduit

    Bioinformatics applied to peptide structure prediction


  • Résumé

    In these years, peptides have become an alternative more and more credible than small chemical compounds. A key step of peptide functional characterization is the characterization of their 3D structure. A first part of this thesis is related to PEP-FOLD optimization. PEP-FOLD is a fast and accurate approach for the de novo peptide structure prediction, based on the concept of structural alphabet. We show it is possible to bais the conformational search to as few as 20% of the full conformational space still having the native conformation. This biais results from an a posteriori analysis of the structural alphabet trajectories used for PEP-FOLD 3D generation. Based on such bias, we show PEP-FOLD2 can efficiently generate models for peptides up to 50 amino acids, at a precision of 2. 6 A, which is slightly better than a reference approach such as Rosetta. It is also a major improvement compared to PEP-FOLD1 that could generate 3D models for peptides up to 30 amino acids only, at a precision of 2-3 A. The second part focused on candidate fragment identification from sequence. I have developed an approach for structural alphabet profile comparison, to identify fragments of know structure at low sequence identity. Results show that, mining a non redundant collection of structures at low sequence identity (25%), the procedure is able to identify fragments of size between 6 and 27 amino acids covering 90% of the structures. Besides, a comparison with a recent amino acid profile-profile approach - Hhfrag - shows that the local structure information predicted using our structural alphabet allows a significant gain in accuracy - 27%, with a slightly better coverage.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (138 f.)
  • Annexes : 155 réf.

Où se trouve cette thèse\u00a0?