Analyse et prédiction de la relation séquence - structure locale et flexibilité au sein des protéines globulaires

par Aurélie Bornot

Thèse de doctorat en Analyse de génomes et modélisation moléculaire

Sous la direction de Alexandre de Brevern.

Soutenue en 2009

à Paris 7 .


  • Résumé

    La prédiction in silico de la structure tridimensionnelle d'une protéine à partir de sa séquence en acides aminés constitue un défi scientifique d'intérêt majeur. Il est à présent admis que les structures protéiques peuvent être décrites à partir d'un répertoire limité de structures locales récurrentes. Cette observation a conduit au développement de techniques de prédiction de la structure 3D par assemblage de fragments. Ces techniques sont aujourd'hui parmi les plus performantes. Dans ce contexte, la prédiction des structures locales constitue une première étape vers la prédiction de la structure 3D globale d'une protéine. Mon travail de thèse porte principalement sur l'étude des structures protéiques locales à travers deux thèmes : (i) la prédiction des structures locales à partir de la séquence et (ii) l'analyse de la prédictibilité des structures locales en fonction de la flexibilité des structures protéiques. Ces études reposent sur une bibliothèque de 120 fragments chevauchants de 11 résidus de long précédemment développée au sein du laboratoire. Une méthode de prédiction des structures locales à partir de la séquence avait également été mise en place et permettait d'obtenir un taux de prédiction correct de 51 %. La prise en compte de données évolutionnaires couplée à l'utilisation de Machines à Vecteurs de Support a permis d'améliorer la prédiction des structures locales jusqu'à 63 % de prédiction correctes. De plus, un indice de confiance permettant d'évaluer directement la qualité de la prédiction et ainsi d'identifier les régions plus ardues à prédire a été mis au point. Par ailleurs, la structure des protéines n'est pas rigide. Ainsi, j'ai étendu notre analyse à l'étude la prédictibilité structurale des séquences d'acides aminés en fonction de leur flexibilité structurale au sein des protéines. Une analyse des propriétés dynamiques des structures locales a été menée en s'appuyant sur (i) les B-facteurs issus des expériences de cristallographie et (ii) les fluctuations du squelette polypeptidique observées lors de simulations de dynamique moléculaire. Ces analyses de la relation flexibilité-structure locale ont conduit au développement d'une stratégie de prédiction originale de la flexibilité à partir de la séquence. Nos différentes approches constituent une première étape vers la prédiction de la structure tridimensionnelle globale d'une protéine.

  • Titre traduit

    Analysis and prediction of the sequence-local structure-flexibility relationships in globular proteins


  • Résumé

    In silico prediction of protein structure from sequence is a major scientific challenge. It is now admitted that native 3D protein structures can be described by a limited set of recurring local structures. This observation led to the development of protein structure prediction techniques based on fragment assembly methods. Nowadays, these techniques are among the most effective. Protein local structure prediction is the first step toward the generation of global protein models. This thesis work mainly focuses on two major questions: (i) protein local structure prediction from sequence and (ii) the analysis of local structure predictability according to protein structure flexibility features. These analyses were based on a library - previously developed in the laboratory - of 120 3D structural prototypes encompassing all known local protein structures. An associated local structure prediction method from sequence had also been created and yielded a correct prediction rate of 51 %. Here, we achieved a balanced improvement of the prediction rate by coupling evolutionary information with Support Vector Machines. A very satisfying correct prediction rate of 63 % was obtained. Moreover, for directly estimating the quality of the prediction, we developed a confidence index which enables to identify regions that are more difficult to predict. In the same way, protein structures are not rigid macromolecules. Hence, we also extended our analysis and addressed the question of the structural predictability of a sequence with regards to its structural flexibility properties inside protein structures. We analyzed local structure flexibility features in proteins by relying on: (i) B-factors from X-ray experiments and (ii) backbone fluctuations observed in molecular dynamics simulations. Finally, an original flexibility prediction method from sequence was developed. Our different analyses are the first step toward the prediction of 3D global protein models.

Autre version

Cette thèse a donné lieu à une publication en 2011 par [CCSD] à Villeurbanne

Analyse et prédiction de la relation séquence - structure locale et flexibilité au sein des protéines globulaires

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (266 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 382 réf.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris Cité - Bibliothèque interuniversitaire de santé (Paris). Pôle médecine et odontologie.
  • Disponible pour le PEB
  • Cote : PARIS 7 DENIS DIDEROT_2009_no_7169
  • Bibliothèque : Université Paris Cité - BU des Grands Moulins (Paris). Direction générale déléguée aux bibliothèques et musées. Bibliothèque universitaire des Grands Moulins.
  • PEB soumis à condition
  • Cote : TS (2009) 169

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2009PA077169
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.