Analyse statistique des boucles protéiques : développement d'une méthode d'extraction systématique de motifs récurrents au sein des régions en boucles

par Leslie Regad

Thèse de doctorat en Analyse de génomes et modélisation moléculaire

Sous la direction de Anne-Claude Camproux.

Soutenue en 2008

à Paris 7 .


  • Résumé

    Comme les boucles protéiques sont très variables en termes de structure et de séquence elles sont souvent considérées comme des régions irrégulières. Au cours de ma thèse, j'ai développé une méthode statistique permettant d'analyser systématiquement des motifs structuraux récurrents extraits des boucles. Cette méthode utilise l'alphabet structural HMM-SA. HMM-SA est une description de la structure locale des protéines à l'aide de 27 prototypes de 4 résidus, appelés lettres structurales. A partir d'un jeu de structures des boucles simplifiées dans l'espace de HMM-SA, les motifs de 4 lettres structurales, correspondant à des fragments de 7 résidus, ont été extraits. 95% de ces fragments correspondent à des motifs structuraux vus au moins deux fois dans la banque de boucles. Nous avons montré que la majorité de ces motifs structuraux présentent une stabilité structurale et des préférences en acides aminés. Nous avons ensuite analysé le lien entre ces motifs et la fonction des protéines. Pour cela, nous avons recherché les motifs structuraux sur-représentés dans des échantillons de boucles extraites de protéines ayant une origine évolutive commune, c'est-à-dire appartenant à la même superfamille de la classification des protéines SCOP. Cette approche a permis de différencier deux types de motifs structuraux : les motifs ubiquitaires qui semblent avoir un rôle structural et les candidats fonctionnels, qui semblent être impliqués dans la fonction des protéines. Cette hypothèse a été confirmée par le fait que certains candidats fonctionnels correspondent à des sites biologiques annotés dans la banque de données Swiss-Prot.

  • Titre traduit

    Statistical analysis of protein loop structures : development of a method for systematic extraction of recurrent structural motifs from loops


  • Résumé

    Protein loops are often considered as irregular region because they are variable both in terms of structure and sequence. During the course of my PhD, I developed a statistical method to perform a systematic analysis of recurrent structural motifs extrac-ted from loops. This method uses structural alphabet HMM-SA. HMM-SA is a description of protein local structures using 27 structural prototypes of 4 residues, called structural letters. From a set of loop structures simplified into the HMM-SA space, structural motifs of 4 structural letters, corresponding to 7 residue fragments, were extracted. 95% of these fragments correspond to structural motifs seen more than twice in the loop dataset. We showed that the majority of these structural motifs exhibit structural stability and amino acid preferences. Also, we analysed the link between these motifs and protein functions. To perform this analysis, we looked for over-represented motifs in loops extracted from proteins with an hypothetic common evolutive origin, i. E. , belonging to the same SCOP superfamily. This approach allowed to distinguish two types of structural motifs : ubiqui-tous motifs, with an hypothetical structural role, and functional candidates which seem to be involved in protein functions. This hypothesis was confirmed by the fact that some functional candidates correspond to biological functional sites annotated in the Swiss-Prot database.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (235 f.)
  • Notes : Publication autorisée par le jury
  • Annexes : 221 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • PEB soumis à condition
  • Cote : TS (2008) 110
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.