Développement de nouvelles méthodes bioinformatiques pour l'étude des récepteurs couplés aux protéines G

par Jean-Sébastien Surgand

Thèse de doctorat en Sciences pharmaceutiques

Sous la direction de Didier Rognan.

Soutenue en 2006

à Strasbourg 1 .


  • Résumé

    Les récepteurs couplés aux protéines G (RCPG) sont des protéines membranaires responsables de la transduction de signaux de l'extérieur vers l'intérieur de la cellule. Localisés partout dans l'organisme, ils sont impliqués dans de très nombreuses fonc tions physiologiques comme la vision, l'olfaction, la croissance et l'adhésion cellulaire, la régulation hormonale, etc. Ils sont cibles d'une grande diversité de ligands : des photons, des ions, des amines biogènes, des hormones, des glycoprotéines, des molécules odorantes et gustatives, etc. Un RCPG est formé de 7 hélices α transmembranaires reliées par des boucles intra- et extra-cellulaires. Ces 7 hélices α délimitent une cavité. Les ligands se fixent soit dans cette cavité soit au niveau des boucles extra-cellulaires, activant le récepteur qui va se lier à une protéine G à l'intérieur de la cellule, initiant une cascade de réactions chimiques. Un seul RCPG a été cristallisé jusqu'µa présent, la rhodopsine bovine, apportant une information structurale précieuse. Les RCPG présentent un grand intérêt pharmacologique. Leur diversité et les nom- breuses fonctions qu'ils contrôlent les font intervenir dans de nombreuses pathologies. Plus de 30% des nouveaux médicaments mis sur le marché ciblent des RCPG. De plus, beaucoup de RCPG sont encore orphelins, c'est-à-dire sans ligand connu, et possèdent donc un fort potentiel pharmacologique. Les RCPG forment une super-famille de plus d'un millier de membres, dont la grande majorité sont responsables de la perception des molécules olfactives. Le site de liaison de la plupart des RCPG est situé dans la cavité transmembranaire ; mais pour certains, le site est externe à la membrane et le ligand se fixe aux boucles extra- cellulaires. Mais même dans ces cas, les récepteurs possèdent une cavité transmembranaire et c'est sur elle que nous focalisons notre travail. Plusieurs classifications des RCPG ont déjà été proposées : phylogénétiques, basées sur des automates statistiques, sur des empreintes physico-chimiques ou sur la compo- sition en acides aminés. Mais aucune ne prend en compte précisément le point de vue pharmacologique, axé sur le ligand (le médicament). C'est pourquoi nous proposons une nouvelle classification des RCPG orientée phar- macologie. Elle est basée sur l'étude de résidus supposés critiques de la cavité trans- membranaire, qu'on pense interagir avec des ligands. Nous partons d'un jeu de données de 369 séquences de RCPG humains non-olfactifs, aussi (( propre )) que possible. Puis nous alignons les parties transmembranaires de fa»con automatique mais avec une étape de vérification et de raffinement manuels. Ensuite nous extrayons 30 résidus critiques en étudiant la cavité de la rhodopsine bovine, dont les parties transmembranaires ont une très forte identité avec celles de la rhodopsine humaine (94%). Nous supposons que ces 30 résidus sont critiques pour tous les RCPG, c'est-à-dire que la forme des cavités de tous les récepteurs est globalement conservée. Cette supposition est étayée par diverses publications. Enfin nous classifions ces séquences discontinues par une méthode de clustering hiérarchique agglomératif (la méthode UPGMA). Les distances entre séquences sont simplement les scores d'identité entre elles. Une procédure de bootstrapping vient apporter un poids statistique à la classification qui aboutit à 22 clusters bien distincts. Notre classification est en accord avec la classification GRAFS publiée récemment (analyse phylogénétique exhaustive de 342 RCPG humains non-olfactifs), c'est-à-dire que les clusters obtenus correspondent aux familles et sous-familles déjà identifiees, à quelques différences près. On peut appliquer cette classification à la recherche de nouvelles cibles pour des ligands partageant des sous-structures communes (on parle de structures privilégiées). Partant de ligands dont on connait des récepteurs, on recherche parmi les 30 résidus critiques de ces récepteurs ceux qui interviennent dans la liaison. Ensuite on recherche d'autres récepteurs qui partagent les mêmes résidus. On peut proposer ces nouveaux récepteurs comme cibles potentielles pour les ligands de départ. Une deuxième application immédiate de notre classification est la désorphanisation de récepteurs, c'est-à-dire la découverte d'un premier ligand pour un récepteur orphelin. Nous proposons comme point de départ pour un récepteur orphelin les ligands connus des récepteurs de la même classe. La pertinence d'une classification basée sur les cavités transmembranaires pour des récepteurs dont le site de liaison n'est pas la cavité est discutable. Pourtant nous constatons que les familles pour lesquelles le ligand se fixe à l'extérieur de la membrane (famille de classe secrétine et glutamate) sont très bien identifiées et séparées les unes des autres. Dans un deuxième temps, nous avons construit une autre classification des RCPG en utilisant, non plus les séquences, mais des modèles 3D des récepteurs, construits par homologie. Pour schématiser, nous recherchons le point de vue qu'aurait un ligand placé dans la cavité. Nous plaçons donc une sphère conceptuelle, qui représente le ligand, au centre de gravité de la cavité. Cette sphère est découpée en 80 éléments triangulaires, de même taille et disposés uniformément sur la sphère. Ensuite nous projetons, à partir du carbone β des résidus, des informations physico-chimiques et géométriques de la cavité dans les triangles qui intersectent la demi-droite partant du centre de la sphère et allant vers le carbone β du résidu considéré. Enfin nous comparons les sphères deux à deux, chaque comparaison donnant un score utilisé pour générer une matrice de distances et finalement une classification par la même méthode que précédemment. La méthode est assez floue (discrétisation peu poussée, projection à partir des carbones β et non à partir de tous les atomes) pour masquer les erreurs dues à la modélisation. Les modèles utilisés sont préalignés sur la structure qui a servi de point de départ, la structure cristallographique de la rhodopsine bovine. Malheureusement ces alignements ne sont pas suffisamment précis pour la génération d'une matrice de distances. Nous avons donc construit un outil d'alignement structural pour les raffiner. Cet outil est guidé par le score décrit ci-dessus pour trouver l'alignement entre deux cavités. Le meilleur score donnera le résultat de l'alignement. La classification est homogène avec la précédente, mais le nombre de récepteurs non classés (singletons) est plus grand. Intéressant est le fait que le récepteur DUFFY, non classé par notre précédente classification, est classé ici avec les récepteurs des chimiokines, en accord avec la classification de la base Swiss-Prot. Notre classification a en outre donné naissance à un outil d'alignement structural de cavité adapté au travail sur des modèles, mais qui peut aussi aligner des structures cristallographiques.

  • Titre traduit

    Development of new bioinformatics methods for the study of G-protein-coupled receptors


  • Résumé

    G-protein-coupled receptors (GPCRs) are membrane proteins responsible for the transduction of signals from outside into the cell. Distributed in the whole body, they are implied in various physiological functions, like vision, olfaction, cellular growth and adhesion, etc. They are targeted by a tremendous diversity of possible ligands: photons, ions, biogenic amines, hormones, glycoproteins, olfactive and gustative molecules, etc. A GPCR is composed of 7 transmembrane α-helices linked together by intra- and extracellular loops. These 7 α-helices delineate a cavity. Ligands bind either in this cavity, or on the extracellular loops, activating the receptor that will link to a G-protein inside the cell, initiating a cascade of secondary messengers. Up to now, the bovine rhodopsin is the only known crystallographic structure, bringing a valuable structural information. GPCRs present a big pharmacological interest. Their diversity and the numerous functions they control get them involved in numerous pathologies. More than 30% of new commercialized drugs target GPCRs. Furthermore, many GPCRs are still orphan, without known ligand, and hence constitute potential pharmacological targets. GPCRs form a superfamily of more than one thousand members. Three out of four are involved in the perception of olfactive molecules. The binding site of most GPCRs is located in the transmembrane cavity; but for some of them, it is located outside the membrane and the ligand binds an extracellular loop. But even for these cases, all receptors show a transmembrane cavity on which we will concentrate during this work. Several classifications of GPCRs have been proposed: phylogenetic classifications, or based on statistical automata, or on physicochemical fingerprints, or based on their amino-acid composition. But none of them takes into account precisely the pharmacolo- gical point of view of the ligand (the drug). That's why we propose a new classification of GPCRs which is pharmacologically- oriented. It is based on the study of some residues of the transmembrane cavity supposed to be critical and to interact with the ligand. We start from a dataset of 369 sequences of human nonolfactory GPCRs, as \clean" as possible. Then we align automatically the transmembrane parts, but with a manual check following. Then we extract 30 critical residues by studying the cavity of bovine rhodopsin, which transmembrane parts share a high identity score with the human rhodopsin (94%). We suppose that these 30 residues are critical for all GPCRs, i. E. The fold of all GPCRs is overall conserved. This hypothesis is supported by several publications. Eventually, we classify these sequences by an agglo merative hierarchical clustering algorithm (UPGMA). The distances between sequences are simply the identity scores between them. A bootstrap procedure brings a statistical support to the classification, that leads to 22 well-defined clusters. Our classification agrees the recently published GRAFS classification (a phylogenetic analysis of 342 human non-olfactory GPCRs): resulting clusters correspond to already identified families and subfamilies, with slight differences. This classi¯cation can be applied to ¯nd new targets to ligands that share some common substructures (called priviledged structures). We start from ligands with known receptors, we seek among the 30 critical residues of these receptors those that participate to the binding. Then we seek for other receptors that share the same residues. We can eventually propose these new receptors as putative targets for the ligands we started with. A second straightforward application of the classification is the deorphanization of receptors, i. E. The discovery of a fisrt ligand for an orphan receptor. We propose, as a starting point for an orphan receptor, the known ligands of the receptors of the same cluster. The relevence of a classification based on the transmembrane cavities for receptors which binding site is not the this cavity is questionable. However we find that even the families for which the ligand bind outside the membrane (secretin and glutamate families) are well identified and well separated. In a second time, we built another classification of GPCRs, based on 3D homology models rather than on sequences. To simplify, we try to take the point of view of a ligand inside a cavity. We put a conceptual sphere, that stands for the ligand, at the center of gravity of the cavity. This sphere is tessellated into 80 triangles, with same size, homogenously dispatched. Then we project from the β carbon of the residues some phy sicochemical and geometrical information into the triangles. Eventually we compare the spheres, each comparison gives a score used to build a distance matrix and a classification with the same method as for the previous one. This method is quite fuzzy (low resolution discretization, projection from the β carbons and not from all atoms) to hide the errors due to modelling. The models are prealigned on the cristal structure of bovine rhodopsin. But unfortu- nately these alignments were not precise enough to build a distance matrix. So we coded a structural alignment tool to refine the alignments. This tool is guided by the previsouly- described score to find an alignment between two cavities. The best score gives the output alignment. The resulting clustering is homogenous with the previous one, but the number of non-classified receptors (singletons) is higher. Interestingly, the receptor DUFFY, not classified by our previous clustering, is classified here in the Chemokine cluster, in agree- ment with the Swiss-Prot database classification. Our classification leads to a structural alignment tool adapted to work on models, but that can also work on crystal structures.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 143 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.138-140

Où se trouve cette thèse ?

  • Bibliothèque :
  • Disponible pour le PEB
  • Cote : 2006-SURGAND
  • Bibliothèque :
  • Non disponible pour le PEB
  • Cote : MFTH 7304
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.