Dévelopement d'une méthode bio-informatique pour la prédiction des régions amyloidogéniques dans les protéines.

par Abdullah Ahmed

Thèse de doctorat en Biologie Santé

Sous la direction de Andrey Kajava.

Le jury était composé de Andrey Kajava, Andrea Parmeggiani.

Les rapporteurs étaient Salvador Ventura Zamora, Javier Sancho.


  • Résumé

    La formation d'agrégats protéiques insolubles et fibreux, appelés fibrilles amyloïdes, est impliquée dans une large variété de maladies humaines. Parmi elles, figurent entre autres, le diabète de type II, l'arthrite rhumatoïde et, notamment, les atteintes neurodégénératives débilitantes, telles que les maladies d'Alzheimer, de Parkinson ou encore de Huntington. Actuellement, il n'existe ni traitement, ni diagnostic précoce pour aucune de ces maladies.De nombreuses études ont montré que la capacité à former des fibrilles amyloïdes est une propriété inhérente à la chaîne polypeptidique. Ce constat a conduit au développement d'un certain nombre d'approches computationnelles permettant de prédire les propriétés amyloïdogéniques à partir de séquences d'amino-acides. Si ces méthodes s'avèrent très performantes vis à vis de courts peptides (~ 6 résidus), leur application à des séquences plus longues correspondant aux peptides et protéines en lien avec les maladies, engendre un nombre trop élevé de faux positifs. Le principal objectif de cette thèse consiste à développer une meilleure approche bioinformatique, capable de prédire les régions amyloïdogéniques à partir d'une séquence protéique. Récemment, l'utilisation de nouvelles techniques expérimentales a permis de mieux appréhender la structure des amyloïdes. Il est ainsi apparu que l'élément caractéristique de la majorité des fibrilles amyloïdes impliquées dans les maladies, était constitué d'une structure étagée (β-arcade), résultant de l'empilement de motifs « feuillet β – coude – feuillet b » appelés « β-arches ». Nous avons mis à profit cette particularité structurale pour créer une approche bioinformatique permettant de prédire les régions amyloïdogéniques d'une protéine à partir de l'information contenue dans sa séquence. Les résultats provenant de l'analyse des structures de type β-arcade, connues et modélisées, ont été compilés et traités à l'aide d'un algorithme écrit en langage Java, afin de créer le programme ArchCandy.L'application de ce programme à une sélection de séquences protéiques et peptidiques, connues pour leur lien avec les maladies, a permis de démontrer qu'il était en mesure de prédire correctement la majorité de ces séquences, de même que les séquences mutées impliquées dans les maladies familiales. Outre la prédiction de régions à haut potentiel amyloïde, ce programme suggère la conformation structurale adoptée par les fibrilles amyloïdes. Le séquençage de génomes entiers devenant toujours plus abordable, notre méthode offre une perspective de détermination individuelle des profils à risque, vis à vis de maladies neurodégénératives, liées à l'âge ou autres. Elle s'inscrit ainsi pleinement dans l'ère de la médecine personnalisée.

  • Titre traduit

    Development of bioinformatics method for prediction of amyloidogenic regions in proteins.


  • Résumé

    A broad range of human diseases are linked to the formation of insoluble, fibrous, protein aggregates called amyloid fibrils. They include, but are not limited to, type II diabetes, rheumatoid arthritis, and perhaps most importantly, debilitating neurodegenerative diseases such as Alzheimer's disease, Parkinson's disease, and Huntington's disease. There currently exists no cure, and no means of early diagnosis for any of these diseases. Numerous studies have shown that the ability to form amyloid fibrils is an inherent property of the polypeptide chain. This has lead to the development of a number of computational approaches to predict amyloidogenicity by amino acid sequences. Although these methods perform well against short peptides (about 6 residues), they generate an unsatisfactory high number of false positives when tested against longer sequences of the disease-related peptides and proteins. The main objective of this thesis was to develop an improved bioinformatics based approach to predict amyloidogenic regions from protein sequence.Recently new experimental techniques have shed light on the structure of amyloids showing that the core element of a majority of disease-related amyloid fibrils is a columnar structure (β—arcade) produced by stacking of β-strand-loop-β-strand motifs called “β-arches”. Using this structural insight, we have created a bioinformatics based approach to predict amyloidogenic regions from protein sequence information. Data from the analysis of the known and modeled β-arcade structures was incorporated into a rule based algorithm implemented in the Java programming language to create the ArchCandy program. Testing it against a set of protein and peptide sequences known to be related to diseases has shown that it correctly predicts most of these sequences and a number of mutated sequences related to the familial diseases. In addition to the prediction of regions with high amyloidogenic potential, a structural arrangement of the amyloid fibril is also suggested for each prediction. As whole genome sequencing becomes cheaper, our method provides opportunity to create individual risk profiles for the neurodegenerative, age-related and other diseases ushering in an era of personalized medicine.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?