Disentangling structural complexity in proteins by decomposing SAXS data with chemometric approaches

par Fatima Herranz-Trillo

Thèse de doctorat en Biologie Santé

Sous la direction de Pau Bernado et de Bente Vestergaard.

Soutenue le 29-09-2017

à Montpellier , dans le cadre de Sciences Chimiques et Biologiques pour la Santé , en partenariat avec Centre de biochimie Structurale (Montpellier) (laboratoire) .

Le président du jury était Andrey Kajava.

Le jury était composé de Pau Bernado, Bente Vestergaard, Annette Eva Langkilde, Jean-Michel Roger, Javier Pérez, Romà Tauler.

Les rapporteurs étaient Annette Eva Langkilde, Haydyn D.T. Mertens.

  • Titre traduit

    Détermination de la complexité structurale des protéines en décomposant les données SAXS avec des approches chimiométriques


  • Résumé

    De nombreux systèmes biologiques sont intrinsèquement polydispersés, présentant de multiples espèces coexistantes, de taille, de forme ou de conformation différentes (c'est-à-dire, mélanges oligomèriques, des complexes faiblement liés se dissociant en composantes individuelles ou des espèces apparaissant lors de processus amyloïdogéniques). L'étude de tels systèmes complexes est une tâche difficile en raison de l'instabilité des espèces concernées, de leurs concentrations relatives faibles et interdépendantes et des difficultés rencontrées pour l'isolation des composantes pures. Dans cette thèse, j'ai développé des approches méthodologiques pour appliquer la diffusion des rayons X aux petits angles (SAXS), une technique de biologie structurale, à l'étude de systèmes polydispersés. SAXS est une technique additive et par conséquent, le diagramme de diffusion mesuré pour un échantillon polydispersé correspond à la somme pondérée en concentration des contributions de chacune des composantes individuelles du mélange. Cependant, la décomposition des données de SAXS en des spectres spécifiques des espèces et de leurs concentrations relatives est extrêmement laborieuse et ambigue. Dans cette thèse, je présente d'abord une approche objective pour solidement décomposer les jeux de données de SAXS en composantes individuelles. Cette approche adapte la méthode chimiométrique « Multivariable Curve Resolution Alternate Least Squares » (MCR-ALS) aux spécificités des données de SAXS. Notre méthode permet une décomposition rigoureuse et robuste des données de SAXS en introduisant simultanément différentes représentations de ces données et par conséquent, en mettant l'accent sur des changements moléculaires à différentes plages de temps et de résolution structurale. Nous avons appliqué cette approche, que nous appelons COSMiCS (Analyse structurelle objective complexe des systèmes multi-composants) pour étudier deux systèmes polydispersés: la fibrillation des protéines, et les fluctuations conformationnelles de protéines grâce à l'analyse de données obtenues à l'aide d’une technique de couplage de chromatographie d'exclusion de taille (SEC) avec le ligne de SAXS (SEC-SAXS). L'importance d'étudier les processus de fibrillation réside dans leur implication dans des pathologies amyloïdogéniques telles que les maladies de Parkinson ou d'Alzheimer. Il existe de fortes indications que les espèces oligomériques solubles, et non les fibrilles matures, sont la cause principale de la cytotoxicité et des dommages neuronaux. Cette observation souligne l'importance de caractériser les premiers stades des processus de fibrillation. Notre approche COSMiCS a permis d'étudier les processus amyloïdogéniques de l'insuline et du mutant familial E46K de l'α-synucléine, une protéine associée à la maladie de Parkinson. Cette analyse permet la caractérisation structurale des espèces présentes (y compris les espèces oligomériques) et la caractérisation cinétique de leurs transformations.La deuxième partie de la thèse est consacrée à l'utilisation de COSMiCS pour analyser des données de SEC-SAXS. Le SEC-SAXS est extrêmement populaire et a été implémenté sur plusieurs lignes de SAXS à travers le monde. En utilisant des données synthétiques, je démontre la capacité des approches chimiométriques à décomposer des profils chromatographiques complexes. À l'aide de cette approche, j'ai décomposé l’ensemble des données SEC-SAXS mesurés pour la Prolyl OligoPeptidase (POP).En résumé, cette thèse présente une nouvelle approche chimiométrique qui peut être généralement appliquée à tout mélange macromoléculaire pouvant subir une modifacation de son équilibre et pouvant être abordé par SAXS. Les complexes biomoleculaires transitoires, les processus de repliement, les réarrangements structuraux dépendants d’un ligand ou la formation de grands ensembles supramoleculaires peuvent être sondés de façon structurale en utilisant l'approche COSMiCS.


  • Résumé

    Many biological systems are inherently polydisperse, presenting multiple coexisting species differing in size, shape or conformation (i.e. oligomeric mixtures, weakly bound complexes, and species appearing along amyloidogenic processes). The study of such complex systems is challenging due to the instability of the species involved, their low and interdependent relative concentrations, and the difficulties to isolate the pure components. In this thesis, I have developed methodological approaches to apply Small-Angle X-ray Scattering (SAXS), a low-resolution structural biology technique, to the study of polydisperse systems. As an additive technique, the SAXS pattern measured for a polydisperse sample corresponds to the concentration-weighted sum of the contributions from each of the individual components. However, decomposition of SAXS data into species-specific spectra and relative concentrations is laborious and burdened by ambiguity. In this thesis, I present an approach to decompose SAXS datasets into the individual components. This approach adapts the chemometrics Multivariate Curve Resolution Alternating Least Squares (MCR-ALS) method to the specificities of SAXS data. Our method enables the rigorous and robust decomposition of SAXS data by simultaneously introducing different representations of these data and, consequently, emphasizing molecular changes at different time and structural resolution ranges. We have applied this approach, which we name COSMiCS (Complex Objective Structural analysis of Multi-Component Systems), to study two polydisperse systems: amyloid fibrillation by analysing time-dependent SAXSdata, and conformational fluctuations through the analysis of data obtained using on-line size-exclusion chromatography coupled to SAXS (SEC-SAXS). The importance of studying fibrillation processes lies in their implication in amyloidogenic pathologies such as Parkinson’s or Alzheimer’s diseases. There exist strong indications that soluble oligomeric species, and not mature fibrils, are the main cause of cytotoxicity and neuronal damage emphasizing the importance of characterizing early stages of fibrillation. The first application of our COSMiCS approach has allowed the study of the amyloidogenic mechanisms of insulin and the familial mutant E46K of ↵-synuclein, a Parkinson’s disease related protein. The analysis enables the structural characterization of all the species present as well as their kinetic transformations. The second part of the thesis is dedicated to the use of COSMiCS to analyze on-line SEC-SAXS experiments. Using synthetic data, I demonstrate the capacity of chemometric approaches to decompose complex chromatographic profiles. Using this approach, I have studied the conformational fluctuations in prolyl oligopeptidase (POP), a protein related to synaptic functions and neuronal development. In summary, this thesis presents a novel chemometrics approach that can be generally applied to any macromolecular mixture with a tuneable equilibrium that is amenableto SAXS. Transient biomolecular complexes, folding processes, or ligand-dependent structural rearrangements can be probed structurally using COSMiCS.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Bibliothèque interuniversitaire. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.