Evolution des concentrations d'enzymes dans les réseaux métaboliques

par Charlotte Coton

Projet de thèse en Sciences de la vie et de la santé

Sous la direction de Dominique de Vienne.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Structure et Dynamique des Systèmes Vivants (Gif-sur-Yvette, Essonne) , en partenariat avec Génétique Quantitative et Évolution - Le Moulon (laboratoire) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2018 .


  • Résumé

    Évolution des concentrations d'enzymes dans les réseaux métaboliques Encadrants : Dominique de Vienne et Christine Dillmann  Contexte Les approches actuelles de la biologie produisent des quantités massives de données qui rendent compte des abondances de tous les constituants cellulaires et de leur variabilité génétique. Ces ressources ouvrent ainsi de nouvelles perspectives pour comprendre les principes d'évolution du métabolisme cellulaire. Parmi les composantes de la fitness, les flux métaboliques jouent un rôle central puisqu'ils influencent directement ou indirectement les phénotypes, et ceci à tous les niveaux d'organisation. Pour cette raison, de nombreux travaux de génétique évolutive se sont intéressés au polymorphisme et à l'évolution des gènes qui déterminent les concentrations et/ou les paramètres cinétiques des enzymes (cf. revue de Eanes, 2017). Lorsqu'il y a pression de sélection pour augmenter un flux, ou pour l'amener à une valeur optimale, les concentrations des enzymes se modifient. Un résultat assez général est que l'évolution des gènes codant les enzymes en amont des réseaux métaboliques est plus lente que celle des gènes codant des enzymes en aval (Greenberg et al. 2008, Morrison et Badyaev, 2016). Une raison en est que la variation des premières enzymes est susceptible d'affecter davantage le flux que celle des enzymes en aval. Les coefficients de contrôle des flux tendent en effet à être plus élevés en amont qu'en aval des systèmes (Olson-Manning et al. 2013 , Wright et Rausher 2010). Enfin les enzymes se trouvant à des points de branchement sont également plus contraintes que les autres dans leur évolution (Rausher 2013 ; Greenberg et al. 2008).` Ces résultats ont été obtenus grâce à l'étude de systèmes métaboliques particuliers (anthocyanes, glucosinolates, etc.), du métabolisme central d'un organisme ou d'une cellule (drosophile, érythrocytes, etc.), ou alors se sont appuyés sur des simulations de systèmes linéaires ou branchés. Les interprétations qui en sont données restent purement verbales, faute d'un cadre théorique susceptible de comprendre comment évoluent les concentrations et/ou les paramètres cinétiques des enzymes. Problématique Pour construire un tel cadre théorique, la difficulté principale vient du fait que les enzymes ne peuvent pas évoluer indépendamment les unes des autres : 1) en raison de la propriété de sommation des coefficients de contrôle (Kacser et Burns, 1973), la variation évolutive d'une enzyme donnée va modifier la manière dont les autres enzymes vont répondre ultérieurement à la sélection (Bost et al. 2001) ; 2) la synthèse des enzymes a un coût énergétique et spatial, si bien que la concentration totale d'enzymes allouée par la cellule à un réseau donnée est limitée. L'augmentation de la concentration d'une enzyme, notamment si elle est déjà abondante, va réduire la concentration des autres car il y a compétition entre enzymes pour les ressources cellulaires (Vilaprinyo et al. 2010) ; 3) de multiples mécanismes de régulation conduisent à des corrélations, positives ou négatives, entre concentrations d'enzymes (Lion et al. 2004). La prise en compte de ces différents facteurs est au cœur de ce projet de thèse. Objectif de la thèse L'objectif de ce projet de thèse est triple : 1)    Développer un modèle théorique de l'évolution des enzymes dans les réseaux métaboliques en s'appuyant d'une part sur la théorie du contrôle métabolique, d'autre part sur des modèles de génétique des populations et/ou de dynamique adaptative 2)    Tester les prédictions sur des systèmes réels décrits par des équations différentielles 3)    Faire une méta-analyse pour confronter les résultats aux observations. Approches suivies 1) Modélisation de l'évolution des enzymes La modélisation s'appuiera sur une expression générale empirique des flux dans les réseaux (Equation 1 du .pdf joint. Kacser et Burns 1973, Fell 1997, Fiévet et al. 2010). Cette équation relie le flux aux paramètres cinétiques et aux concentrations de toutes les enzymes du réseau, qui sont génétiquement variables, et à des paramètres qui rendent compte de la topologie du réseau (non variables génétiquement). En s'inspirant des modèles de la dynamique adaptative, l'équipe a construit un système d'équations différentielles qui décrit l'évolution des concentrations d'enzymes lorsqu'il y a sélection pour modifier un flux (Equation 2 du .pdf joint). Cette évolution dépend des taux de mutation, des coefficients de sélection (qui sont fonction des coefficients de contrôle, eux-mêmes fonction de tous les paramètres du système), de l'effet des mutations sur les concentrations des enzymes et d'un coefficient qui rend compte des effets de compétition et/ou de co-régulations entre enzymes. Ce système nous a permis, dans certaines situations, de trouver analytiquement l'état d'équilibre des concentrations relatives d'enzymes et des coefficients de contrôle pour des chaînes métaboliques linéaires, et les prédictions ont été confirmées par des simulations d'évolution des flux à long terme. Par exemple nous avons montré que : 1) sous de nombreuses conditions les concentrations relatives à l'équilibre étaient inversement reliées aux valeurs des constantes cinétiques ; 2) en cas de compétition seule ces concentrations à l'équilibre étaient égales aux coefficients de contrôle, et 3) qu'en cas de régulation positive entre enzymes les concentrations à l'équilibre ne dépendaient plus des constantes cinétiques mais seulement des co-régulations entre enzymes. Dans le cadre de cette thèse, il s'agira de développer cet outil théorique pour explorer des situations plus réalistes, à savoir : 1) considérer les mutations qui touchent les paramètres cinétiques ; 2) considérer des systèmes branchés dans lesquels la topologie du réseau joue un rôle ; 3) introduire une fonction de coût de la synthèse protéique ; 4) étudier l'évolution des concentrations de métabolites. Des solutions analytiques seront recherchées, qui seront confrontées aux résultats de simulations d'évolution à long terme ; sinon des simulations seules seront utilisées. Outre l'expertise des co-encadrants sur la théorie du contrôle métabolique et en génétique des populations et évolution, ce travail sera réalisé dans le cadre de collaborations avec Olivier Martin (UMR GQE-Le Moulon) et Arnaud Le Rouzic (UMR EGCE), qui ont tous deux une expérience solide de ces questions appliquées à l'évolution de réseaux de gènes. 2) Confrontation aux prédictions issues de modèles d'équations différentielles décrivant des réseaux particuliers Pour tester la robustesse des conclusions, la deuxième partie de la thèse consistera à simuler l'évolution de réseaux métaboliques pour lesquels on dispose d'un système d'équations différentielles. Le premier réseau utilisé sera celui de la glycolyse, dont le système d'équations différentielles construit par l'équipe d'accueil a récemment servi à une étude sur l'hétérosis (Fiévet et al. 2018). Ce réseau, avec une entrée (glucose) et deux sorties (glycérol et acétaldéhyde), a le mérite d'être relativement simple, ce qui facilitera les interprétations et permettra de caler les conditions de simulation. En second lieu on utilisera le réseau complet du métabolisme central d'un ou de quelques micro-organismes, qui ont l'avantage d'inclure plusieurs centaines, voire milliers, de gènes, de réactions et de métabolites (ex. Bacillus subtilis, Goelzer et al. 2015, Escherichia coli, Khodayari et Maranas 2016). On évaluera ainsi dans quelle mesure les prédictions faites sur des petits systèmes restent qualitativement valides sur des systèmes de grande dimension. Pour cette partie, nous nous appuierons pour les choix de modèles sur des discussions avec Anne Goelzer (INRA Jouy-en-Josas) et Yves Gibbon (INRA Bordeaux) qui feront partie du comité de thèse. 3) Méta-analyse La dernière partie de la thèse consistera en une méta-analyse. Il s'agira de rechercher des données réelles sur les paramètres cinétiques et les concentrations d'enzymes, puis de les confronter aux prédictions du modèle. Par exemple la prédiction de relation négative entre concentrations et paramètres cinétiques pourra être testée. Les éventuelles discordances pourront conduire à affiner le modèle théorique proposé. Nous nous appuierons, pour cette partie, à la fois sur l'expérience de deux équipes de l'UMR sur la méta-analyse (GQMS, Alain Charcosset et ABIana, Johann Joets), et sur l'expérience de l'équipe Bibliome (UMR MaIAGE, INRA Jouy en Josas) avec laquelle nous avons des collaborations en cours sur l'extraction automatique d'informations à partir de la bibliographie. Calendrier Année 1. Développement du modèle théorique d'évolution des réseaux métaboliques. Année 2. Fin du développement du modèle théorique d'évolution des réseaux. Tests des prédictions du modèle sur des systèmes réels. Rédaction d'un article et début de la méta-analyse. Année 3. Fin de la méta-analyse, rédaction d'un deuxième article et rédaction de la thèse. Conclusion Ce travail de thèse devrait apporter des résultats originaux sur les contraintes à l'œuvre dans l'évolution des réseaux métaboliques. Sur un plan plus pratique il pourrait trouver des applications en ingénierie métabolique, et plus généralement en biologie prédictive, en révélant le « jeu des possibles » à l'échelle du métabolisme dans son ensemble.

  • Titre traduit

    Evolution of enzyme concentrations in metabolic networks


  • Résumé

    Evolution of enzyme concentrations in metabolic networks Among the components of fitness, metabolic fluxes play a central role since they directly or indirectly influence phenotypes at all levels of organization. For this reason, many studies of evolutionary genetics have focused on the polymorphism and evolution of genes that impact the concentrations and/or kinetic parameters of enzymes. When there is selection pressure to increase a flux, or to bring it to an optimum value, the enzyme concentrations change. A fairly general result is that the evolution of genes encoding enzymes upstream metabolic networks is slower than that of genes encoding downstream enzymes. One reason is that the variation of the first enzymes is likely to affect the flux more than that of the downstream enzymes. Flux control coefficients tend to be higher upstream than downstream of the systems. Enzymes at branch points are also more evolutionary constrained than the others. The interpretations of these observations are purely verbal, for lack of a theoretical framework. To build such a theoretical framework, the main difficulty comes from the fact that the enzymes cannot evolve independently of each other: 1) because of the summation property of the control coefficients, the evolutionary variation a given enzyme will change the way other enzymes respond to selection later; 2) the synthesis of enzymes has an energy and spatial cost, so that the total concentration of enzymes allocated by the cell to a given network is limited. The increase in the concentration of an enzyme, especially if it is already abundant, will reduce the concentration of others because there is competition between enzymes for cellular resources; 3) Multiple regulatory mechanisms lead to positive or negative correlations between enzyme concentrations. Taking these different factors into account is at the heart of this thesis project. The objective of this thesis project is threefold: 1) Develop a theoretical model of the evolution of enzymes in metabolic networks 2) Test predictions on real systems described by differential equations 3) Do a meta-analysis to compare the results with the observations. The modeling will be based on an empirical general expression of fluxes in the networks. This equation relates the flux to the kinetic parameters and the concentrations of all the enzymes in the network, which are genetically variable, and to parameters that account for the network topology. Drawing on models of adaptive dynamics, the team constructed a system of differential equations that describes the evolution of enzyme concentrations when there is selection to modify a flux. This evolution depends on the mutation rates, selection coefficients, on the effect of the mutations on the concentrations of the enzymes and on a coefficient which accounts for the effects of competition and/or co-regulation between enzymes. This system has allowed us, in certain situations, to analytically find the equilibrium state of relative enzyme concentrations and control coefficients for linear metabolic chains, and predictions have been confirmed by flux long-term evolution simulations. For example, we have shown that: 1) under many conditions equilibrium concentrations were inversely related to kinetic constant values; 2) in case of competition alone, these equilibrium concentrations were equal to the control coefficients, and 3) in case of positive regulation between enzymes the equilibrium concentrations no longer depended on the kinetic constants but only on the co-regulations between enzymes. The PhD student will develop this theoretical tool to take into account more realistic situations, namely: 1) mutations that affect the kinetic parameters; 2) connected systems in which the topology of the network plays a role; 3) a cost function of protein synthesis; 4) evolution of metabolite concentrations. Analytical solutions will be sought, which will be confronted with the results of long-term evolution simulations; otherwise simulations alone will be used. To test the robustness of the conclusions, the second part of the thesis will consist in simulating the evolution of metabolic networks for which systems of differential equations exist. The first network used will be that of glycolysis, whose system of differential equations constructed by the host team has recently been used for a study on heterosis. This network has the merit of being relatively simple, which will facilitate interpretations and will help to stabilize the simulation conditions. Secondly, we will use the complete network of central metabolism of one or a few microorganisms, which have the advantage of including several hundreds or even thousands of genes, reactions and metabolites. The extent to which predictions made on small systems remain qualitatively valid on large systems will be evaluated. The last part of the thesis will consist of a meta-analysis. The goal will be to look for kinetic parameter and enzyme concentration from real data and then compare them with model predictions. For example, the prediction of a negative relationship between concentrations and kinetic parameters can be tested. Any discrepancies may lead to refining the proposed theoretical model.