APPRENTISSAGE AUTOMATIQUE POUR LA BIOPRODUCTION SUR SYSTÈMES ACELLULAIRES

par Angelo Cardoso Batista

Projet de thèse en Sciences de la vie et de la santé

Sous la direction de Jean-Loup Faulon et de Manish Kushwaha.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Structure et Dynamique des Systèmes Vivants (Gif-sur-Yvette, Essonne) , en partenariat avec MICALIS- Microbiologie de l'Alimentation au service de la santé humaine (laboratoire) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 02-09-2018 .


  • Résumé

    L'acide sinapique et le sinapoyl malate sont des molécules présentes dans les plantes ayant des propriétés anti-UV. Ces molécules sont utilisées dans l'alimentation mais aussi par l'industrie cosmétique en raison de la demande croissante de formulations anti-UV utilisées dans les crèmes solaires. Les esters de sinapate peuvent être extrais à partir de plantes mais leurs bioproduction par voie microbiennes minimise l'impacte sur l'environnement. Le projet vise à mettre en œuvre et à optimiser une voie recombinante d'esters de sinapate dans E. coli en utilisant un pipeline de conception-construction-test-apprentissage. La voie sera prédite par des outils d'analyse de rétrosynthèse comme RetroPath 2.0 et ses enzymes associés à la voie seront testés. Des systèmes acellulaires seront utilisés pour évaluer la concentration de l'acide sinapique ou du sinapoyl malate sous différentes stœchiométries d'expressions géniques. A cette fin, un biosenseur sera conçu afin de quantifier la production d'esters de sinapate parmi les variants génétiques. Le biosenseur sera utilisé pour cribler un grand nombre de différentes séquences d'éléments de transcription (Promoteur + RBS) et différentes séquences codantes (CDS) pour les enzymes nécessaires à la bioproduction. De plus, différentes concentrations de plasmides seront aussi testés. Enfin, un apprentissage machine profond sera développé et utilisé pour prédire les goulots d'étranglement et pour établir une relation entre les séquences plasmidiques et les concentrations des esters de sinapate. Cette relation sera utilisée pour proposer de nouvelles constructions devant être testées dans le cycle itératif de "conception-construction-test-apprentissage".

  • Titre traduit

    A CELL-FREE ACTIVE-LEARNING PIPELINE TO QUANTIFY AND OPTIMIZE SINAPIC ACID AND SINAPOYLMALATE BIOPRODUCTION


  • Résumé

    Sinapic acid and sinapoylmalate are molecules found in plants with a considerable anti-UV property. These molecules have a potential application for food and, principally, cosmetic industries due to the increasing demand of anti-UV formulations such as sun-creams. The current production of sinapate esters from plants is dispendious and the search of microbial factories will make its synthesis feasible to the industry. The project aims to implement and optimize a recombinant pathway of sinapate esters in E. coli using a design-build-test-learn pipeline. The pathway will be predicted by retrosynthesis analysis tools such as RetroPath 2.0 and its respective enzymes subsequently tested. Furthermore, cell-free systems will be used to assess the yield of the pathway to produce sinapic acid or sinapoylmalate under different stoichiometries of enzyme expression. A biosensor will be conceived for the cell-free system to quantify the production of sinapate esters among the genetic variants. The assay will be performed to screen the influence of different sequences of transcription elements (Promoter+RBS) and different coding sequences (CDS) for the enzymes on the production. Additionally, the constructed plasmids will also be analyzed ata different concentrations. Thus, a certain number of combinations of genetic elements and DNA concentrations will be ranked by sinapic acid or sinapoylmalate production mediated biosensor detection. Finally, a machine learning analysis will be employed to predict the bottlenecks and to infer the relationship between DNA sequences and sinapate ester titers. The relationship between titer and sequence will provide the features required to re-design a novel set of combinations to be tested in the “design-build-test-learm" cycle again.