Approches hybrides en modélisation logique et numérique du métabolisme des écosystèmes microbiens.

par Maxime Lecomte

Projet de thèse en Informatique

Sous la direction de David Sherman et de Hélène Falentin.

Thèses en préparation à Bordeaux , dans le cadre de École doctorale de mathématiques et informatique , en partenariat avec LaBRI - Laboratoire Bordelais de Recherche en Informatique (laboratoire) et de Bench to Knowledge and Beyond (BKB) (equipe de recherche) depuis le 09-11-2020 .


  • Résumé

    Les grandes communautés de microorganismes (microbiotes) constituent des systèmes complexes dont la variabilité des interactions, notamment métaboliques, qui les gouvernent est encore méconnue. La modélisation informatique de ces interactions et l'identification de configurations biologiquement pertinentes des systèmes entraine une explosion combinatoire à laquelle il est possible de répondre par la résolution de problèmes d'optimisation. Ces derniers permettent d'isoler, dans un grand espace de recherche, des interactions entre organismes ou des sous-communautés d'intérêt compatibles avec les observations biologiques. En particulier, une problématique importante dans l'étude de telles communautés d'organismes est le passage à l'échelle de méthodes de calcul qui ont été appliquées, jusqu'à récemment, uniquement à des organismes individuels. Des approches logiques en programmation par ensembles réponses (ASP) se sont révélées être des proxys pertinents pour représenter des phénomènes biologiques liés au métabolisme [1], [2] et ont été la base de problèmes d'optimisations visant à améliorer les modèles existant du métabolisme des espèces [3], [4]. Ces méthodes logiques, complémentaires aux modèles numériques, permettant notamment un passage à l'échelle (grandes bases de connaissances, nombreux modèles individuels considérés) lors des problèmes d'optimisation. Les méthodes numériques permettent quant à elles des prédictions plus précises et quantitatives des évolutions des systèmes considérés. Modélisations numérique et logique ont déjà été combinées pour traiter des problèmes d'optimisation liés au métabolisme [5]. Le contexte applicatif de ce projet est l'étude du fonctionnement des grandes communautés en biologie et en écologie des systèmes, rendue possible par le déferlement de données de séquençage en métagénomique. L'étude de ces microbiotes et la compréhension des mécanismes qui les régissent sont des sujets d'importance en santé, environnement, agroalimentaire ou encore agroécologie. La modélisation du métabolisme est particulièrement pertinente pour aborder le fonctionnement de ces communautés. Cette thèse vise à définir sous forme de nouveaux modèles hybrides, les contraintes logiques et numériques nécessaires pour répondre aux besoins de représentation du fonctionnement des communautés à grande échelle. Un second objectif est de coupler ces modèles à la définition de problèmes d'optimisation adéquats à la réalité biologique sous-jacente. Il conviendra de confronter ces modèles à des pouvoirs d'expression proposés par un cadre formel flexible déjà existant [6], [7]. Enfin, le·la candidat·e proposera des solutions de calcul passant à l'échelle pour une résolution efficace des problèmes d'optimisation combinatoire. Il·elle utilisera le paradigme de programmation ASP couplé à l'utilisation de solveurs parallèles pour la gestion des contraintes linéaires ou des équations différentielles ordinaires utilisée dans ses modèles.

  • Titre traduit

    Hybrid approaches for logical and numerical modeling of the metabolism of large communities


  • Résumé

    Microbial communities (microbiota) constitute complex systems whose interactions, in particular metabolic interactions, are governed by a variability that is still poorly understood. Computer modeling of these interactions and the identification of biologically-pertinent system configurations produces a combinatorial explosion, that nonetheless can be addressed through the resolution of optimization problems. These problems explore very large search spaces to find interactions between organisms and interesting sub-communities that are compatible with biological observations. An important challenge in the study of real-world microbial communities is scaling up computational methods that have, up to now, only been applied to individual organisms. Answer set programming (ASP) is one kind of logical approach that has proved particularly pertinent for representing the biological phenomena encountered in metabolism [1], [2] and provides the basis for optimization problems that aim at improving existing models of species-level metabolism [3], [4]. These logical methods complement numerical methods. They provide a means to scale up optimization approaches, notably to large knowledge bases and to large numbers of individual models to be considered. Numerical and logical modeling have previously been combined in order to handle optimization problems derived from metabolism [5]. The applicative context of this project is the study of large communities in systems biology and in systems ecology, made possible by the tidal wave of sequencing and metagenomic data. The study of these microbiota and the understanding of the mechanisms that underly them are subjects of great importance in health, environment, food sciences, and agroecology. Metabolic modeling is particularly pertinent for analyzing the behavior of these communities. This thesis aims to define, by means of novel hybrid models, logical and numerical constraints that can represent the large-scale behavior of microbial communities. A second objective is to couple these models with the definition of optimization problems that meet the needs of the underlying biological problems. We will use these models to evaluate the expressive power of an existing formal framework [67], [7]. Finally, the doctoral student will propose scaleable computational strategies for efficient resolution of combinatorial optimization problems. He or she will use the ASP paradigm, coupled with parallel solvers of linear contraints and of ordinary differential equations used in these models.