Thèse en cours

Apprentissage multimodal phénotypique et basé sur la structure pour une sélection efficace de composés pour la découverte de médicaments.

FR  |  
EN
Auteur / Autrice : Ethan Cohen
Direction : Auguste Genovesio
Type : Projet de thèse
Discipline(s) : Bioinformatique et biologie des systèmes
Date : Inscription en doctorat le 01/09/2021
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Complexité du vivant
Partenaire(s) de recherche : Laboratoire : Institut de Biologie de l'École Normale Supérieure
Equipe de recherche : Bioimagerie computationnelle et bioinformatique
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....)

Résumé

FR  |  
EN

La stratégie principale actuelle de découverte de molécules à visée thérapeutique repose sur la connaissance d'une cible, dont on cherche à moduler l'action grâce à l'identification de composés par criblage. Une autre stratégie, l'approche phénotypique, propose d'identifier d'abord des modulateurs d'un effet détectable au niveau cellulaire, également par criblage, avant d'identifier la cible de ces modulateurs. Bien que ces approches soient radicalement différentes, le choix de la librairie de molécules destinées au criblage joue dans les deux cas un rôle essentiel. Afin d'enrichir ces librairies, l'efficacité reconnue des méthodes de deep learning ont récemment stimulé l'émergence de méthodes de design de molécules destinées au criblage pharmacologique. Étant donné l'immensité de l'espace chimique, ces méthodes, pour être utiles, doivent contraindre l'aléa et donc être guidées par un objectif comme l'optimisation des fonctions ou des propriétés de composés existants. Ce processus va donc opérer une augmentation de candidats à partir de structures moléculaires préexistantes, ce qui représente un avantage pour la phase d'optimisation de l'approche basée sur la cible. En revanche, ceci ne permet pas d'exploiter le potentiel principal de l'approche phénotypique, puisque celle-ci offre la possibilité d'identifier des molécules dont la cible est inconnue et donc susceptibles d'être modulées par des molécules de structure radicalement différentes. Une approche avec un objectif approprié pour le design de molécules qui serait dédiée au criblage phénotypique fait donc aujourd'hui défaut. Ce projet de thèse propose ainsi d'exploiter l'apprentissage automatique profond de la relation entre les structures de molécules et les phénotypes cellulaires que celles-ci engendrent. Nous proposons donc de développer des modèles génératifs profonds qui copieront d'une part et inverseront d'autre part le processus physique de criblage phénotypique, afin de prédire in fine des structures moléculaires candidates à partir d'images de phénotypes cellulaires. L'impact d'une telle méthode est potentiellement considérable car le criblage phénotypique, bien qu'encore minoritaire dans l'industrie, est déjà porteur d'un nombre nettement plus conséquent de découvertes de composés de nouvelle classe thérapeutique.