Apprentissage multimodal phénotypique et basé sur la structure pour une sélection efficace de composés pour la découverte de médicaments.
Auteur / Autrice : | Ethan Cohen |
Direction : | Auguste Genovesio |
Type : | Projet de thèse |
Discipline(s) : | Bioinformatique et biologie des systèmes |
Date : | Inscription en doctorat le 01/09/2021 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Complexité du vivant |
Partenaire(s) de recherche : | Laboratoire : Institut de Biologie de l'École Normale Supérieure |
Equipe de recherche : Bioimagerie computationnelle et bioinformatique | |
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....) |
Mots clés
Résumé
La stratégie principale actuelle de découverte de molécules à visée thérapeutique repose sur la connaissance d'une cible, dont on cherche à moduler l'action grâce à l'identification de composés par criblage. Une autre stratégie, l'approche phénotypique, propose d'identifier d'abord des modulateurs d'un effet détectable au niveau cellulaire, également par criblage, avant d'identifier la cible de ces modulateurs. Bien que ces approches soient radicalement différentes, le choix de la librairie de molécules destinées au criblage joue dans les deux cas un rôle essentiel. Afin d'enrichir ces librairies, l'efficacité reconnue des méthodes de deep learning ont récemment stimulé l'émergence de méthodes de design de molécules destinées au criblage pharmacologique. Étant donné l'immensité de l'espace chimique, ces méthodes, pour être utiles, doivent contraindre l'aléa et donc être guidées par un objectif comme l'optimisation des fonctions ou des propriétés de composés existants. Ce processus va donc opérer une augmentation de candidats à partir de structures moléculaires préexistantes, ce qui représente un avantage pour la phase d'optimisation de l'approche basée sur la cible. En revanche, ceci ne permet pas d'exploiter le potentiel principal de l'approche phénotypique, puisque celle-ci offre la possibilité d'identifier des molécules dont la cible est inconnue et donc susceptibles d'être modulées par des molécules de structure radicalement différentes. Une approche avec un objectif approprié pour le design de molécules qui serait dédiée au criblage phénotypique fait donc aujourd'hui défaut. Ce projet de thèse propose ainsi d'exploiter l'apprentissage automatique profond de la relation entre les structures de molécules et les phénotypes cellulaires que celles-ci engendrent. Nous proposons donc de développer des modèles génératifs profonds qui copieront d'une part et inverseront d'autre part le processus physique de criblage phénotypique, afin de prédire in fine des structures moléculaires candidates à partir d'images de phénotypes cellulaires. L'impact d'une telle méthode est potentiellement considérable car le criblage phénotypique, bien qu'encore minoritaire dans l'industrie, est déjà porteur d'un nombre nettement plus conséquent de découvertes de composés de nouvelle classe thérapeutique.