Thèse de doctorat en Chemoinformatique
Sous la direction de Alexandre Varnek.
Soutenue le 16-09-2019
à Strasbourg , dans le cadre de École doctorale Sciences chimiques (Strasbourg ; 1995-....) , en partenariat avec Chimie de la matière complexe (Strasbourg) (laboratoire) .
Le président du jury était Matthieu Montes.
Le jury était composé de Alexandre Varnek, Matthieu Montes, Jürgen Bajorath, Bernd Beck, Didier Rognan.
Les rapporteurs étaient Matthieu Montes, Jürgen Bajorath.
Cette thèse concerne l'utilisation de Cartographie Topographique Générative (Generative Topographie Mapping - GTM) pour l'analyse, la visualisation et la modélisation de grands volumes de données chimiques. Les principaux sujets traités dans ces travaux sont le criblage virtuel multi-cibles dans la conception de médicaments et la visualisation, l'analyse et la comparaison de grandes chimiothèques. Plusieurs développements méthodologiques ont été proposés : (1) un algorithme de zoom hiérarchique automatisé pour la GTM afin d'aider à résoudre le problème de la résolution des cartes ; (i1) un protocole d'extraction automatisé des Sous-structures Maximum Communes (MCS) pour améliorer l'efficacité de l'analyse de données ; (iit) un criblage contraint basé sur la GTM permettant de détecter les molécules avec un profil pharmacologique souhaité, et (iv) une technique de GTM parallèle, qui réduit significativement le temps nécessaire pour construire une carte. Les méthodologies développées ont été implémentées sous forme de logiciel, utilisé à la fois dans des projets académiques (Université de Strasbourg, France) et industriels (Compagnie Boehringer lngelheim Pharma, Allemagne)
Generative topographic mapping : a powerful tool for big chemical data visualization, analysis and modeling
This thesis concerns the application of the Generative Topographic Mapping (GTM) approach to the analysis, visualization, and modeling of Big Data in chemistry. The main topics covered in this work are multi-target virtual screening in drug design and large chemical libraries visualization, analysis, and comparison. Several methodological developments were suggested: (i) an automatized hierarchical GTM zooming algorithm helping to resolve the map resolution problem; (ii) an automatized Maximum Common Substructure (MCS) extraction protocol improving efficiency of data analysis; (iii) constrained GTM-based screening allowing to detect molecules with a desired pharmacological profile, and (iv) a parallel GTM technique, which significantly increases the speed of GTM training. Developed methodologies were implemented in a software package used in both academic (University of Strasbourg, France) and industrial (Boehringer Ingelheim Pharma company, Germany) projects.
Il est disponible au sein de la bibliothèque de l'établissement de soutenance.