Cartographie topographique générative : un outil puissant pour la visualisation, l'analyse et la modélisation de données chimiques volumineuses

par Arkadii Lin

Thèse de doctorat en Chemoinformatique

Sous la direction de Alexandre Varnek.

Soutenue le 16-09-2019

à Strasbourg , dans le cadre de École doctorale Sciences chimiques (Strasbourg ; 1995-....) , en partenariat avec Chimie de la matière complexe (Strasbourg) (laboratoire) .

Le président du jury était Matthieu Montes.

Le jury était composé de Alexandre Varnek, Matthieu Montes, Jürgen Bajorath, Bernd Beck, Didier Rognan.

Les rapporteurs étaient Matthieu Montes, Jürgen Bajorath.


  • Résumé

    Cette thèse concerne l'utilisation de Cartographie Topographique Générative (Generative Topographie Mapping - GTM) pour l'analyse, la visualisation et la modélisation de grands volumes de données chimiques. Les principaux sujets traités dans ces travaux sont le criblage virtuel multi-cibles dans la conception de médicaments et la visualisation, l'analyse et la comparaison de grandes chimiothèques. Plusieurs développements méthodologiques ont été proposés : (1) un algorithme de zoom hiérarchique automatisé pour la GTM afin d'aider à résoudre le problème de la résolution des cartes ; (i1) un protocole d'extraction automatisé des Sous-structures Maximum Communes (MCS) pour améliorer l'efficacité de l'analyse de données ; (iit) un criblage contraint basé sur la GTM permettant de détecter les molécules avec un profil pharmacologique souhaité, et (iv) une technique de GTM parallèle, qui réduit significativement le temps nécessaire pour construire une carte. Les méthodologies développées ont été implémentées sous forme de logiciel, utilisé à la fois dans des projets académiques (Université de Strasbourg, France) et industriels (Compagnie Boehringer lngelheim Pharma, Allemagne)

  • Titre traduit

    Generative topographic mapping : a powerful tool for big chemical data visualization, analysis and modeling


  • Résumé

    This thesis concerns the application of the Generative Topographic Mapping (GTM) approach to the analysis, visualization, and modeling of Big Data in chemistry. The main topics covered in this work are multi-target virtual screening in drug design and large chemical libraries visualization, analysis, and comparison. Several methodological developments were suggested: (i) an automatized hierarchical GTM zooming algorithm helping to resolve the map resolution problem; (ii) an automatized Maximum Common Substructure (MCS) extraction protocol improving efficiency of data analysis; (iii) constrained GTM-based screening allowing to detect molecules with a desired pharmacological profile, and (iv) a parallel GTM technique, which significantly increases the speed of GTM training. Developed methodologies were implemented in a software package used in both academic (University of Strasbourg, France) and industrial (Boehringer Ingelheim Pharma company, Germany) projects.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Strasbourg. Service commun de la documentation. Bibliothèque électronique 063.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.