Graphes condensés de réactions, applications à la recherche par similarité, la classification et la modélisation

par Frank Hoonakker

Thèse de doctorat en Chimie. Chémoinformatique

Sous la direction de Alexandre Varnek.

Soutenue en 2008

à Strasbourg 1 .


  • Résumé

    Ce travail est consacré au développement de nouvelles méthodes de fouille de données dans le domaine des réactions en utilisant le concept de Graphe Condensé de Réaction (CGR). Le CGR est un graphe en 2D qui condense l’information contenue dans les réactifs et les produits d’une réaction. Grâce à la présence des liaisons conventionnelles (simples, doubles, etc. ) et dynamiques (coupure d’une liaison simple, transformation d’une double en simple etc. ), le CGR permet de condenser une réaction (incluant plusieurs molécules) en une pseudo-molécule. Ainsi, le CGR permettra d’appliquer des approches de chemoinformatique déjà développées pour les molécules. Trois applications possibles des CGRs ont été exploréees : – la classification non supervisée des réactions basées sur des algorithmes de clustering, – la recherche de réactions par similarité, – la modélisation structure-réactivité (QSRR, Quantitative Structure Reactivity Relationships). Ces méthodes, testées sur quatre bases de données contenant entre 1 000 et 200 000 réactions, ont démontré l’efficacité de l’approche et des logiciels développés. Un système d’optimisation de conditions réactionnelles a ainsi été implémenté et un brevet a été déposé aux États-Unis.

  • Titre traduit

    Condensed graph of reactions, applied to similarity search, classification and modelisation


  • Résumé

    This work is devoted to the developpement of new methods of mining of chemical reactions based on the Condensed Graph of Reaction (CGR) approach. A CGR integrates an information about all reactants and products of a given chemical reaction into one 2D molecular graph. Due to the application of both conventional (simple, double, etc. ) and dynamical (single to double, broken single, etc. ) bond types, a CGR ”condenses” a reaction (involving many molecules) into one pseudo-molecule. This formally allows one to apply to CGRs the chemoinformatics approaches earlier developed for individual compounds. Three possible applications of CGRs were considered: – unsupervised classification of reactions based on clustering algorithms; – reactions similarity search, and – Quantitative Structure Reactivity Relationships (QSRR). Model calculations performed on four databases containing from 1 000 to 200 000 reactions demonstrated high efficiency of the developed approaches and software tools. An system for optimizing reactions condition has been designed, and patented in the USA.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XII-229 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 221-229

Où se trouve cette thèse ?

  • Bibliothèque :
  • Disponible pour le PEB
  • Cote : Th.Strbg.Sc.2008;5647
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.