Chimiothèque : vers une approche rationnelle pour la sélection de sous-chimiothèques

par Julie Dubois-Chevalier (Dubois)

Thèse de doctorat en Chimie

Sous la direction de Luc Morin-Allory et de Christel Vrain.

Soutenue le 07-12-2011

à Orléans , dans le cadre de Ecole doctorale Sciences et technologies (Orléans) , en partenariat avec Institut de chimie organique et analytique (Orléans) (laboratoire) .

Le président du jury était Ronan Bureau.

Le jury était composé de Luc Morin-Allory, Christel Vrain, Antoine Cornuejols.

Les rapporteurs étaient Antoine Cornuejols.


  • Résumé

    La sélection de sous-ensembles de molécules diverses est un enjeu très important de la recherche pharmaceutique. En effet, de la qualité de cette sélection, dépendra la découverte efficace d'un médicament. De nombreuses méthodes existent pour répondre à cette demande. Certaines sont basées sur la création de groupes de molécules, d'autres sur le principe de dissimilarité inter-moléculaire. Nous proposons dans ce travail, une nouvelle technique à la croisée de ces méthodes, qui permet d'obtenir des sous-ensembles à la fois divers dans l'espace et représentatifs de l'ensemble initial duquel ils sont extraits. Pour créer cette méthode de sélection, nous avons tout d'abord défini et formalisé mathématiquement un critère de diversité, puis nous nous sommes appuyés sur des heuristiques connues en apprentissage artificiel pour concevoir l'algorithme. Celui-ci a été comparé à d'autres types de sélections de diversité couramment utilisées en chémoinformatique telles que les k-medoïds, Maximum-Dissimilarity, Sphere-Exclusion. La formalisation du critère de diversité nous a enfin permis de proposer un nouveau critère d'évaluation de la qualité des sélections. La méthode et le critère présentées dans ce travail donnent des échantillons divers et représentatifs d'un espace chimique.

  • Titre traduit

    Chemical librairies : towards a rational approach for the selection of sub-libraries


  • Résumé

    The selection of diverse molecules'subsets is a very important stake in the pharmaceutical research. Indeed, the effective discovery of a drug will depend of the quality of this selection. Several methods exist to address this problem. Some of them are based on the creation of groups of molecules, the others on the principle of dissimilarity between chemical compounds. In this work, we propose a new technique, between these two concepts, which allows to obtain subsets, at the same time, diverse in the space and representative from the initial set which they are extracted. First of all, to create this selection method, we defined and formalized mathematically a diversity criterion, then we used heuristics known in machine learning to conceive our algorithm. This one was compared with the other types of diversity selections usually used in chemoinformatic such as k-medoïds, Maximum-Dissimilarity, Sphere-Exclusion. The formalization of the diversity criterion finally allowed us to propose a new criterion of evaluation of the quality of the selections. The algorithm and the criterion presented in this work give diverse and representative samples of a chemical space.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Orléans (Bibliothèque électronique). Service commun de la documentation.Division des affaires générales.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.