Fouille de graphes pour la découverte de contrastes entre classes : application à l'estimation de la toxicité des molécules

par Guillaume Poezevara

Thèse de doctorat en Informatique et applications

Sous la direction de Bruno Crémilleux et de Bertrand Cuissart.

Soutenue en 2011

à Caen .


  • Résumé

    Cette thèse porte sur la fouille de graphes et propose un ensemble de méthodes pour la découverte de contrastes entre classes et leurs contributions à des problématiques de prédictions de propriétés (éco)toxicologiques de composés chimiques. Nous présentons un nouveau type de motifs, les motifs émergents de graphes – les conjonctions de graphes dont la présence est liée à la classification donnée en entrée – afin de cibler l'information caractérisant les différentes classes. Notre méthode repose sur un changement de description des graphes permettant de revenir à un contexte de fouille de données tabulaires. L'étendue des contraintes utilisées en fouille de données tabulaires peut ainsi être exploitée, telle que la contrainte d'émergence. Nous montrons également qu'il est possible d'étendre aux motifs de graphes les représentations condensées de motifs sur la contrainte d'émergence. Cette méthode synthétise les motifs de graphes et facilite leur exploration et leur usages. Le fil conducteur de ce travail est celui de l'évaluation de propriétés (éco)toxicologiques de molécules par l'usage de modèles in silico, conformément à la norme européenne REACH. Dans ce contexte, les méthodes de fouille de graphes proposées permettent d'extraire des toxicophores (i. E. Des fragments de molécules qui peuvent influencer le comportement toxique des molécules) à partir des exemples d'une chimiothèque. Une série expérimentale montre l'apparition de nouvelles structures lorsque le niveau de toxicité des molécules augmente. Ces travaux contribuent à l'acquisition de nouvelles connaissances sur les mécanismes de toxicité des molécules venant compléter les connaissances expertes humaines.

  • Titre traduit

    Graph data mining to discover contrasts between classes : application to predictive (eco)toxicology


  • Résumé

    This thesis deals with graph mining and proposes methods to discover contrasts between classes and applications to predictive (eco)toxicology. We present a new kind of patterns, the emerging graphs patterns – graphs conjunctions whose presence is linked to a given classification – in order to capture contrasts between classes embedded in graph data. Our method is based on a change of graphs description allowing to come back to a tabular data mining context. The broad of data mining constraints can then be applied and we especially use the emerging constraint. We also show how to extend to the graphs the condensed representation of graph patterns according to the emerging constraint. We use closed patterns and the inclusion relation between graphs to respectively reduce the number and average size of the extracted patterns. This method summarizes graph patterns and make easier their exploration and uses. The thread of this research is about the assessment of the molecular (eco)toxicological properties using in silico models, following the Registration, Evaluation, Autorisation and Restriction of Chemicals European standard. In this context, the graph data mining methods allow to automatically extract sets of toxicophores (i. E. Molecular fragments that can influence the chemical toxic behavior) from the examples given in a chemical library. An experimental series shows the appearance of new fragments when the chemical toxicity level increases. Those research contribute to the acquisition of a new knowledge on chemicals toxicity mechanisms completing human' s expertise on that field.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (p.)
  • Annexes : Bibliogr. p. 137-149. Index

Où se trouve cette thèse ?

  • Bibliothèque : Université de Caen Normandie. Bibliothèque universitaire Sciences - STAPS.
  • Non disponible pour le PEB
  • Cote : TCAS-2011-79
  • Bibliothèque : Université de Caen Normandie. Bibliothèque universitaire Sciences - STAPS.
  • Disponible pour le PEB
  • Cote : TCAS-2011-79bis
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.