Découvertes de motifs pertinents pour l'analyse du transcriptome : application à l'insulino-résistance

par Jérémy Besson

Thèse de doctorat en Informatique

Sous la direction de Jean-François Boulicaut et de Sophie Rome.

Soutenue en 2005

à Villeurbanne, INSA .


  • Résumé

    Les nouvelles technologies expérimentales (e. G. , puce à ADN) permettent de collecter de très grands volumes de données. Les méthodes classiques d'analyse de données ne peuvent plus s'appliquer et il y a un besoin crucial en méthodes de fouille de données pour assister les processus d'extraction de connaissances. En s'intéressant à l'analyse de données transcriptomiques, nous proposons d'extraire des hypothèses biologiquement pertinentes au moyen de motifs ensemblistes. Nous avons développé un nouvel algorithme complet d'extraction de tous les concepts formels qui satisfont des contraintes fixées par l'utilisateur. Nous l'avons utilisé sur des données originales et avons identifié de nouveaux gènes cibles du facteur de transcription SREBP1. L'extraction de concepts formels est très sensible au bruit et nous avons étudié leurs extensions pour une gestion maîtrisée des exceptions. Nous améliorons ainsi la portée de notre méthode d'analyse dans des contextes réalistes.


  • Résumé

    Modern experimental techniques enable to gather huge amounts of biological data in a single experiment (e. G. , DNA microarray) and old ways of dealing with data item by item are no longer sustainable. To support knowledge discovery, data mining techniques are crucially needed. Focusing on gene expression data analysis, we propose to extract relevant biological hypothesis from set patterns. We developed a new constraint-based algorithm which computes complete collections of formal concepts satisfying user-defined constraints. We used this algorithm on an original dataset such that new genes regulated by a combination of transcription factors involving the SREBP1 have been found. A fundamental limitation of formal concept discovery concerns its sensitivity to noise. Therefore, we have designed new fault-tolerant pattern types to enhance the applicability of our methodology in various real-life contexts.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XIV-145 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 137-145

Où se trouve cette thèse ?

  • Bibliothèque : Institut national des sciences appliquées (Villeurbanne, Rhône). Service Commun de la Documentation Doc'INSA.
  • Disponible pour le PEB
  • Cote : C.83(2977)
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.