Un cadre formel pour l'annotation experte des gènes eucaryotes

par Sarah Djebali

Thèse de doctorat en Bio-informatique

Sous la direction de Franck Delaplace.

Soutenue en 2006

à Evry-Val d'Essonne .


  • Résumé

    Malgré des avancées considérables dans le domaine de l'annotation automatique des gènes, l'annotateur de référence reste l'expert humain. Nous avons donc développé Exogean, une méthode auatomatique qui suit le même processus que l'expert humain. Pour cela, Exogean utilise des multi-graphes orientés acycliques colorés (DACMs) où les sommets sont des objets biologiques, et les multiples couleurs d'arêtes entre les sommets sont des relations entre ces objets. Les DACMs sont parcourus suivant des chemins qui répliquent les règles suivies par l'expert humain lorsqu'il analyse les données. Le fait que les règles heuristiques utilisées par l'expert soient de diffférentes natures, soient susceptibles d'évoluer au cours du temps et s'appliquent à des ressources de types différents, à fait ressortir le besoin d'un cadre formel à la fois flexible, intuitif et généraique pour l'annotation de gènes. Nous avons donc également développé DACMLan, un langage dédié à l'annotation de gènes fondé sur les DACMs.


  • Résumé

    Despite tremendous advances, automatic gene annotations are considéred as prédictions that require humain validation. We have developped Exogean, a software for annotating gene structures in eukaryotic genomine DNA based on human expertise. Exogean explicitely uses the same heuristic rules that humain biologists use when annotating genes. Consequently Exogean is conceived as a framework that represents the biological objects (exons, transcripts, etc) and the rules that we use to manipulate them. This framework is based on directed acyclic coloured multigraphs (DCAMS), a powerful representation that intuitively models the reasonning followed by human experts. The fact that the heuristic rules used by human experts may change over time, are difficult to express and are applied to heterogeneous data, raised the need for a generic, flexible and intuitive formal framework for gene annotation. We thus also have developed DACMLang, a language dedicated to gene annotation based on DACMs.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (167 p.)
  • Annexes : Bibliogr. p.159-167

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Evry-Val d'Essonne. Service commun de la documentation. Bibliothèque centrale.
  • Consultable sur place dans l'établissement demandeur
  • Cote : 004.015 7 DJE cad
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.