Caractérisation bioinformatique des régions interORF chez la levure : analyse des biais de représentation, de la courbure moyenne prédite et de la conservation au sein du phylum des Hémi-Ascomycètes

par David Abergel

Thèse de doctorat en Sciences biologiques

Sous la direction de Michel Jacquet et de Michel Termier.


  • Résumé

    Les régions interORF sont définies comme étant situées entre deux ORF consécutives. Le but du travail a été de les caractériser, à partir de plusieurs approches bioinformatiques à l’échelle génomique. L’organisme d’étude choisi est principalement la levure S. Cerevisiae, en raison des connaissances acquises liées aux régions interORF. Ce travail s’est donc orienté selon trois axes :1. Une étude statistique des biais de représentation (di- et trinucléotides) qui montre que ces biais concernent uniquement certains mots et que l’on peut les associer à l’appartenance taxonomique de l’organisme étudié2. Une étude de la courbure moyenne (globale et locale) prédite de l’axe de la double-hélice au voisinage de l’ATG, du STOP et des bornes de transcription : la courbure analysée avec une forte granularité est quasiment indiscernable de celle obtenue en étudiant de la même façon des séquences aléatoires respectant les linguistiques des régions concernées. 3. Une étude de la conservation des régions interORF et des ORF dans le phylum des Hémi-Ascomycètes (10 organismes) : elles sont très conservées, particulièrement pour les ORF dites « essentielles » et fortement exprimées. Afin de répondre aux problèmes posés par ces études, j’ai développé deux outils :1. GenomX, logiciel intégré destiné à tout type d’utilisateur, automatisant la plupart des tâches usuelles en bioinformatique et particulièrement utile pour des études à l’échelle génomique. 2. WInGS, un entrepôt de données génomiques sur la levure. Un contrôle interne de la cohérence de l’information est effectué ainsi qu’une intégration de plusieurs bases de données, en traitant les cas de données redondantes et divergentes.

  • Titre traduit

    Bioinformatic characterization of the interORF regions in yeast : analyses of representation, of the predicted average curvature and the conservation within the Hemi-Ascomycetous phylum


  • Résumé

    InterORF regions can be defined as located between two successive ORFs. This work aims at characterizing them, using several bioinformatic genome-scale approaches. The main organism studied is the S. Cerevisiae yeast, since many aspects related to interORF regions are already kown. Analyses have been carried out according to three ways:1. A statistical study of the di- and trinucleotides representation biases, which shows that these biases occur only for several word and that they can be associated with the taxonomy of the concerned species. 2. A study of the predicted average curvature (local and global) of the double-helix axis, close to the ATG, the STOP and the transcription boundaries : the curvature computed with a high granularity is quite the same as the one computed on random sequences, respecting the same linguistics as the studied regions. 3. A study of the conservation in the interORF and coding regions, within the phylum of the Hemi-Ascomycetous (10 species): they are highly conserved, especially for « essential » and highly expressed ORF. In order to resolve the problems generated by this work, I developed two tools :1. GenomX, an integrated software designed to be useful for all kinds of users, making easier the usual tasks in bioinformatics,particularly for genome-scale studies. 2. WInGS, a genomic data warehouse on yeast. An internal control of the information coherence is performed together with an integration of several databases, dealing with redundant and divergent data.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 255 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 199-212

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2004)280
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.