Mise au point et utilisation de modèles de chaînes de Markov cachées pour l'étude des séquences d'ADN

par Pierre Nicolas

Thèse de doctorat en Biomathématiques

Sous la direction de Bernard Prum.

Soutenue en 2003

à Evry-Val d'Essonne .


  • Résumé

    Trois domaines d'application des modèles de chaînes de Markov cachées (HMM) pour l'interprétation des génomes bactériens ont été abordés dans cette thèse sous l'angle de l'utilisation d'approches d'estimation non supervisée. Tout d'abord, l'utilisation d'une méthode de segmentation des séquences d'ADN en régions de composition homogène a permis l'identification de transferts génétiques horizontaux chez Bacillus subtilis ainsi que d'autres niveaux d'hétérogénéités liés aux propriétés biologiques des gènes. Ensuite, un logiciel de prédiction de gènes a été développé. Une attention particulière a été portée à la recherche de très petits gènes. Une trentaine de gènes de taille inférieure à 50 acides aminés a ainsi été ajoutée à la vingtaine de petits gènes connus biologiquement chez B. Subtilis. Enfin, un algorithme de Monte-Carlo par chaîne de Markov (MCMC) est proposé pour la sélection bayésienne de modèles adaptés aux motifs des sites de fixation de l'ARN polymérase.


  • Résumé

    Considering the use of self-training approaches, we developed in this thesis three domains in which we applied HMM for the bacterial genome interpretation. First, a segmentation method of DNA sequences into regions of homogeneous composition enables us to identify horizontal gene transfers on the Bacillus subtilis chromosome and also others heterogeneities levels linked to biological properties of genes. Next we developed a gene prediction software and we especially focused on small genes research. Around 30 genes smaller than 50 amino acids have been added to about 20 small genes previously biologically identified on B. Subtilis. Then we proposed a MCMC algorithm for Bayesian model selection in the context of RNA polymerase binding sites modeling.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : x-229 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. [209]-229

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Evry-Val d'Essonne. Service commun de la documentation. Bibliothèque centrale.
  • Consultable sur place dans l'établissement demandeur
  • Cote : 519.233 NIC mis

Cette version existe également sous forme de microfiche :

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.