Analyse de genomes microbiens, apports de la classification pyramidale

par JEAN-CHRISTOPHE AUDE

Thèse de doctorat en Sciences biologiques et fondamentales appliquées. Psychologie

Sous la direction de Edwin Diday.

Soutenue en 1999

à Paris 9 .

    mots clés mots clés


  • Résumé

    Cette these s'inscrit dans le cadre des methodes d'analyse de donnees, plus particulierement de la classification automatique. La forte augmentation des performances des systemes de sequencage automatique a contribue a la croissance exponentielle de la taille des banques de sequences nucleiques et proteiques. Les sequences completes d'une dizaine de genomes microbiens sont ainsi deja disponibles. Les informations contenues dans ces banques permettent d'envisager une classification globale des genes, ce qui apporte une connaissance fondamentale sur l'organisation, l'evolution et la fonction. L'analyse par des moyens traditionnels ne peut plus repondre aux exigences d'une analyse systematique. L'objet de cette these est la conception et l'implementation d'un ensemble de methodes permettant la classification inter- et intra- genomes. Ces methodes sont multiples, nous nous sommes plus particulierement focalise sur : _ la determination d'un indice de dissimilarite entre les sequences proteiques. Ceci nous a conduit a definir de nouvelles methodes d'estimation de la qualite d'un score par une etude approfondie sur le z-score. _ le classification pyramidale diday84, est une methode de classification permettant la creation d'un recouvrement de l'ensemble des individus. Dans ce recouvrement, chaque individu ne peut appartenir au plus qu'a deux ensembles. Nous presentons l'interet de cette methode pour la detection de structures multi-domaine simples. Enfin, nous presentons un algorithme de construction pyramidale par optimisation de la matrice robinsonienne, utilisant les regressions isotones. _ une methode de classification composite, qui consiste a utiliser l'algorithme du lien simple, puis a effectuer une classification hierarchique des sous-graphes obtenus, et enfin realiser une classification pyramidale sur chaque composante. Ce travail est complete par la presentation des resultats induits par la methode, les premieres lois de la genomique slonimski98. Pour cette etude, nous avons implemente plusieurs outils informatiques : platoo, une bibliotheque de fonctions c permettant l'analyse des resultats de comparaisons de sequences produits par lassap ; j/drawpyr, des programmes ecris en langages c et java permettant le dessin et la manipulation interactive des representations pyramidales.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 200 p.
  • Annexes : 120 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.