Alignement avec des familles de sequences proteiques

par PIERRE NICODEME

Thèse de doctorat en Sciences biologiques et fondamentales appliquées. Psychologie

Sous la direction de Jean-Marc Steyaert.

Soutenue en 1997

à Paris 7 .

    mots clés mots clés


  • Résumé

    Nous etudions les problemes mathematiques et algorithmiques lies a l'alignement de sequences. Un modele construit sur un schema de scores additif est utilise par les biologistes pour comparer entre elles des sequences d'adn ou des sequences de proteines. Dans ce modele un score est associe a l'appariement de deux lettres de l'alphabet considere. Karlin et altschul ont formalise cette approche au moyen d'un modele de marche aleatoire. La loi asymptotique du score de l'alignement optimal est une loi des valeurs extremes. Le modele utilise la factorisation de wiener-hopf et l'identite de spitzer. Nous donnons une demonstration simple dans le cas ou les increments sont discrets, ce qui est le cas des applications biologiques. Nous etudions ensuite le cas ou l'on cherche a aligner un alignement multiple, compose d'un ensemble de sequences prealablement alignees, et une sequence. Nous considerons alors le cas des proteines et construisons des graphes d'alignement qui modelisent le niveau de conservation des acides amines pour les positions de l'alignement multiple. L'alignement optimal recherche correspond a present a un chemin de score maximal dans ces graphes, pour un choix donne des positions relatives de l'alignement multiple et de la sequence. Nous proposons un algorithme qui est une extension de l'algorithme d'alignement sequence a sequence blast. Nous verifions experimentalement que la loi des valeurs extremes reste verifiee dans ce cadre etendu. Nous comparons l'efficacite de ce nouvel algorithme avec celles d'algorithmes classiques pour la recherche de similarites. Nous appliquons les resultats obtenus a la base de familles de sequences proteiques prodom. Nous utilisons l'approche de waterman et vingron pour montrer que la methode des approximations poissonniennes s'applique tres efficacement aux calibrations probabilistes des familles de prodom pour cet algorithme.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 184 p.
  • Annexes : 89 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : D-NIC
  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • Accessible pour le PEB
  • Cote : TS1997
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.