Alignement avec des familles de séquences protéiques

par Pierre Nicodème

Thèse de doctorat en Informatique

Sous la direction de Jean-Marc Steyaert.

Soutenue en 1997

à Paris 7 .


  • Résumé

    Nous etudions les problemes mathematiques et algorithmiques lies a l'alignement de sequences. Un modele construit sur un schema de scores additif est utilise par les biologistes pour comparer entre elles des sequences d'ADN ou des sequences de proteines. Dans ce modele un score est associe a l'appariement de deux lettres de l'alphabet considere. Karlin et Altschul ont formalise cette approche au moyen d'un modele de marche aleatoire. La loi asymptotique du score de l'alignement optimal est une loi des valeurs extremes. Le modele utilise la factorisation de Wiener-Hopf et l'identite de Spitzer. Nous donnons une demonstration simple dans le cas ou les increments sont discrets, ce qui est le cas des applications biologiques. Nous etudions ensuite le cas ou l'on cherche a aligner un alignement multiple, compose d'un ensemble de sequences prealablement alignees, et une sequence. Nous considerons alors le cas des proteines et construisons des graphes d'alignement qui modelisent le niveau de conservation des acides amines pour les positions de l'alignement multiple. L'alignement optimal recherche correspond a present a un chemin de score maximal dans ces graphes, pour un choix donne des positions relatives de l'alignement multiple et de la sequence. Nous proposons un algorithme qui est une extension de l'algorithme d'alignement sequence a sequence BLAST. Nous verifions experimentalement que la loi des valeurs extremes reste verifiee dans ce cadre etendu. Nous comparons l'efficacite de ce nouvel algorithme avec celles d'algorithmes classiques pour la recherche de similarites. Nous appliquons les resultats obtenus a la base de familles de sequences proteiques PRODOM. Nous utilisons l'approche de Waterman et Vingron pour montrer que la methode des approximations poissonniennes s'applique tres efficacement aux calibrations probabilistes des familles de PRODOM pour cet algorithme


  • Pas de résumé disponible.

Autre version

Alignement avec des familles de séquences protéiques


Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (184 p.)
  • Annexes : 89 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : D-NIC
  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • Accessible pour le PEB
  • Cote : TS1997

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire Joseph-Fourier.
  • Non disponible pour le PEB
  • Cote : MF-1997-NIC
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.
Cette thèse a donné lieu à 1 publication .

Consulter en bibliothèque

à

Informations

  • Sous le titre : Alignement avec des familles de séquences protéiques
  • Détails : 1 vol. (184 p.)
  • Annexes : Bibliogr. p. 181-184
La version de soutenance de cette thèse existe aussi sous forme papier.

Où se trouve cette thèse ?

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.