Le score local : un outil pour l'analyse de séquences biologiques

par Marie-Pierre Étienne (Etienne)

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Pierre Vallois.


  • Résumé

    Les molécules biologiques que sont l'ADN, les différents ARN et les protéines sont à la base des mécanismes du vivant. On peut les considérer comme de longues séquences écrites à l'aide d'un alphabet A fini. Une des méthodes pour analyser l'information contenue dans ces séquences consiste à attribuer un poids appelé score à chaque composant élémentaire. Le score global de la séquence est alors la somme des scores élémentaires et le score local est le maximum des scores de toutes les sous séquences. Le problème statistique qui se pose est d'évaluer le niveau de significativité du score local obtenu. Pour répondre à cette question, on se place sous l'hypothèse nulle Ho qui correspond dans cette étude à considérer les scores élémentaires comme des variables i. I. D. Selon le signe de l'espérance des scores élémentaires, le comportement du score local est totalement différent. On détermine alors la loi asymptotique du score local dans le cas centré. Cette étude complète l'approche proposée par Karlin & al. Et Mercier (espérance négative). Il existe donc une zone de transition de phase lorsque l'espérance est proche de 0 et nous étudions le comportement numérique des différentes approximations dans ce cas.

  • Titre traduit

    ˜The œlocal score : a tool for the analysis of biological sequences


  • Résumé

    For any organism, DNA, RNA and proteins information can be considered as long sequences of letters taken from a finite alphabet A. One way to analyze this information is to assign a weight at each letter (an elementary score). Then, we make the sum over each possible segment and search the segment which realizes the maximal score called the local score. Then the problem is to give a level of significance for this local score. We are led to study the distribution of the local score under the null hypothesis : elementary scores are i. I. D. Random variables. According to the sign of the mean, the behaviour of the local score is widely different. We determine the asymptotic distribution of the local score when random variables are centered. This work completes the asymptotic study of Karlin & al. And Mercier (the negative expectation). In the area of phase transition we study nurnerically the behaviour of the different approximations. Finally we give the rate of convergence of the cumulative distribution function for the local score over a sequence of length n, as n goes to infinity.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (vii-111 p.)
  • Annexes : Bibliogr. en fin de chapitres

Où se trouve cette thèse ?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation et de l'Edition - BU Sciences et Techniques.
  • Disponible pour le PEB
  • Cote : SC N2002 289
  • Bibliothèque : Université de Lorraine. Bibliothèque de mathématiques de l'Institut Elie Cartan de Lorraine.
  • PEB soumis à condition
  • Cote : Th ETIENNE s
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.