Structures d'indexation compressées et dynamiques pour le texte

par Mikaël Salson

Thèse de doctorat en Informatique

Sous la direction de Thierry Lecroq.

Soutenue en 2010

à Rouen .


  • Pas de résumé disponible.


  • Résumé

    Les structures d’indexation compressées (SIC) permettent une recherche très rapide dans de grands textes en utilisant un espace inférieur à ceux-ci. L’apparition des SIC en 2000 a autorisé l’indexation de génomes entiers de mammifères. Nous introduisons une méthode qui met à jour une SIC afin de prendre en compte les modifications du texte indexé. À travers des résultats théoriques et pratiques, nous montrons que notre solution est beaucoup plus rapide que la reconstruction complète de la SIC. Nous proposons aussi une méthode pour la recherche de minimum d’une séquence numérique pour un intervalle donné. Celle-ci est plus économe en espace que les autres méthodes et autorise la mise à jour de la séquence. Enfin, pour rechercher des millions de courtes séquences au sein d’un génome, nous proposons une méthode qui augmente significativement le pourcentage de séquences localisées et permet d’identifier les mutations génétiques, par exemple.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (146 p.)
  • Annexes : Bibliogr. p. 137-144. Index

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rouen. Service commun de la documentation. Section sciences site Madrillet.
  • Disponible pour le PEB
  • Cote : 10/ROUE/S042
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.