Traitement parallèle des comparaisons intensives de séquences génomiques

par Van-Hoa Nguyen

Thèse de doctorat en Informatique. Bioinformatique

Sous la direction de Dominique Lavenier.

Soutenue en 2009

à Rennes 1 .


  • Résumé

    La comparaison de séquences est une des tâches fondamentales de la bioinformatique. Les nouvelles technologies de séquençage conduisent à une production accélérée des données génomiques et  renforcent les besoins en  outils rapides et efficaces pour effectuer cette tâche. Dans cette thèse, nous proposons un nouvel algorithme de comparaison intensive de séquences, explicitement conçu pour exploiter toutes les formes de parallélisme présentes dans les microprocesseurs de dernière génération (instruction SIMD, architecture multi-cœurs). Cet algorithme s’adapte également à un parallélisme massif que l’on peut trouver sur des accélérateurs de type FPGA ou GPU. Cet algorithme a été mis en œuvre à travers le logiciel PLAST (Parallel Local Alignment Search Tool). Différentes versions sont disponibles suivant les données à traiter (protéine et/ou ADN). Une version MPI a également été mise au point pour un déploiement sur un cluster de Pcs. En fonction de la nature des données et des technologies employées des accélérations de 3 à 20 ont été mesurées par rapport à la référence du domaine, le logiciel BLAST, pour un niveau de qualité équivalent.

  • Titre traduit

    Parallel computing for intensive comparison of genomic sequences


  • Résumé

    The sequence comparison process is one of the main bioinformatics task.   The new sequencing technologies lead to a fast increasing of genomic data and strengthen the need of fast and efficient tools to perform this task. In this thesis, a new algorithm for intensive sequence comparison is proposed. It has been specifically designed to exploit all forms of parallelism of today microprocessors (SIMD instructions, multi-core architecture). This algorithm is also well suited for hardware accelerators such as FPGA or GPU boards. The algorithm has been implemented into the PLAST software (Parallel Local Alignment Search Tool). Different versions are available according to the data to process (protein and/or DNA). A MPI version has also been developed. According to the nature of the data and the type of technologies, speed-up from 3 to 20 has been measured compared with the reference software, BLAST, with the same level of quality.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (121 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 113-120

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Section sciences et philosophie.
  • Disponible pour le PEB
  • Cote : TA RENNES 2009/65
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.