De l'analyse du génome de Pyrococcus abyssi à l'étude de protéines informationnelles : Stratégies de validation et d'exploitation des données en génomique comparative

par Odile Lecompte

Thèse de doctorat en Bioinformatique

Sous la direction de Olivier Poch.

Soutenue en 2002

à l'Université Louis Pasteur (Strasbourg) .


  • Résumé

    Avec la génomique, la quantité et la diversité des séquences se sont considérablement accrues mais, parallèlement, les erreurs de prédiction et d'annotation se multiplient. Nous nous sommes attachés à développer des protocoles d'étude et de validation applicables à l'analyse de génomes ou de familles de protéines. L'annotation et l'analyse du génome de Pyrococcus abyssi, une archée hyperthermophile, a permis la définition d'un schéma général de visualisation et d'étude de données génomiques massives et le développement de la plate-forme logicielle GScope. Nous avons ainsi annoté 1765 gènes protéiques sur le génome de P. Abyssi et étudié leur phylogénie. Cette analyse montre une remarquable diversité du phylome, de nombreux gènes impliqués dans l'hétrotrophie ayant été acquis par transfert horizontal depuis des bactéries. Notre comparaison de 3 génomes complets de Pyrococcus a par ailleurs révélé des éléments responsables de la plasticité génomique des Archaea. Enfin, une méthode originale de détection des véritables orthologues a révélé l'important polymorphisme des Pyrococcus et remet en cause l'hypothèse de l'horloge moléculaire dans cette lignée. La seconde partie de notre travail a été consacrée à l'analyse de protéines informationnelles et s'est appuyée sur la puissance intégrative de l'alignement multiple. Nous avons ainsi pu démontrer le recrutement d'un nouveau domaine responsable de l'activité exonucléase de l'ADN polymérase D. L'étude des conservations différentielles au sein des familles d'aminoacyl ARNt synthétases a par ailleurs abouti à l'identification de cibles d'antibiotiques. Enfin, nous avons répertorié les protéines ribosomiques dans 66 génomes complets. La distribution phylogénétique est particulièrement intéressante chez les Archaea puisque 15% des protéines ribosomiques ont été perdues au cours de l'évolution, constituant le premier exemple d'évolution réductive à l'échelle d'un domaine du vivant.


  • Résumé

    With the advance of genomics, the amount and diversity of available sequences have substantially increased but, in parallel, the errors in prediction and annotation have proliferated in databases. We have emphasised the creation of accurate protocols for data validation and analysis, relevant to the study of genomes or protein families. The annotation and analysis of the Pyrococcus abyssi genome, a hyperthermophilic archaeon, has lead to the definition of a general scheme of visualisation and study of massive genomic data and to the development of the GScope software platform. We have annotated 1765 protein genes in P. Abyssi and analysed their phylogeny. This has revealed a remarkable diversity of the phylome, with numerous genes involved in heterotrophy being acquired by lateral gene transfer from bacteria. Our comparison of 3 complete Pyrococcus genomes has deciphered some elements responsible for the genomic plasticity at work in Archaea. An original method of true orthologs detection has also been developed, highlighting the high polymorphism within Pyrococcus and challenging the molecular clock hypothesis in this lineage. The second part of our work is dedicated to the in-depth analysis of informational proteins. It largely relies on the exploitation of the integrative view offered by multiple alignments. We have thus demonstrated the recruitment of a new domain responsible for the exonuclease activity of DNA polymerase D. The analysis of conservation within the 24 families of aminoacyl-tRNA synthetases has also allowed the identification of targets for specific drug design. Finally, we have inventoried the ribosomal proteins in 66 complete genomes. The phylogenetic distribution was particularly interesting in Archaea since it revealed the elimination of 15% of ribosomal proteins in the course of evolution and constitutes the first example of reductive evolution at a primary domain scale.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 267 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.212-232

Où se trouve cette thèse ?

  • Bibliothèque : Université de Strasbourg. Service commun de la documentation. Bibliothèque Blaise Pascal.
  • Disponible pour le PEB
  • Cote : Th.Strbg.Sc.2002;4230
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.