Logiciel MPSA et ressources bioinformatiques client-serveur web dédiés à l'analyse de séquences de protéine

par Christophe Blanchet

Thèse de doctorat en Sciences

Sous la direction de Gilbert Deléage.

Soutenue en 1999

à Lyon 1 .

Le jury était composé de Gilbert Deléage.


  • Résumé

    Depuis quelques annees les projets genomes se multiplient et leur duree de realisation diminue. Les genomes connus s'accumulent et permettent deja de mettre en evidence des genes homologues de differentes especes. Il est alors possible de supposer la fonction d'un gene par homologie avec ceux d'autres especes. Car c'est la qu'est le veritable enjeu de tous ces programmes de grand sequencage : identifier les fonctions des proteines codees par ces genes et leurs implications dans les chemins metaboliques. L'analyse de sequence de proteine prend alors tout son sens. En effet, elle essaye d'attribuer aux proteines codees par ces genes une fonction et des caracteristiques a partir des donnees deja connues. Les banques mondiales contenant ces donnees sont de plus en plus grandes et complexes. Les biologistes ont besoin d'outils efficaces pour travailler sur de tres grandes familles de proteines et pour integrer des donnees complexes et correlees. Dans ce contexte, nous avons developpe mpsa (multiple protein sequence analysis) et nps@ (network protein sequence analysis) : un ensemble d'outils et de ressources bio-informatiques dediees a l'analyse de sequences de proteine. Ces logiciels integrent plusieurs methodes necessaires a l'analyse de sequences de proteine comme la recherche de similarites dans les banques, les alignements multiples, les predictions de structures secondaires, les predictions de caracteristiques physico-chimiques. Mpsa integre notamment une methode de recherches de motifs proteiques dans les banques que nous avons mise au point. Cette methode ameliore le rapport signal/bruit lors d'une recherche en privilegiant l'information biologique des motifs. Les resultats de ces diverses methodes sont presentes graphiquement et relies les uns aux autres afin d'accelerer et d'ameliorer les processus d'analyse. Un accent particulier a ete mis sur la convivialite, la simplification et l'automatisation des taches fastidieuses pour l'utilisateur. La conception de mpsa en langage c et l'utilisation de bibliotheques d'une portabilite elevee l'affranchissent des contraintes liees aux architectures materielles (distribue pour unix, mac et pc). Dans un souci de reutilisabilite du code, les differentes methodes ont ete rassemblees dans une bibliotheque c nommee biolcp. Cette librairie portable est disponible pour de nouvelles utilisations par d'autres bio-informaticiens. Elle peut etre obtenue, tout comme mpsa, sur le site web de mpsa (http : //www. Ibcp. Fr/mpsa), qui propose egalement une aide en ligne et les informations sur le developpement de mpsa. L'adjonction d'un module client-serveur http (web) offre a mpsa les potentialites que sont a meme de proposer les grands serveurs biologiques : gestion centralisee des donnees et de leur mise a jour ; grande puissance de calcul. La partie serveur-mpsa, implementee en perl 5, est disponible sur le site web de mpsa et peut alors etre rapatriee et installee sur un serveur local ou un intranet.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (156 p.)
  • Annexes : Bibliogr. p. 109-117

Où se trouve cette thèse ?

  • Bibliothèque : Université Claude Bernard (Villeurbanne, Rhône). Service commun de la documentation. BU Sciences.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.