Prédiction de la localisation cellulaire des protéines à l'aide de leurs séquences biologiques

par Hugues Richard

Thèse de doctorat en Mathématiques appliquées à la biologie

Sous la direction de François Képès.

Soutenue en 2005

à Evry-Val d'Essonne .


  • Résumé

    Les compartiments cellulaires, de par les frontières membranaires qui les définissent, permettent l'accomplissement de taches métaboliques diverses au sein de la cellule. Cette spécialisation en domaines intracellulaires induit donc une différentiation dans la fonction des protéines qui les composent. Le grand nombre de gènes orphelins produits ces dernières années par les projets de séquençages motive la mise au point de méthodes efficaces pour la prédiction ab-initio de la localisation cellulaire des protéines. Ainsi la majorité de ce travail de thèse s'intéresse au problème de la prédiction du compartiment cellullaire d'une protéine à partir de sa séquence primaire. Nous nous sommes attachés à proposer des alternatives descriptives aux méthodes existantes de prédiction de la localisation cellulaire en utilisant : (1) de nouveaux descripteurs issus de la séquence nucléique, (2) une approche par chaînes de Markov cachées (CMC) et arbres de décision. L'approche par CMC est justifiée biologiquement a posteriori car elle permet la modélisation de signaux d'adressage conjointement à la prise en compte de la composition globale. En outre, l'étape de classification hiérarchique par arbre améliore nettement les résultats de classification. Les résultats obtenus lors des comparaisons avec les méthodes existantes et utilisant des descripteurs fondés sur la composition globale possèdent des performances similaires


  • Résumé

    Cellular compartments, due to the membrane frontiers they induce, allow the realization of diverse metabolic tasks in the cell. This specialization of the cell's spatial domains directly corresponds to a differentiation in the functional role of the proteins has become an important problem. Thus the major part of the work presented here concerns the pmrediction of the subcellular localization of a protein, knowing its primary or coding sequence. We proposed descriptive alternatives to existing methods for predicting subcellular localization by : (1) using new descriptors from nucleotidic sequence and (2) an HMM approach combined with decision trees. The HMM approach is justified biologically in that it permits to modelize biological adressing signals conjointly with global composition. Furthermore, embedding the classification steps within a decision tree sllightly improved classification results, whose accuracy is similar with other methods using global composition information.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (189 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Notes bibliogr. en fin de chaque chapitre

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Evry-Val d'Essonne. Service commun de la documentation. Bibliothèque centrale.
  • Disponible pour le PEB
  • Cote : 519.233 RIC pre
  • Bibliothèque : Université de Lorraine. Bibliothèque de mathématiques de l'Institut Elie Cartan de Lorraine.
  • PEB soumis à condition
  • Cote : Th RICHARD p
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.