Analyse in silico des genes d'arabidopsis thaliana : description, classification et modelisation pour aider a la prediction des genes

par CATHERINE MATHE

Thèse de doctorat en Sciences biologiques fondamentales et appliquées

Sous la direction de François Rodolphe.

Soutenue en 2000

à Paris 7 .

    mots clés mots clés


  • Résumé

    Constatant l'insuffisante fiabilite des predictions de genes faites sur le genome d'arabidopsis, nous avons cherche les moyens d'y remedier en enrichissant d'abord nos connaissances sur ces genes. Une methode de classification automatique basee sur la composition en codons de sequences codantes d'arabidopsis a conduit a l'obtention de deux classes de genes : l'une reunit les genes fortement exprimes, et utilisant preferentiellement un c (ou un g) en troisieme base des codons ; l'autre contient des genes preferant un t en troisieme base, a expression faible ou moderee, ou codant pour des proteines des organelles. L'exploitation de ces deux classes a montre qu'utiliser deux modeles de genes dans les strategies de predictions ameliore celles-ci. Une autre etude des sequences codantes visait a identifier les contraintes, autres que celle de codage pour une proteine, qui influencent l'usage du code genetique. Les modeles conditionnes par la traduction etudies, parmi lesquels un modele de markov heterogene, ont confirme l'influence du voisinage proche sur le choix parmi codons synonymes. La contre-selection des dinucleotides cg et ta en positions inter-codons a aussi ete mise en evidence. Une autre conclusion est la ressemblance de composition des sequences codantes en phases non-codantes avec les introns (nuancee par la richesse en t de ceux-ci), et leurs relatives differences avec les sequences intergeniques. Enfin, l'exploitation d'un jeu de donnees propre de genes d'arabidopsis, a permis d'etablir des statistiques generales sur les longueurs et compositions des differents elements des genes ainsi que de mieux etudier certains signaux. Cette analyse exhaustive aboutit donc a une meilleure caracterisation des genes d'arabidopsis, qui devrait permettre d'ameliorer sensiblement les modeles utilises dans les predictions de genes.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 204 p.
  • Annexes : 245 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • Accessible pour le PEB
  • Cote : TS2000
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.