Évolution des préférences d'usage de codons et manipulation de la fidelité de la traduction

par Fanni Borveto

Thèse de doctorat en Biologie Santé

Sous la direction de Ignacio González bravo.

Thèses en préparation à Montpellier , dans le cadre de Sciences Chimiques et Biologiques pour la Santé , en partenariat avec MIVEGEC - Maladies Infectieuses et Vecteurs : Ecologie, Génétique, Evolution et Contrôle (laboratoire) .


  • Résumé

    Les cellules eucaryotes contiennent une machinerie cellulaire complexe, qui contrôle l'expression des gènes. Le code génétique qui est à la base de cette ligne de production est dégénéré, ce qui signifie que 64 codons (trois bases consécutives) codent pour 24 acides aminés. Cela donne lieu à des codons synonymes, qui codent pour le même acide aminé. Les codons synonymes ne sont pas utilisés au hasard, les gènes, les tissus et les organismes ont tendance à avoir des préférences d'utilisation des codons (CUPrefs) divergentes. Le rôle des CUPrefs et les forces qui les façonnent ne sont pas encore clairs, mais il est certain qu'ils occupent une position importante dans l'expression des gènes. Si les CUPrefs d'un gène correspondent au pool d'ARNt, la traduction sera rapide et efficace, tandis qu'une correspondance insuffisante ou excessive des CUPrefs peut entraîner une traduction lente et imprécise ou une compétition entre les gènes pour des ressources telles que les ARNt et les ribosomes. Les virus sont dépendants des ressources de la cellule hôte pour exprimer leurs gènes, l'étude de leurs CUPrefs est donc primordiale pour comprendre leur fonctionnement et leurs interactions avec l'hôte. Dans ce travail, nous tentons d'élargir notre compréhension de l'importance des CUPrefs en analysant les causes et les conséquences des CUPrefs chez les eucaryotes et les virus, et dans une expérience d'évolution à long terme. Pour commencer, nous avons analysé 11 Papillomavirus (PV) recombinants qui infectent exclusivement des Cétacés, ainsi que d'autres PV qui infectent le même ordre d'hôtes : les Cetartiodactyles. Nous avons constaté que les PV recombinants ne sont pas différents des non- recombinants en termes de CUPrefs. Au contraire, les CUPrefs sont associés au type de gène. Elles ne correspondent pas non plus aux CUPrefs de l'hôte, ce qui laisse supposer une stratégie d'évasion immunitaire consistant à maintenir une faible expression des protéines virales du au décalage entre les CUPrefs. Ensuite, nous avons examiné l'évolution des CUPrefs dans le Polypyrimidin tract binding protéin (PTBP) et ses trois paralogues chez les vertébrés. Ces paralogues présentent des CUPrefs distincts, avec un enrichissement en GC lié à des forces mutationnelles locales dans PTBP1 chez les mammifères. Nous proposons que la composition nucléotidique divergente des PTBP est le résultat d'une évolution par sous-fonctionnalisation lors de la duplication des gènes, et qu'elle est liée aux modèles d'expression des gènes dans différents tissus. Dans une manip d'évolution expérimentale, nous avons introduit des gènes synonymes (qui ne diffèrent que par leurs CUPrefs) dans des cellules HEK293, et nous les avons laissé évoluer sous trois types de traitement pendant une centaine de générations. Nous avons constaté que lorsque les gènes hétérologues sont directement soumis à la sélection, les cellules surmontent le décalage des CUPrefs et, malgré les différences, convergent vers un modèle d'expression similaire. En revanche, 6lorsque les gènes modifiés font l'objet du hitchiking génétique, les mécanismes de régulation conduisent à des profils d'expression différents afin de limiter le coût métabolique. Dans l'ensemble, nous avons constaté que les CUPrefs jouent un rôle dans la régulation de l'expression des gènes en fonction du moment ou du lieu de leurs expression, comme on l'observe à la fois chez les PVs de et chez les vertébrés. Pendant ce temps, les cellules eucaryotes peuvent s'adapter rapidement par des mécanismes de régulation complexes pour surmonter les désavantages des CUPrefs hétérologues s'ils sont nécessaires à la survie, ou les inhiber si leur expression est coûteuse.

  • Titre traduit

    Evolution of codon usage preferences and manipulation of translation accuracy


  • Résumé

    Eukaryotic cells contain a complex cellular machinery, that regulates and carries out gene expression. The standard genetic code that is the basis of this protein production line is redundant, meaning that 64 codons encode for 20 amino acids. This redundancy gives rise to synonymous codons, that encode for the same amino acid. Synonymous codons are not used at random, genes, tissues and organisms tend to have divergent Codon Usage Preferences (CUPrefs). The role of CUPrefs and the forces that shape them are not yet clear, although it is certain that they hold an important regulatory position in gene expression. If a gene's CUPrefs match the cellular tRNA pool, translation will be fast and efficient, while under- or overmatching CUPrefs may cause either slow and inaccurate translation or competition among genes for resources. Viruses are dependent of the host cell's resources to express their genes, therefore the study of their CUPrefs is primordial to understand their functioning and interactions with the host. In this work, we attempt to enlarge our understanding of the importance of CUPrefs by analyzing the causes and consequences of CUPrefs in eukaryotes and viruses, and in a long-term evolution experiment. First, we analyzed eleven recombinant Papillomaviruses (PV) that infect exclusively Cetaceans, along with other PVs that infect the same host order: the Cetartiodactyles. We found that recombinant PVs, are not different from non-recombinants in terms of CUPrefs. Instead CUPrefs are associated to gene type, with a link to gene function, and expression pattern. They do not match host CUPrefs, hinting to an immune evasion strategy by keeping low viral gene expression due to the undermatch. Next, we looked at the evolution of CUPrefs in the three paralogs in vertebrates encoding for the Polypyrimidin tract binding protein (PTBP). The PTBP paralogs show distinct CUPrefs, with a GC enrichment linked to local mutational forces in PTBP1 in mammals. We propose that the divergent nucleotide composition in PTBPs is a result of evolution by sub- functionalisation upon gene duplication, and that it's linked to gene expression patterns in different tissues. In an experimental evolution setup we introduced synonymous genes (that only differ in CUPrefs) under strong selection for expression into HEK293 cells, and let them evolve under three conditions for a hundred generations. When the heterologous genes under are directly under selection, cells overcome CUPrefs mismatch, and in spite of the differences, converge to a similar expression pattern. In contrast, when the modified genes are subject of genetic hitchhiking, regulatory mechanisms lead to different expression profiles to limit metabolic cost. Overall we show that the CUPrefs play a role in regulating gene expression in terms of its differed time or place. Further, we suggest that Eukaryote cells can adjust rapidly by complex regulatory mechanisms to overcome the disadvantages of heterologous CUPrefs if they are needed for survival, or down-regulate them if their expression is costly.