Codon Usage


Codon Usage (deut. wörtlich Codongebrauch), auch Codon Bias, beschreibt das Phänomen, dass Varianten des universellen genetischen Codes von verschiedenen Spezies unterschiedlich häufig verwendet werden. Bestimmte Codons des degenerierten Codes werden bevorzugt benutzt, was letztlich der tRNA-Konzentration innerhalb der Zelle entspricht. Die Codon Usage spielt eine große Rolle bei der Regulation der Proteinbiosynthese. Selten verwendete Codons können die Translation bremsen, während häufig genutzte Codons die Translation beschleunigen können.

Anwendung

Bei der (aus Kostengründen häufig bevorzugten) gentechnischen Produktion menschlicher Proteine in Bakterien achtet man auf die Tatsache, dass das Bakterium, beispielsweise E. coli, über einen anderen codon usage verfügt als der Mensch. Damit die Bakterien das artfremde menschliche Gen ebenfalls schnell und effizient für die Translation ablesen können wie ihre eigenen Gene, wird es gentechnisch verändert. Das Resultat ist eine angepasste Gensequenz, die dem codon usage-Repertoire des Bakterienstamms weitgehend entspricht, aber noch für dasselbe Protein kodiert.

Codon Usage Tabelle

In folgender Tabelle ist die Häufigkeit der Nutzung eines bestimmten Codons pro 1000 Basen einer DNA-Sequenz gezeigt. Verglichen wurde der codon bias des E. coli Sicherheitstamms K12 mit dem der Bäckerhefe und dem des Menschen.[1]

Aminosäure Codon E. coli K12 S. cerevisiae H. sapiens Aminosäure Codon E. coli K12 S. cerevisiae H. sapiens
Valin (V) GUU 16,8 22,1 11,0 Alanin (A) GCU 10,7 21,2 18,4
GUC 11,7 11,8 14,5 GCC 31,6 12,6 27,7
GUA 11,5 11,8 7,1 GCA 21,1 16,2 15,8
GUG 26,4 10,8 28,1 GCG 38,5 6,2 7,4
Leucin (L) CUU 11,9 12,3 13,2 Prolin (P) CCU 8,4 13,5 17,5
CUC 10,5 5,4 19,6 CCC 6,4 6,8 19,8
CUA 5,3 13,4 7,2 CCA 6,6 18,3 16,9
CUG 46,9 10,5 39,6 CCG 26,7 5,3 6,9
Leucin (L) UUA 15,2 26,2 7,7 Serin (S) UCU 5,7 23,5 15,2
UUG 11,9 27,2 12,9 UCC 5,5 14,2 17,7
Phenylalanin (F) UUU 19,7 26,1 17,6 UCA 7,8 18,7 12,2
UUC 15,0 18,4 20,3 UCG 8,0 8,6 4,4
Isoleucin (I) AUU 30,5 30,1 16,0 Threonin (T) ACU 8,0 20,3 13,1
AUC 18,2 17,2 20,8 ACC 22,8 12,7 18,9
AUA 3,7 17,8 7,5 ACA 6,4 17,8 15,1
Methionin (M) AUG 24,8 20,9 22,0 ACG 11,5 8,0 6,1
Aminosäure Codon E. coli K12 S. cerevisiae H. sapiens Aminosäure Codon E. coli K12 S. cerevisiae H. sapiens
Asparaginsäure (D) GAU 37,9 37,6 21,8 Glycin (G) GGU 21,3 23,9 10,8
GAC 20,5 20,2 25,1 GGC 33,4 9,8 22,2
Glutaminsäure (E) GAA 43,7 45,6 29,0 GGA 9,2 10,9 16,5
GAG 18,4 19,2 39,6 GGG 8,6 6,0 16,5
Tyrosin (Y) UAU 16,8 18,8 12,2 Cystein (C) UGU 5,9 8,1 10,6
UAC 14,6 14,8 15,3 UGC 8,0 4,8 12,6
Stopp UAA 1,8 1,1 1,0 Stopp UGA 1,0 0,7 1,6
Stopp UAG 0,1 0,5 0,8 Tryptophan (W) UGG 10,7 10,4 13,2
Asparagin (N) AAU 21,9 35,7 17,0 Serin (S) AGU 7,2 14,2 12,1
AAC 24,4 24,8 19,1 AGC 16,6 9,8 19,5
Lysin (K) AAA 33,2 41,9 24,4 Arginin (R) AGA 1,4 21,3 12,2
AAG 12,1 30,8 31,9 AGG 1,6 9,2 12,0
Histidin (H) CAU 15,8 13,6 10,9 Arginin (R) CGU 21,1 6,4 4,5
CAC 13,1 7,8 15,1 CGC 26,0 2,6 10,4
Glutamin (Q) CAA 12,1 27,3 12,3 CGA 4,3 3,0 6,2
CAG 27,7 12,1 34,2 CGG 4,1 1,7 11,4

Codon Adaption Index (CAI)

Der Codon Adaption Index (CAI, „Codon-Adaptions-Index“) beschreibt, wie gut die Codons eines heterolog exprimierten Gens der Codon Usage des Wirtsorganismus entsprechen. Ein CAI von 1,0 wäre optimal, ein CAI > 0,9 ist sehr gut, d. h. er erlaubt einen hohen Expressionslevel.

Quellen

  1. Daten aus der Codon Usage Database, die ihrerseits die NCBI-GenBank-Daten nutzt.

Weblinks