Codon Usage
Codon Usage (deut. wörtlich Codongebrauch), auch Codon Bias, beschreibt das Phänomen, dass Varianten des universellen genetischen Codes von verschiedenen Spezies unterschiedlich häufig verwendet werden. Bestimmte Codons des degenerierten Codes werden bevorzugt benutzt, was letztlich der tRNA-Konzentration innerhalb der Zelle entspricht. Die Codon Usage spielt eine große Rolle bei der Regulation der Proteinbiosynthese. Selten verwendete Codons können die Translation bremsen, während häufig genutzte Codons die Translation beschleunigen können.
Anwendung
Bei der (aus Kostengründen häufig bevorzugten) gentechnischen Produktion menschlicher Proteine in Bakterien achtet man auf die Tatsache, dass das Bakterium, beispielsweise E. coli, über einen anderen codon usage verfügt als der Mensch. Damit die Bakterien das artfremde menschliche Gen ebenfalls schnell und effizient für die Translation ablesen können wie ihre eigenen Gene, wird es gentechnisch verändert. Das Resultat ist eine angepasste Gensequenz, die dem codon usage-Repertoire des Bakterienstamms weitgehend entspricht, aber noch für dasselbe Protein kodiert.
Codon Usage Tabelle
In folgender Tabelle ist die Häufigkeit der Nutzung eines bestimmten Codons pro 1000 Basen einer DNA-Sequenz gezeigt. Verglichen wurde der codon bias des E. coli Sicherheitstamms K12 mit dem der Bäckerhefe und dem des Menschen.[1]
Aminosäure | Codon | E. coli K12 | S. cerevisiae | H. sapiens | Aminosäure | Codon | E. coli K12 | S. cerevisiae | H. sapiens |
Valin (V) | GUU | 16,8 | 22,1 | 11,0 | Alanin (A) | GCU | 10,7 | 21,2 | 18,4 |
GUC | 11,7 | 11,8 | 14,5 | GCC | 31,6 | 12,6 | 27,7 | ||
GUA | 11,5 | 11,8 | 7,1 | GCA | 21,1 | 16,2 | 15,8 | ||
GUG | 26,4 | 10,8 | 28,1 | GCG | 38,5 | 6,2 | 7,4 | ||
Leucin (L) | CUU | 11,9 | 12,3 | 13,2 | Prolin (P) | CCU | 8,4 | 13,5 | 17,5 |
CUC | 10,5 | 5,4 | 19,6 | CCC | 6,4 | 6,8 | 19,8 | ||
CUA | 5,3 | 13,4 | 7,2 | CCA | 6,6 | 18,3 | 16,9 | ||
CUG | 46,9 | 10,5 | 39,6 | CCG | 26,7 | 5,3 | 6,9 | ||
Leucin (L) | UUA | 15,2 | 26,2 | 7,7 | Serin (S) | UCU | 5,7 | 23,5 | 15,2 |
UUG | 11,9 | 27,2 | 12,9 | UCC | 5,5 | 14,2 | 17,7 | ||
Phenylalanin (F) | UUU | 19,7 | 26,1 | 17,6 | UCA | 7,8 | 18,7 | 12,2 | |
UUC | 15,0 | 18,4 | 20,3 | UCG | 8,0 | 8,6 | 4,4 | ||
Isoleucin (I) | AUU | 30,5 | 30,1 | 16,0 | Threonin (T) | ACU | 8,0 | 20,3 | 13,1 |
AUC | 18,2 | 17,2 | 20,8 | ACC | 22,8 | 12,7 | 18,9 | ||
AUA | 3,7 | 17,8 | 7,5 | ACA | 6,4 | 17,8 | 15,1 | ||
Methionin (M) | AUG | 24,8 | 20,9 | 22,0 | ACG | 11,5 | 8,0 | 6,1 | |
Aminosäure | Codon | E. coli K12 | S. cerevisiae | H. sapiens | Aminosäure | Codon | E. coli K12 | S. cerevisiae | H. sapiens |
Asparaginsäure (D) | GAU | 37,9 | 37,6 | 21,8 | Glycin (G) | GGU | 21,3 | 23,9 | 10,8 |
GAC | 20,5 | 20,2 | 25,1 | GGC | 33,4 | 9,8 | 22,2 | ||
Glutaminsäure (E) | GAA | 43,7 | 45,6 | 29,0 | GGA | 9,2 | 10,9 | 16,5 | |
GAG | 18,4 | 19,2 | 39,6 | GGG | 8,6 | 6,0 | 16,5 | ||
Tyrosin (Y) | UAU | 16,8 | 18,8 | 12,2 | Cystein (C) | UGU | 5,9 | 8,1 | 10,6 |
UAC | 14,6 | 14,8 | 15,3 | UGC | 8,0 | 4,8 | 12,6 | ||
Stopp | UAA | 1,8 | 1,1 | 1,0 | Stopp | UGA | 1,0 | 0,7 | 1,6 |
Stopp | UAG | 0,1 | 0,5 | 0,8 | Tryptophan (W) | UGG | 10,7 | 10,4 | 13,2 |
Asparagin (N) | AAU | 21,9 | 35,7 | 17,0 | Serin (S) | AGU | 7,2 | 14,2 | 12,1 |
AAC | 24,4 | 24,8 | 19,1 | AGC | 16,6 | 9,8 | 19,5 | ||
Lysin (K) | AAA | 33,2 | 41,9 | 24,4 | Arginin (R) | AGA | 1,4 | 21,3 | 12,2 |
AAG | 12,1 | 30,8 | 31,9 | AGG | 1,6 | 9,2 | 12,0 | ||
Histidin (H) | CAU | 15,8 | 13,6 | 10,9 | Arginin (R) | CGU | 21,1 | 6,4 | 4,5 |
CAC | 13,1 | 7,8 | 15,1 | CGC | 26,0 | 2,6 | 10,4 | ||
Glutamin (Q) | CAA | 12,1 | 27,3 | 12,3 | CGA | 4,3 | 3,0 | 6,2 | |
CAG | 27,7 | 12,1 | 34,2 | CGG | 4,1 | 1,7 | 11,4 |
Codon Adaption Index (CAI)
Der Codon Adaption Index (CAI, „Codon-Adaptions-Index“) beschreibt, wie gut die Codons eines heterolog exprimierten Gens der Codon Usage des Wirtsorganismus entsprechen. Ein CAI von 1,0 wäre optimal, ein CAI > 0,9 ist sehr gut, d. h. er erlaubt einen hohen Expressionslevel.
Quellen
- ↑ Daten aus der Codon Usage Database, die ihrerseits die NCBI-GenBank-Daten nutzt.