전공자를 위한 생물학/대학원생을 위한 필수 생물학 개념들

코돈 최적화(Codon Optimization)란? 단백질 발현을 높이는 핵심 전략

단세포가 되고파🫠 2026. 6. 7. 23:39
반응형

 

 

분자생물학이나 단백질 발현 실험을 하다 보면 "코돈 최적화(Codon Optimization)"라는 말을 자주 접하게 돼요. 특히 유전자 합성(Gene Synthesis)을 의뢰하거나 재조합 단백질 생산을 진행할 때는 거의 필수적으로 등장하는 개념이죠.

같은 단백질을 만드는 유전자라도 어떤 생물에서 발현시키느냐에 따라 단백질 생산량이 크게 달라질 수 있어요. 그 차이를 줄이기 위해 사용하는 대표적인 방법이 바로 코돈 최적화예요.

이번 글에서는 코돈 최적화의 원리부터 실제로 사용되는 최적화 방법, 그리고 Gene Synthesis 과정에서 등장하는 Complexity Screening과 Terminal Adapter까지 함께 정리해볼게요.

 


코돈 최적화란 무엇일까?

 

 


DNA는 세 개의 염기 조합인 코돈(codon)을 이용해 아미노산 정보를 전달해요.

예를 들어 류신(Leucine)은 하나의 코돈으로만 암호화되는 것이 아니라 여러 개의 서로 다른 코돈으로 표현될 수 있어요.

문제는 생물마다 선호하는 코돈이 다르다는 점이에요.

사람 세포에서 자주 사용하는 코돈이 있고, 대장균(E. coli)에서 자주 사용하는 코돈이 따로 존재하죠.

만약 사람 유전자를 그대로 대장균에 넣어 발현시키면 대장균이 잘 사용하지 않는 희귀 코돈(rare codon)이 많이 포함될 수 있어요. 이 경우 번역 효율이 떨어지고 단백질 생산량도 감소할 수 있어요.

코돈 최적화는 아미노산 서열은 유지하면서 DNA 서열만 변경해 숙주(host)가 선호하는 코돈으로 바꾸는 과정이에요.

 


왜 단백질 발현량이 증가할까?


세포 안에서는 tRNA가 코돈을 인식해 아미노산을 공급해요.

자주 사용되는 코돈에 대응하는 tRNA는 풍부하게 존재하지만, 드물게 사용되는 코돈에 대응하는 tRNA는 상대적으로 적어요.

희귀 코돈이 많으면 리보솜이 번역 과정에서 자주 멈추게 되고 단백질 생산 효율도 감소하게 돼요.

반대로 숙주가 선호하는 코돈으로 최적화하면 번역 속도가 빨라지고 단백질 생산량도 증가할 수 있어요.

그래서 같은 단백질이라도 코돈 최적화 여부에 따라 발현량이 수 배에서 수십 배 이상 차이 나는 경우도 있어요.

 

반응형


대표적인 코돈 최적화 방법


1. Codon Usage Table 분석

가장 기본적인 방법이에요.

각 생물은 고유한 코돈 사용 빈도를 가지고 있어요.

예를 들어 사람, 마우스, 대장균, 효모는 서로 다른 코돈 사용 패턴을 보이죠.

코돈 사용 빈도 데이터베이스를 이용하면 특정 생물이 어떤 코돈을 선호하는지 확인할 수 있어요.

이를 기반으로 DNA 서열을 재설계하게 돼요.

2. CAI(Codon Adaptation Index)

CAI는 유전자의 코돈 사용 패턴이 숙주의 선호도와 얼마나 유사한지를 수치화한 값이에요.

값은 0~1 사이로 표현되며 1에 가까울수록 숙주 친화적인 코돈 사용을 의미해요.

유전자 합성 업체에서 제공하는 최적화 결과를 보면 종종 CAI 값이 함께 표시되는 이유가 여기에 있어요.

일반적으로 CAI가 높을수록 발현 가능성이 높다고 알려져 있어요.

3. Synonymous Codon Substitution

가장 널리 사용되는 전략이에요.

같은 아미노산을 암호화하는 여러 코돈 중에서 숙주가 선호하는 코돈으로 교체하는 방식이죠.

단백질 서열은 그대로 유지되지만 DNA 서열은 상당히 달라질 수 있어요.

4. Codon Pair Optimization

최근에는 개별 코돈뿐 아니라 코돈 조합 자체도 고려해요.

어떤 코돈 쌍은 번역 효율을 높이고 어떤 조합은 낮추는 것으로 알려져 있어요.

이러한 코돈 페어 바이어스(codon pair bias)까지 반영하면 더욱 정교한 최적화가 가능해져요.

 


GC Content도 중요한 이유


많은 사람들이 코돈만 바꾸면 된다고 생각하지만 실제로는 GC 함량도 중요해요.

GC 비율이 너무 높으면 강한 이차구조가 형성될 수 있고,

반대로 너무 낮으면 DNA 안정성이 떨어질 수 있어요.

특히 PCR 증폭이나 유전자 합성 과정에서도 GC 함량은 중요한 변수예요.

그래서 최신 코돈 최적화 알고리즘은 단순한 코돈 빈도뿐 아니라 GC content까지 함께 조절해요.

 


Complexity Screening이란?


최근 Gene Synthesis 서비스를 이용하면 "Complexity Screening"이라는 항목을 볼 수 있어요.

이는 설계된 DNA 서열에 문제가 될 수 있는 구조가 존재하는지 확인하는 과정이에요.

대표적으로는

Hairpin 구조
반복 서열
극단적인 GC-rich 영역
강한 RNA secondary structure

등을 분석하게 돼요.

이러한 구조는 DNA 합성 효율을 떨어뜨리거나 번역 효율을 감소시킬 수 있어요.

그래서 최적화 과정에서는 단순히 코돈만 바꾸는 것이 아니라 이런 구조적 문제도 함께 제거하게 돼요.

 


Terminal Adapter는 무엇일까?


Gene Synthesis를 주문할 때 Terminal Adapter를 추가하는 옵션을 볼 수 있어요.

Terminal Adapter는 유전자 양 끝에 추가되는 짧은 DNA 서열을 의미해요.

주로 다음과 같은 목적으로 사용돼요.

Restriction enzyme site 추가
Gibson Assembly용 overlap 생성
발현 벡터 클로닝 편의성 향상
Protein tag 삽입
Promoter 또는 Terminator 연결

즉 유전자 자체의 기능을 바꾸기보다는 이후 실험 과정을 편하게 만들어주는 역할을 해요.

 


코돈 최적화가 항상 좋은 것은 아니다


흥미로운 점은 코돈 최적화를 했다고 해서 무조건 발현량이 증가하는 것은 아니라는 점이에요.

일부 단백질은 번역 속도가 너무 빨라지면 오히려 정상적인 folding이 방해될 수 있어요.

또한 mRNA 안정성, RNA 구조, 단백질 독성 등 다양한 요소들이 발현량에 영향을 줄 수 있어요.

그래서 최근에는 단순히 CAI를 최대한 높이는 방식보다는 전체적인 발현 균형을 고려한 설계가 선호되고 있어요.



코돈 최적화는 현대 분자생물학과 단백질 생산 연구에서 거의 필수적인 기술이에요. 단순히 희귀 코돈을 바꾸는 수준을 넘어 CAI, GC 함량, RNA 이차구조, Codon Pair Bias, Complexity Screening까지 고려하는 방향으로 발전하고 있어요.

특히 재조합 단백질 생산, 유전자 치료제 개발, mRNA 플랫폼, 합성생물학 연구가 확대되면서 코돈 최적화의 중요성은 더욱 커지고 있어요. 유전자 서열 하나를 설계하더라도 어떤 숙주에서 발현할 것인지, 어떤 목적의 단백질을 생산할 것인지에 따라 최적화 전략이 달라질 수 있다는 점을 기억해두면 좋아요.

반응형