이번 포스트부터는 DNA 시퀀싱(DNA sequencing)에 대해 알아보자.
DNA sequencing은 다양한 방법으로 수행할 수 있음.
우선 가장 먼저 개발된 Maxam-Gilbert Sequencing method에 대해 알아보자.
보면 이 경우 G 앞을 끊어주는 reaction, A reaction, T reaction, C reaction 등 condition을 달리해가면서 특정한 염기만 끊어지는 환경을 조성해줌. 이후 gel을 내려주게 되면 위 그림 왼쪽과 같은 결과가 나오고, 이 때 아래에서부터 위 순서로 sequence를 읽어나가게 되면 sequencing을 할 수 있게 됨.
그러나 이 방법의 경우는 보다시피 꽤나 복잡함. 이 때 game changer가 나타남. 그것이 바로 아래 그림에 나타나 있는 Sanger sequencing임.
보면 dNTP와 ddNTP(3'에도 OH가 아닌 H)를 대략 100:1의 비율로 넣어주게 됨. 이 때 우연히 ddNTP가 3'부분에 첨가되게 되면 이 녀석은 3'도 H이므로 nucleophilic attack을 하는 것이 불가능함. 그 결과 이 녀석이 chain terminator로 역할을 함.
실제로는 dNTP가 압도적으로 많으므로 계속 중합이 일어나다가, 우연히 random하게 ddNTP가 들어가서 중합이 종결된 무수히 많은 길이 variation의 조각들이 생길 것임. 이들을 길이순으로 gel electrophoresis하게 되면 nucleotide 1개의 resolution으로 sequencing을 하는 것이 가능함.
실제로 Gilbert와 Sager는 앞서 설명한 sequencing 기법들을 개발한 공로로 1980년에 노벨 화학상을 수상함.
한편 이후 기술의 발전으로 앞서 살펴봤었던 Sanger sequencing을 automation할 수 있는 방식이 개발됨. 이 방식에서는 capillary electrophoresis를 사용해 작은 녀석부터 먼저 분리해내며, 이와 동시에 ddNTP의 종류에 따라 서로 다른 색을 낼 수 있는 dye를 붙이게 됨. 그럴 시 형광 detection에 의해서 자동적으로 sequence를 분석할 수 있게 됨.
그 결과 위와 같은 결과가 얻어짐. 다만 이 때 분석해야할 sequence의 길이가 길어지면 길어질수록 sequence가 부정확해짐. (그럼에도 대략 800~1000개까지는 잘 읽는 편임) 길이가 길어짐에 따라서 sequence가 부정확해지는 이유는 ddNTP의 용량 제한이 있는 등의 이유 때문임.
다음 포스트에서는 NGS(next generation sequencing)에 대해 알아보자.
'전공자를 위한 생물학 > 생화학' 카테고리의 다른 글
[생화학] 7.10 : DNA 시퀀싱(DNA sequencing) - 3 (0) | 2024.11.09 |
---|---|
[생화학] 7.10 : DNA 시퀀싱(DNA sequencing) - 2 (0) | 2024.11.09 |
[생화학] 7.9 : DNA 합성(DNA synthesis) (0) | 2024.11.09 |
[생화학] 7.8 : DNA supercoil, nucleotide들의 다른 기능 (0) | 2024.11.09 |
[생화학] 7.7 : DNA repair (0) | 2024.11.09 |