전공자를 위한 생물학/생물통계학(ChIP-seq)

[생물통계학] 1.3 : next generation sequencing (NGS) - 4

단세포가 되고파🫠 2025. 6. 19. 00:10
반응형

 

 

 

그렇다면 이전에 살펴본 Illumina sequencing과 비교해서 직전에 살펴본 MGI sequencing의 특수성은 무엇인가.

 

 

딱 보면 알 수 있는 것처럼 이런 patterned array에 의해서는 매우 규칙적이고 정렬적으로 nanoball들이 loading됨을 알 수 있음. 한편 Illumina sequencing에서는 random한 incorporation에 이은 random한 bridge amplification이 일어난다고 했었음. 그러면 이런 차이점에 의해서 DNA nanoball sequencing이 특별히 가지는 advantage가 있을까?

 

 

이에 대해 이해하기 위해서는 우선 Index hopping에 대해 이해하고 있어야 함.

 

 

 

 

위 그림상에 index hopping에 대한 묘사가 나타나 있음. 보면 일반적으로 여러 종류의 template DNA들을 한 번에 sequencing하고자 할 때는, 나중에 다시 각각을 구분하기 위해 adaptor sequence 내에 index sequence를 포함시켜주게 됨. 그런데, 이런 adaptor sequence를 template DNA에 ligation시키는 과정에서 ligation되지 않고, 또 washing되지도 않은 채 library 상에 남아있는 free adaptor가 존재할 수 있음.

 

 

반응형

 

 

이 녀석들이 존재하다가 다른 종류의 template DNA에 들어가게 될 시(index hopping) data가 오염될 수 있음. 이를 index hopping problem이라 부르며 보통 0.1-0.3% 정도의 read에서 이런 문제가 발생함. 특별히 Illumina sequencing에서는 이런 문제가 무조건 발생하며, 이를 최대한 minimize하기 위해서는 library prep 과정에서 free adaptor들을 최대한 제거해주어야 함. (만약 whole genome sequencing을 하는 경우라면 0.1-0.3%의 index hopping은 별 문제가 되지 않을 수 있지만 single cell RNA seq 등을 하는 경우 template의 종류가 필연적으로 많아지므로 이것이 문제가 될 수 있음)

 

 

 

 

 

실제로 위 그림 b를 보면 Illumina sequencing을 할 시 index가 엉뚱한 template으로 hopping한 뒤 이것이 이후의 amplification 과정에서 계속 남아 결과에 영향을 미친다는 것을 알 수 있음. 한편 a에도 나타나 있는 것처럼 애초에 MGI sequencing 과정에는 이런 index hopping이 잘 일어나지 않으며, 설사 그림처럼 일어났다 하더라도 곧바로 다음 sequence가 replication되는 과정에서 원본 index가 다시 replication되므로 index hopping에 의한 amplify가 방지됨.

 

 

 

 

 

 

다음으로 이제 이렇게 Flowcell 하에서 positioned된 nanoball이 어떻게 sequencing되는지에 대해 알아보자.

 

 

 

 

 

이 때 크게 sequencing하는 방식에 따라 single end와 paired end로 나눌 수 있음. 이 중 single end는 단순하게 forward 방향으로 쭉 repeated copy들을 sequencing해나가는 방식임. (이 때도 Illumina와 마찬가지로 SBS를 통해 sequencing하는 것은 동일함) 한편 paired end의 경우에는, forward 방향의 sequencing은 쉽게 상상 가능하지만, reverse 방향의 sequencing은 어떻게 할 수 있을지에 대해 감이 안옴.

 

 

 

 

 

구체적으로 MGI sequencing에서는 위와 같은 Multiple displacement amplification(MDA)이라는 방식을 이용해서 paired end sequencing을 수행함. 보면 위 그림처럼 random hexamer primer를 이용해서 forward 방향으로 sequencing을 하고 난 뒤, 이렇게 해서 새롭게 생성된, displacement된 서열을 바탕으로 다시금 reverse sequencing이 이루어지는 방식임.

 

 

 

 

 

 

즉 위와 같이 원본 DNA(회색)로부터 합성된 MDA strand(blue)가 displacement된 후 이 녀석을 주형으로 해서 다시 reverse strand가 합성되며 sequencing이 일어나는 것임.

 

 

 

 

 

구체적으로는 위 그림상에 나타나 있는 것과 같이 각각의 nanoball에 대해 sequencing이 일어나며 이 때의 sequencing 방식을 cPAS(combinatorial probe-anchor synthesis)라고 부름.

 

 

 

 

 

 

위 그림에는 MGI sequencing의 advantage들이 다시금 정리되어 있으므로 참고할 것.

 

 

 

 

 

 

한편 최근에는 위와 같이 third-generation sequencing method들이 추가로 개발되어 사용되고 있음. 이들의 경우 single molecule level에서 sequencing이 이루어지며 long read를 무리없이 읽을 수 있다는 특징이 있음. 그러나 일반적으로 ChIP-seq을 수행하는데 있어서는 2nd generation sequencing만 사용해도 충분하고 3rd generation sequencing까지는 사용하지 않음.

 

 

 

 

+) 일반적으로 Illumina sequencing을 했을 때와 MGI sequncing을 했을 때의 output이 거의 비슷하게 나오는데, 그도 그럴 것이 Illumina sequencing 장비의 경우 optical detector의 performance가 좋은 편이고 MGI sequencing 장비의 경우 library의 quality가 더 좋은 편이기 때문에 이 효과가 거의 상쇄되어서 나옴. 그렇기에 결과가 비슷비슷하며, 물론 그럼에도 조금 차이점이 있기는 함.

 

 

 

다음 포스트부터는 후성유전학에 대해 알아보자.

반응형