AlphaFold의 핵심 두 번째 과정은 바로 단백질의 구조를 실제로 그려내는 단계예요.
앞서 2편에서는 ‘Evoformer’라는 블록이 어떻게 진화 정보를 모아 아미노산 간의 관계를 계산했는지 알아봤죠. 이번에는 그 정보를 바탕으로 어떻게 3D 단백질 구조가 만들어지는지를 살펴볼 거예요.
이 과정은 ‘Structural Stage’라고 불리며, AlphaFold가 예측한 아미노산 간의 거리와 각도를 토대로 입체 구조를 생성하는 아주 중요한 단계예요.
단백질을 회전시키고 이동시키는 프레임 단위 표현
AlphaFold는 단백질을 구성하는 각 아미노산을 하나의 단위로 보고, 각 단위가 어떻게 위치하고 회전해야 하는지를 계산해요. 이걸 Residue Frame이라고 불러요. 쉽게 말해, 각각의 아미노산이 어디에 있어야 하고, 어떤 방향을 향하고 있어야 할지를 정하는 과정이에요.

이걸 가능하게 해주는 게 바로 IPA module이라는 모듈이에요. IPA는 아미노산 서열과 진화 정보를 동시에 받아들여서, 각 잔기의 회전(orientation)과 이동(translation)을 계산해요. 처음에는 대략적인 위치를 잡지만, 반복적으로 업데이트되면서 구조가 점점 정교해지죠.
재미있는 점은, 초기에는 펩타이드 사슬(단백질 사슬)의 물리적 제약들을 무시하고 예측을 시작한다는 거예요. 구조를 유연하게 수정할 수 있도록 하기 위해서인데요, 마지막 단계에서 다시 물리적으로 타당한 구조로 조정해줘요. 이를 위해 violation loss라는 개념을 써서 구조의 비현실적인 부분을 줄이죠.
단일 사슬 vs 다중 사슬, 예측 방식도 달라져요

AlphaFold는 두 가지 종류의 단백질 구조를 예측할 수 있어요. 하나는 Monomer, 즉 단일 아미노산 사슬로 이루어진 단백질이고요, 다른 하나는 Multimer, 여러 개의 단백질 사슬이 함께 작용하는 구조예요.
Monomer 예측은 단일 사슬을 기반으로 3차원 구조를 만드는 간단한 과정이에요. 반면, Multimer는 서로 다른 사슬 사이의 상호작용까지 계산해야 해서 훨씬 복잡하죠. 이때는 여러 사슬의 진화적 관계를 고려해 만든 MSA(pairwise alignment)가 큰 역할을 해요.
최종적으로는 단백질의 tertiary structure(3차 구조, 즉 단일 사슬의 입체 구조)나 quaternary structure(4차 구조, 즉 여러 사슬이 결합한 복합체 구조)가 AlphaFold의 출력으로 생성돼요.
이렇게 생성된 단백질 구조는 곧바로 시각화할 수 있고, 구조의 신뢰도도 함께 제공돼요. 예측된 구조의 어느 부분은 신뢰도가 높고, 어느 부분은 불확실한지를 색깔로 보여주는 방식이에요. 이건 다음 글에서 직접 다뤄볼 시각화 단계에서 자세히 소개해드릴게요.
AlphaFold가 이렇게 정밀하게 3D 구조를 예측할 수 있었던 건, 단순히 딥러닝을 쓴 것이 아니라, 진화적 정보와 물리학적 지식을 정교하게 결합했기 때문이에요.
다음 글에서는 이 구조가 실제로 어떻게 시각화되고 해석되는지를 Colab 환경을 예로 들어서 자세히 알아보도록 할게요!
'전공자를 위한 생물학 > 대학원생을 위한 필수 생물학 개념들' 카테고리의 다른 글
| [알파폴드] 5편 : AlphaFold로 예측된 단백질 구조 해석 및 시각화 방법 (0) | 2025.04.20 |
|---|---|
| [알파폴드] 4편 : Google Colab으로 AlphaFold2 직접 사용해보기 - ColabFold (2) | 2025.04.20 |
| [알파폴드] 2편 : AlphaFold는 어떻게 작동할까 - Evoformer (0) | 2025.04.20 |
| [알파폴드] 1편 : AlphaFold란 무엇인가? 단백질 구조 예측의 새로운 시대 (1) | 2025.04.20 |
| [TRE 시스템] 5편 : Tet 시스템의 다양한 응용법 (0) | 2025.04.19 |