NGS(차세대 염기서열 분석) 데이터를 처리할 때 필수적으로 생성되는 파일 중 하나가 바로 SAM과 BAM 파일이에요. 이 두 파일은 시퀀싱된 리드(read)가 유전체 참조 서열(reference genome)에 어떻게 정렬되었는지를 보여주는 '정렬 정보'를 담고 있어요. 이름만 보면 생소할 수 있지만, 이 파일은 유전체 연구의 기초이자 핵심 도구라고 할 수 있어요. SAM vs BAMSAM은 ‘Sequence Alignment/Map’의 줄임말로, 사람이 읽을 수 있는 텍스트 형식의 파일이에요. 그래서 열어보면 어떤 리드가 어떤 위치에 붙었는지를 한눈에 파악할 수 있죠. 반면, BAM은 SAM의 바이너리 형식이에요. 사람이 바로 읽기는 어렵지만 컴퓨터가 빠르게 처리할 수 있어요. 용량도 SAM보..