SAM파일

NANA·2024년 4월 5일
0

at Work

목록 보기
13/14

이번에 수정하게 된 옛~~~날 솔루션이 있는데.. 당최 뭘 하는 건지 몰라서 솔루션 문서를 좀 읽었다.

(생략).. SAM 파일을 파일 서버에 SFTP 로 접근하여 다운로드 받은 후 PDS에 적재한다. 또한 콜 결과를 SAM 파일을 만들어 SFTP로 업로드한다

솔루션 개요가 이러한데, 나는 SAM을 몰라요. 쌔애앰~~!
그래서 챗총각한테 물어봄. 구글링해도 깔끔한 정리가 없기에..

SAM 파일(SAM format)은 Sequence Alignment/Map format의 약자로, 바이오인포매틱스 분야에서 DNA, RNA 또는 단백질 서열과 그들의 정렬 결과를 저장하는데 사용됩니다. SAM 파일은 정렬된 서열을 나타내는 텍스트 파일이며, 다양한 바이오인포매틱스 소프트웨어 및 도구에서 사용됩니다.

SAM 파일에는 각 서열의 정보와 해당 서열이 정렬된 위치, 정렬 품질 및 다양한 서열 특성에 관한 정보가 포함됩니다. 보통 SAM 파일은 큰 데이터 세트를 다룰 때 유용하며, 이를 통해 서열 데이터를 분석하고 비교할 수 있습니다.

SAM 파일의 예시:

@HD     VN:1.6
@SQ     SN:ref  LN:45
read1   0       ref     1       30      10M     *       0       0       AGCTAGCTAG      *       NM:i:0
read2   0       ref     1       30      10M     *       0       0       AGCTAGCTAG      *       NM:i:0
read3   0       ref     1       30      10M     *       0       0       AGCTAGCTAG      *       NM:i:0

QNAME: 서열의 이름
FLAG: 정렬 정보를 나타내는 비트 플래그
RNAME: 정렬된 서열의 이름
POS: 서열이 정렬된 시작 위치
MAPQ: 매핑 품질
CIGAR: 서열의 정렬 정보
RNEXT: 다음 서열의 이름
PNEXT: 다음 서열의 시작 위치
TLEN: 삽입 또는 삭제 된 서열의 길이
SEQ: 서열
QUAL: 서열의 품질
TAGs: 추가적인 태그 및 값
SAM 파일은 보통 BAM(Binary Alignment/Map) 형식으로 압축되어 저장될 수 있습니다. BAM 형식은 SAM 파일과 유사하지만 이진 형식이기 때문에 더 효율적인 데이터 저장 및 처리를 가능하게 합니다.

.
.
.

이렇게 말하면 내가 알까? 그리고 뭔가 좀 내가 원하던 답은 아닌거 같은데..

다시 찾아봄.

https://blog.naver.com/mozaco/60041373286

순차 접근 방법(sequential access method)
① 정보의 항목들을 저장된 순서대로 접근하는 방법. 이 방법을 이용하면 다음에 읽어 올 자료를 예측할 수 있다. 일반적으로 연속된 대량 자료에 접근하고자 할 때 이용된다.
② 데이터를 기억 장치에 입력시키거나 기억 장치로부터 판독할 때, 입력이나 판독이 되는 기억 장소에 이어지는 다음 기억 장소에 입력 또는 판독할 수 있도록 하는 방법.

[출처][펌] SAM 파일이란~|작성자 쮸디

연속된 대량 자료에 접근하고자 할 때 쓰는 방법이다?
업무 내용(콜)을 생각하면 이해가 가는 것 같기도..

profile
기술블로그 그런 거창한 거 아닙니다. 일기에요 일기

0개의 댓글