이번에 수정하게 된 옛~~~날 솔루션이 있는데.. 당최 뭘 하는 건지 몰라서 솔루션 문서를 좀 읽었다.
(생략).. SAM 파일을 파일 서버에 SFTP 로 접근하여 다운로드 받은 후 PDS에 적재한다. 또한 콜 결과를 SAM 파일을 만들어 SFTP로 업로드한다
솔루션 개요가 이러한데, 나는 SAM을 몰라요. 쌔애앰~~!
그래서 챗총각한테 물어봄. 구글링해도 깔끔한 정리가 없기에..
SAM 파일(SAM format)은 Sequence Alignment/Map format의 약자로, 바이오인포매틱스 분야에서 DNA, RNA 또는 단백질 서열과 그들의 정렬 결과를 저장하는데 사용됩니다. SAM 파일은 정렬된 서열을 나타내는 텍스트 파일이며, 다양한 바이오인포매틱스 소프트웨어 및 도구에서 사용됩니다.
SAM 파일에는 각 서열의 정보와 해당 서열이 정렬된 위치, 정렬 품질 및 다양한 서열 특성에 관한 정보가 포함됩니다. 보통 SAM 파일은 큰 데이터 세트를 다룰 때 유용하며, 이를 통해 서열 데이터를 분석하고 비교할 수 있습니다.
SAM 파일의 예시:
@HD VN:1.6
@SQ SN:ref LN:45
read1 0 ref 1 30 10M * 0 0 AGCTAGCTAG * NM:i:0
read2 0 ref 1 30 10M * 0 0 AGCTAGCTAG * NM:i:0
read3 0 ref 1 30 10M * 0 0 AGCTAGCTAG * NM:i:0
QNAME: 서열의 이름
FLAG: 정렬 정보를 나타내는 비트 플래그
RNAME: 정렬된 서열의 이름
POS: 서열이 정렬된 시작 위치
MAPQ: 매핑 품질
CIGAR: 서열의 정렬 정보
RNEXT: 다음 서열의 이름
PNEXT: 다음 서열의 시작 위치
TLEN: 삽입 또는 삭제 된 서열의 길이
SEQ: 서열
QUAL: 서열의 품질
TAGs: 추가적인 태그 및 값
SAM 파일은 보통 BAM(Binary Alignment/Map) 형식으로 압축되어 저장될 수 있습니다. BAM 형식은 SAM 파일과 유사하지만 이진 형식이기 때문에 더 효율적인 데이터 저장 및 처리를 가능하게 합니다.
.
.
.
이렇게 말하면 내가 알까? 그리고 뭔가 좀 내가 원하던 답은 아닌거 같은데..
다시 찾아봄.
https://blog.naver.com/mozaco/60041373286
순차 접근 방법(sequential access method)
① 정보의 항목들을 저장된 순서대로 접근하는 방법. 이 방법을 이용하면 다음에 읽어 올 자료를 예측할 수 있다. 일반적으로 연속된 대량 자료에 접근하고자 할 때 이용된다.
② 데이터를 기억 장치에 입력시키거나 기억 장치로부터 판독할 때, 입력이나 판독이 되는 기억 장소에 이어지는 다음 기억 장소에 입력 또는 판독할 수 있도록 하는 방법.
[출처][펌] SAM 파일이란~|작성자 쮸디
연속된 대량 자료에 접근하고자 할 때 쓰는 방법이다?
업무 내용(콜)을 생각하면 이해가 가는 것 같기도..