자기 디스크(magnetic disk)
의 일종으로 지칭하기도 함플래터(platter)
스핀들(spindle)
헤드(head)
디스크 암(disk arm)
많은 양의 데이터를 저장하기 위해 하드 디스크는 일반적으로 여러 겹의 플래터로 이루어져 있고 플래터 양면을 모두 사용할 수 있다.
플래터는 다음과 같이 나누어진다.
트랙(track)
섹터(sector)
실린더(cylinder)
연속된 정보는 보통 한 실린더에 기록된다. 이는 디스크 암을 움직이지 않고 바로 데이터에 접근할 수 있기 떄문이다.
하드 디스크가 저장된 데이터에 접근하는 시간은 크게 탐색 시간, 회전 지연, 전송 시간으로 나누어진다.
탐색 시간(seek time)
최저 지연(rotational latency)
전송 시간(transfer time)
하드 디스크에서 다량의 데이터를 탐색하고 읽어 들이는 시간은 생각보다 어마어마하다. 탐색 시간과 지연 시간을 단축시키기 위해서 플래터를 빨리 돌려 RPM을 높이는 것도 중요하지만, 참조 지역성
, 즉 접근하려는 데이터가 플래터 혹은 헤드를 조금만 옮겨도 접근할 수 있는 곳에 위치해 있는 것도 중요하다.
다중 헤드 디스크와 고정 헤드 디스크
플래터의 한 면당 헤드가 하나씩 달려 있는 하드 디스크를 단일 헤드 디스크(single-head disk) 또는 이동 헤드 디스크(movable-head disk)라고 부른다.
반면 트랙별로 여러 개 달려 있는 하드 디스크는 다중 헤드 디스크(multiple-head disk) 또는 고정 헤드 디스크(fixed-head disk)라고 부른다. 트랙마다 헤드가 있기 때문에 탐색 시간이 들지 않는다. 따라서 다중 헤드 디스크는 탐색 시간이 0이다.
전기적으로 데이터를 읽고 쓸 수 있는 반도체 기반의 저장 장치다. 우리가 일상적으로 접하는 거의 모든 전자 제품 안에 플래시 메모리가 내장되어 있다고 봐도 무방하다.
플래시 메모리의 수명
플래시 메모리와 하드 디스크에는 수명이 있다. 한 셀에 일정 횟수 이상 데이터를 쓰고 지우면 그 셀은 더 이상 데이터를 저장할 수 없다.
플래시 메모리에는 셀(cell)
이라는 단위가 있다. 셀이란 플래시 메모리에서 데이터를 저장하는 가장 작은 단위다. 이 때 하나의 셀에 몇 비트를 저장할 수 있느냐에 따라 플래시 메모리 종류가 나뉜다.
SLC(Single Level Cell)
MLC(Multiple Level Cell)
TLC(Triple Level Cell)
같은 용량의 플래시 메모리 저장 장치라고 할지라도 셀의 타입에 따라 수명, 가격, 성능 등이 다르다.
플래시 메모리의 가장 작은 단위인 셀보다 더 큰 단위들이 있다.
페이지(page)
: 셀들이 모여 만들어진 단위블록(block)
: 페이지가 모여 만들어진 단위플레인(plane)
: 플레인이 모여 만들어진 단위플래시 메모리에서 읽기와 쓰기는 페이지 단위로 이루어진다. 삭제는 페이지보다 큰 블록 단위로 이루어진다. 즉, 읽기/쓰기 단위와 삭제 단위가 다르다.
이 때 페이지는 세 개의 상태를 가질 수 있다.
플래시 메모리는 하드 디스크와는 달리 덮어쓰기가 불가능하여 Valid 상태인 페이지에는 새 데이터를 저장할 수 없다.
A
, B
, C
데이터가 저장되어 있는 블록에서 A
만 A'
값으로 변경하고 싶다고 하자. 플래시 메모리에서는 덮어쓰기가 불가능하므로 기존의 A
데이터를 저장한 페이지를 Invalid 상태 즉, 유효하지 않은 쓰레기값이 되고, 새로운 A
데이터가 저장된다. 결과적으로 이 블록의 Valid 페이지는 B
, C
, A'
가 되고 A
가 저장되어 있던 페이지는 Invalid 상태이다.
이와 같은 상황에서 A
와 같이 쓰레기값을 저장하고 있는 것은 용량 낭비다. 때문에 최근 SSD를 비롯한 플래시 메모리는 이런 쓰레기값을 정리하기 위해 가비지 컬렉션(garbage collection)
기능을 제공한다.
가비지 컬렉션은 유효한 페이지들만을 새로운 블록으로 복사한 뒤, 기존의 블록을 삭제한다. 플래시 메모리에서 삭제는 블록 단위로만 수행되기 때문이다.
RAID(Redundant Array of Independent Disks)
RAID를 구성하는 방법은 여러 가지가 있는데, 일들을 RAID 레벨이라고 표현한다. RAID 레벨에는 RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6과 여기서 파생된 RAID 10, RAID 50 등이 있다.
스트라입(stripe)
: 줄무늬처럼 분산되어 저장된 데이터스트라이핑(striping)
: 분산하여 저장하는 것미러링(mirroring)
이라고도 부른다.패리티 비트(parity bit)
: 오류를 검출하고 복구하기 위한 정보