플래시 메모리를 위한 파일시스템

TAEWOO HA·2023년 6월 16일

리눅스 파일시스템 및 저장장치 기술

목록 보기

8/11

디스크를 타겟으로 만들어진 시스템
특징 : 로그 스트럭쳐 : 모든 쓰기를 로그형태로 쓴다. 뒤에 차곡차곡 붙여 쓴다.
OUT OF PLACE , APPEND으로 쓴다.
LFS vs FFS
dir1/file1 , dir2/file2 생성
FFS : 8개의 랜덤 write가 발생
LFS : 파일데이터 => 아이노드 => 디렉토리데이터 => 아이노드 ... 순차적
시퀀셜하게 쓰면 성능에 좋다. 이러면 아이노드가 고정된 위치가 아니다.
- 아이노드의 위치를 알려주는 매핑 테이블 정보를 따로 만들어줘야한다.(추가적인 write)

쓰기 비용에 대한 효과 적인 모델 제공
- 쓰기 비용
- u: 이용률
- u 가 증가할수록 스기 비용이 증가한다.
- 0.5를 기준으로 작으면 좋은 성능을 보인다

그리디 방식 : util이 낮은 것 선택(invalid가 많은 것)
- 0.6까지는 거의 선택이 되어서 존재 x , 거의 대부분의 seg가 0.6의 비슷한 seg를 보이는 분포
cost benefit은 hot하다면 0.2정도는 기회를 준다. 나중에 갈수록 cost-benfit 방식이 더 효율이 좋아짐

그리디 : 유틸라이제이션이 가장 작은거 선택. 세그먼트 1 ,2 ,3 이 있을 때 0.1, 0.5 , 0.3 일 때 클리닝 비용이 seg1이 가장 작다. 그러므로 1을 선택하면 greedy 방식
세그먼트 나이 고려. 가장 최근 : 가장 핫하다. 나이가 적을수록 냅둔다.
cold 데이터중에 util이 작은 것

- 플래시 특성 : 로그 스트럭쳐

overwrite가 안되니 다른 페이지에 작성했을 것 => 이 위치를 가리키는 포인터 블럭도 수정을 해야한다. => 파일 아이노드 , 아이노드 맵 , 체크포인트까지 수정해야한다.
클리닝 오버헤드 : 퍼포먼스 이슈

노드 블럭 : 주소 변환(NAT) , Wandering Tree Problem 해결
멀티 헤드 로깅 : 여러 세그먼트들을 쓰고 동시에 플러시 (병렬유닛 최대로 활용)
핫 콜드 분화 : 클리닝 오버헤드 줄임

<그림.F2FS의 내부구조>
슈퍼블럭 , 체크포인트 , 세그먼트 summary ,NAT , seg usage
메타데이터와 일반데이터로 구분함.
- 끼리끼리 로깅을 하여 write를 한다.
- 메타데이터,데이터는 Hot / Warm / Cold 로 나뉨
- 서로다른 6개의 데이터가 멀티 로깅되는 구조
hot/cold 분화, hot이면 다시 참조될 확률이 높다.
- invalid 페이지가 많다.
cold : 대부분 valid
====> LFS에서의 성능그래프가 그려짐
세그먼트를 모아서 => 섹션 , 섹션을 모아서 => 존으로 관리
- 세그먼트 : 할당 , 섹션 : 클리닝 , 존 : 로깅
- 존 : 메타데이터 존 , 데이터 존
스레디드 로깅 : 이용률이 높을 때 , Copy하는 오버헤드가 없고 점프하면서 쓴다.
노멀 로깅 : 세그먼트 클리닝 => valid를 한쪽으로 모으고 나머지를 free한다.
- 이용률이 높아지면 대부분이 valid한 블럭이라서 copy하는 오버헤드가 커진다.