목표: 성능은 유지하면서 월 청구액을 줄이기.
- Lifecycle → Standard-IA / One Zone-IA 전환 기준
- Throughput 모드(Bursting / Provisioned / Elastic) 선택 기준
1) Storage Class & Lifecycle 전환 기준
결론 먼저
- 공유 파일이 “가끔만” 읽히면 → IA 클래스로 내려 비용 절감
- 항상 접근하거나 작고 잦은 I/O면 → Standard 유지 (IA는 조회 요금 때문에 역효과 날 수 있음)
추천 의사결정 트리
-
파일 접근 패턴 분석
- 최근 N일간 Access 빈도를 태그/로그로 집계 (예:
atime 대체 지표, 앱 로그, S3/CloudWatch 이벤트 등)
-
IA 후보 선정
- 마지막 접근 이후 ≥ 30~60일 & 파일 크기 ≥ 수 MB & 읽기 빈도 월 1회 이하
-
Lifecycle 정책 적용
- 30 d → IA(가장 보편)
- 60/90 d → IA(재접근 가능성이 좀 더 높은 팀)
- 핫·콜드 혼재 심하면 디렉터리/Access Point 단위로 분리해 정책 차등
팁: 처음엔 60일 정책으로 보수적으로 시작 → 한 달 운영 후 30일로 당겨 최적점 탐색.
Standard vs One Zone
- One Zone(및 One Zone-IA): 단일 AZ 저장으로 저렴.
- 사용 조건: 복원 가능(백업/Replication 있음), 리전 광역 내구성보다 비용을 우선.
- 운영 팁: AWS Backup + EFS-to-EFS Replication으로 DR 보완.
IA 적용 시 주의
- 조회(읽기) 시 추가 요금 존재 → 대용량·저빈도일수록 유리
- 소형 파일·메타데이터 위주 워크로드는 IA 이점이 작을 수 있음
- 팀에 “IA 조회 비용” 가이드 공유(예: 월 1회 이하 접근 원칙)
2) Throughput 모드 선택 기준
요약
- Bursting(기본): 파일시스템 용량에 비례해 베이스 스루풋이 주어지고, 버스트 크레딧으로 단기 급증 처리
- Provisioned Throughput: 예측 가능한 높은 스루풋이 용량 대비 과하게 필요할 때 고정 예약
- Elastic Throughput: 트래픽 변동이 크고 예측이 어려울 때 자동 스케일 — 운영 단순, 쓰는 만큼 과금
추천 의사결정
- 파일시스템 용량이 충분히 크고, 트래픽이 짧게만 튀면 → Bursting + 크레딧 모니터링으로 충분
- 데이터가 작지만 항상 높은 스루풋을 요구 → Provisioned
- 패턴 예측이 힘들고 가끔 크게 튀는 워크로드 → Elastic(튜닝 부담 ↓, 비용은 사용량에 비례)
모니터링 지표(권장 알람)
- BurstCreditBalance: 장기간 하락 추세면 베이스 부족 신호 → Provisioned/Elastic 고려
- PercentIOLimit: 일정 시간 80%+ 지속 시 스로틀링 위험 → 상위 모드 전환/튜닝 검토
- (참고) TotalIOBytes / DataReadIOBytes / DataWriteIOBytes 로 패턴 파악
3) 실전 적용 플랜
- 분리
- Access Point/디렉터리로 핫/콜드 데이터 분리. 팀/서비스별 Tag 붙여 원가 대조.
- 정책 시범 운영(2~4주)
- 핫: Standard(또는 One Zone)
- 콜드: Lifecycle 60d → IA(파일 크기≥몇 MB 위주)
- Throughput: 기본 Bursting, 크레딧 소진 추세 보이면 Elastic 시범 적용
- 측정 & 조정
- 월말 청구 + CloudWatch → IA 조회 비용 vs 저장 절감 비교
- BurstCreditBalance 저점/회복 패턴 검토 → Elastic/Provisioned 전환 여부 결정
- 과금이 특정 팀에 치우치면 태그 기반 비용 배분 고도화
- 표준화
-
“신규 EFS 템플릿”:
- 기본 Lifecycle 30~60d → IA
- Elastic Throughput 기본(변동 큰 팀) 또는 Bursting 기본(안정 팀)
- One Zone 여부: DR/복구 시간 목표 충족 시 채택
4) 비용 절감 체크리스트
5) 베스트 프랙티스 팁
- 대용량 일괄 처리는 작업 창에 Elastic Throughput 임시 전환 후 종료 시 복귀(필요하면)
- 크론으로 “최근 N일 미접근 파일” 리포트 생성 → 운영자 승인 후 수동 IA 이동(초기 단계)
- 컨테이너: 공유 볼륨은 Access Point로 앱별 루트/권한 고정 → 보안·비용 추적 용이
- 네트워크 경로: 클라이언트는 같은 AZ의 Mount Target 사용(지연/전송 비용 최적화)
6) 빠른 예시: 팀 A의 미디어 자산
7) 요약