Amazon EFS 비용 최적화

도은호·2025년 10월 7일

AWS SAA

목록 보기

14/53

목표: 성능은 유지하면서 월 청구액을 줄이기.

Lifecycle → Standard-IA / One Zone-IA 전환 기준

Throughput 모드(Bursting / Provisioned / Elastic) 선택 기준

1) Storage Class & Lifecycle 전환 기준

결론 먼저

공유 파일이 “가끔만” 읽히면 → IA 클래스로 내려 비용 절감
항상 접근하거나 작고 잦은 I/O면 → Standard 유지 (IA는 조회 요금 때문에 역효과 날 수 있음)

추천 의사결정 트리

파일 접근 패턴 분석
- 최근 N일간 Access 빈도를 태그/로그로 집계 (예: atime 대체 지표, 앱 로그, S3/CloudWatch 이벤트 등)
IA 후보 선정
- 마지막 접근 이후 ≥ 30~60일 & 파일 크기 ≥ 수 MB & 읽기 빈도 월 1회 이하
Lifecycle 정책 적용
- 30 d → IA(가장 보편)
- 60/90 d → IA(재접근 가능성이 좀 더 높은 팀)
- 핫·콜드 혼재 심하면 디렉터리/Access Point 단위로 분리해 정책 차등

팁: 처음엔 60일 정책으로 보수적으로 시작 → 한 달 운영 후 30일로 당겨 최적점 탐색.

Standard vs One Zone

One Zone(및 One Zone-IA): 단일 AZ 저장으로 저렴.
사용 조건: 복원 가능(백업/Replication 있음), 리전 광역 내구성보다 비용을 우선.
운영 팁: AWS Backup + EFS-to-EFS Replication으로 DR 보완.

IA 적용 시 주의

조회(읽기) 시 추가 요금 존재 → 대용량·저빈도일수록 유리
소형 파일·메타데이터 위주 워크로드는 IA 이점이 작을 수 있음
팀에 “IA 조회 비용” 가이드 공유(예: 월 1회 이하 접근 원칙)

2) Throughput 모드 선택 기준

요약

Bursting(기본): 파일시스템 용량에 비례해 베이스 스루풋이 주어지고, 버스트 크레딧으로 단기 급증 처리
Provisioned Throughput: 예측 가능한 높은 스루풋이 용량 대비 과하게 필요할 때 고정 예약
Elastic Throughput: 트래픽 변동이 크고 예측이 어려울 때 자동 스케일 — 운영 단순, 쓰는 만큼 과금

추천 의사결정

파일시스템 용량이 충분히 크고, 트래픽이 짧게만 튀면 → Bursting + 크레딧 모니터링으로 충분
데이터가 작지만 항상 높은 스루풋을 요구 → Provisioned
패턴 예측이 힘들고 가끔 크게 튀는 워크로드 → Elastic(튜닝 부담 ↓, 비용은 사용량에 비례)

모니터링 지표(권장 알람)

BurstCreditBalance: 장기간 하락 추세면 베이스 부족 신호 → Provisioned/Elastic 고려
PercentIOLimit: 일정 시간 80%+ 지속 시 스로틀링 위험 → 상위 모드 전환/튜닝 검토
(참고) TotalIOBytes / DataReadIOBytes / DataWriteIOBytes 로 패턴 파악

3) 실전 적용 플랜

분리

Access Point/디렉터리로 핫/콜드 데이터 분리. 팀/서비스별 Tag 붙여 원가 대조.

정책 시범 운영(2~4주)

핫: Standard(또는 One Zone)
콜드: Lifecycle 60d → IA(파일 크기≥몇 MB 위주)
Throughput: 기본 Bursting, 크레딧 소진 추세 보이면 Elastic 시범 적용

측정 & 조정

월말 청구 + CloudWatch → IA 조회 비용 vs 저장 절감 비교
BurstCreditBalance 저점/회복 패턴 검토 → Elastic/Provisioned 전환 여부 결정
과금이 특정 팀에 치우치면 태그 기반 비용 배분 고도화

표준화

“신규 EFS 템플릿”:
- 기본 Lifecycle 30~60d → IA
- Elastic Throughput 기본(변동 큰 팀) 또는 Bursting 기본(안정 팀)
- One Zone 여부: DR/복구 시간 목표 충족 시 채택

4) 비용 절감 체크리스트

Lifecycle → IA: 30/60/90d 정책 중 하나는 반드시 설정
핫/콜드 분리: 디렉터리/Access Point 기준으로 분리 운영
One Zone-IA: 복원 전략 확보 시 전환
Elastic Throughput: 변동 큰 워크로드에 적용하여 운영 튜닝 비용 ↓
AWS Backup + Replication: 표준 백업/DR로 One Zone 리스크 보완
메타데이터 과도 접근 최소화: 디렉터리 구조/리스트 빈도 최적화
권한/소유권 정리: 잘못된 UID/GID로 재시도 폭증 방지

5) 베스트 프랙티스 팁

대용량 일괄 처리는 작업 창에 Elastic Throughput 임시 전환 후 종료 시 복귀(필요하면)
크론으로 “최근 N일 미접근 파일” 리포트 생성 → 운영자 승인 후 수동 IA 이동(초기 단계)
컨테이너: 공유 볼륨은 Access Point로 앱별 루트/권한 고정 → 보안·비용 추적 용이
네트워크 경로: 클라이언트는 같은 AZ의 Mount Target 사용(지연/전송 비용 최적화)

6) 빠른 예시: 팀 A의 미디어 자산

특성: 업로드 후 한 달간 집중 조회, 이후 가끔만 접근
설정:
- Lifecycle: 30d → Standard-IA
- 변동 큰 캠페인 기간엔 Elastic Throughput 임시 적용
- 장기 보관은 One Zone-IA + AWS Backup(월 1회 복구 리허설)

7) 요약

IA 전환 기준: “큰 파일 + 저빈도(≥30~60d 미접근)”에 효과적
Throughput 선택:
- 안정/예측 가능 → Bursting/Provisioned
- 예측 어려움·스파이크 큼 → Elastic
One Zone-IA: DR 보완 전제하에 가장 큰 절감 포인트

`•.¸¸.•´´¯`••._.• 🎀 𝒸𝓇𝒶𝓏𝓎 𝓅𝓈𝓎𝒸𝒽💞𝓅𝒶𝓉𝒽 🎀 •._.••`¯´´•.¸¸.•`

이전 포스트

Amazon EFS(Elastic File System)

다음 포스트

퀴즈 틀린문제 정리

0개의 댓글