Amazon EFS 비용 최적화

도은호·2025년 10월 7일
0

AWS SAA

목록 보기
14/46

목표: 성능은 유지하면서 월 청구액을 줄이기.

  1. Lifecycle → Standard-IA / One Zone-IA 전환 기준
  2. Throughput 모드(Bursting / Provisioned / Elastic) 선택 기준

1) Storage Class & Lifecycle 전환 기준

결론 먼저

  • 공유 파일이 “가끔만” 읽히면IA 클래스로 내려 비용 절감
  • 항상 접근하거나 작고 잦은 I/O면 → Standard 유지 (IA는 조회 요금 때문에 역효과 날 수 있음)

추천 의사결정 트리

  1. 파일 접근 패턴 분석

    • 최근 N일간 Access 빈도를 태그/로그로 집계 (예: atime 대체 지표, 앱 로그, S3/CloudWatch 이벤트 등)
  2. IA 후보 선정

    • 마지막 접근 이후 ≥ 30~60일 & 파일 크기 ≥ 수 MB & 읽기 빈도 월 1회 이하
  3. Lifecycle 정책 적용

    • 30 d → IA(가장 보편)
    • 60/90 d → IA(재접근 가능성이 좀 더 높은 팀)
    • 핫·콜드 혼재 심하면 디렉터리/Access Point 단위로 분리해 정책 차등

팁: 처음엔 60일 정책으로 보수적으로 시작 → 한 달 운영 후 30일로 당겨 최적점 탐색.

Standard vs One Zone

  • One Zone(및 One Zone-IA): 단일 AZ 저장으로 저렴.
  • 사용 조건: 복원 가능(백업/Replication 있음), 리전 광역 내구성보다 비용을 우선.
  • 운영 팁: AWS Backup + EFS-to-EFS Replication으로 DR 보완.

IA 적용 시 주의

  • 조회(읽기) 시 추가 요금 존재 → 대용량·저빈도일수록 유리
  • 소형 파일·메타데이터 위주 워크로드는 IA 이점이 작을 수 있음
  • 팀에 “IA 조회 비용” 가이드 공유(예: 월 1회 이하 접근 원칙)

2) Throughput 모드 선택 기준

요약

  • Bursting(기본): 파일시스템 용량에 비례해 베이스 스루풋이 주어지고, 버스트 크레딧으로 단기 급증 처리
  • Provisioned Throughput: 예측 가능한 높은 스루풋용량 대비 과하게 필요할 때 고정 예약
  • Elastic Throughput: 트래픽 변동이 크고 예측이 어려울 때 자동 스케일 — 운영 단순, 쓰는 만큼 과금

추천 의사결정

  • 파일시스템 용량이 충분히 크고, 트래픽이 짧게만 튀면Bursting + 크레딧 모니터링으로 충분
  • 데이터가 작지만 항상 높은 스루풋을 요구 → Provisioned
  • 패턴 예측이 힘들고 가끔 크게 튀는 워크로드 → Elastic(튜닝 부담 ↓, 비용은 사용량에 비례)

모니터링 지표(권장 알람)

  • BurstCreditBalance: 장기간 하락 추세면 베이스 부족 신호 → Provisioned/Elastic 고려
  • PercentIOLimit: 일정 시간 80%+ 지속 시 스로틀링 위험 → 상위 모드 전환/튜닝 검토
  • (참고) TotalIOBytes / DataReadIOBytes / DataWriteIOBytes 로 패턴 파악

3) 실전 적용 플랜

  1. 분리
  • Access Point/디렉터리로 핫/콜드 데이터 분리. 팀/서비스별 Tag 붙여 원가 대조.
  1. 정책 시범 운영(2~4주)
  • 핫: Standard(또는 One Zone)
  • 콜드: Lifecycle 60d → IA(파일 크기≥몇 MB 위주)
  • Throughput: 기본 Bursting, 크레딧 소진 추세 보이면 Elastic 시범 적용
  1. 측정 & 조정
  • 월말 청구 + CloudWatch → IA 조회 비용 vs 저장 절감 비교
  • BurstCreditBalance 저점/회복 패턴 검토 → Elastic/Provisioned 전환 여부 결정
  • 과금이 특정 팀에 치우치면 태그 기반 비용 배분 고도화
  1. 표준화
  • “신규 EFS 템플릿”:

    • 기본 Lifecycle 30~60d → IA
    • Elastic Throughput 기본(변동 큰 팀) 또는 Bursting 기본(안정 팀)
    • One Zone 여부: DR/복구 시간 목표 충족 시 채택

4) 비용 절감 체크리스트

  • Lifecycle → IA: 30/60/90d 정책 중 하나는 반드시 설정
  • 핫/콜드 분리: 디렉터리/Access Point 기준으로 분리 운영
  • One Zone-IA: 복원 전략 확보 시 전환
  • Elastic Throughput: 변동 큰 워크로드에 적용하여 운영 튜닝 비용 ↓
  • AWS Backup + Replication: 표준 백업/DR로 One Zone 리스크 보완
  • 메타데이터 과도 접근 최소화: 디렉터리 구조/리스트 빈도 최적화
  • 권한/소유권 정리: 잘못된 UID/GID로 재시도 폭증 방지

5) 베스트 프랙티스 팁

  • 대용량 일괄 처리작업 창Elastic Throughput 임시 전환 후 종료 시 복귀(필요하면)
  • 크론으로 “최근 N일 미접근 파일” 리포트 생성 → 운영자 승인 후 수동 IA 이동(초기 단계)
  • 컨테이너: 공유 볼륨은 Access Point로 앱별 루트/권한 고정 → 보안·비용 추적 용이
  • 네트워크 경로: 클라이언트는 같은 AZ의 Mount Target 사용(지연/전송 비용 최적화)

6) 빠른 예시: 팀 A의 미디어 자산

  • 특성: 업로드 후 한 달간 집중 조회, 이후 가끔만 접근

  • 설정:

    • Lifecycle: 30d → Standard-IA
    • 변동 큰 캠페인 기간엔 Elastic Throughput 임시 적용
    • 장기 보관은 One Zone-IA + AWS Backup(월 1회 복구 리허설)

7) 요약

  • IA 전환 기준: “큰 파일 + 저빈도(≥30~60d 미접근)”에 효과적

  • Throughput 선택:

    • 안정/예측 가능 → Bursting/Provisioned
    • 예측 어려움·스파이크 큼 → Elastic
  • One Zone-IA: DR 보완 전제하에 가장 큰 절감 포인트

profile
`•.¸¸.•´´¯`••._.• 🎀 𝒸𝓇𝒶𝓏𝓎 𝓅𝓈𝓎𝒸𝒽💞𝓅𝒶𝓉𝒽 🎀 •._.••`¯´´•.¸¸.•`

0개의 댓글