AWS Auto Scaling

조민철·2025년 4월 18일

AWS

목록 보기
17/21
post-thumbnail

Auto Scaling


AWS에서 가변적인 트래픽을 처리하고 싶다면 Auto Scaling을 사용하면된다. Auto ScalingEC2 인스턴스를 수평적으로 Scale-UP 또는 수직적으로 가변적인 트래픽을 비용 효율적으로 처리할 수 있다.

Auto Scaling 특징


다음과 같이 Auto Scaling최소 인스턴스, 최대 인스턴스, 원하는 인스턴스 용량을 설정할 수 있다. 사용자가 정의한 용량 만큼 작동하며 자동으로 용량이 조절되며 많은 리소스가 필요하지 않을때는 최소 인스턴스로 작동하여 비용을 줄일 수 있고 많은 트래픽이 감지되면 최대 인스턴스 용량 만큼 늘어나 트래픽을 처리할 수 있게된다.

  • 자동 리소스 조정
    • 애플리케이션의 부하에 따라 여러 서비스들이 자동으로 늘어가거나 줄어듬
  • Auto Scaling 그룹
    • EC2와 같은 인스턴스는 그룹 단위로 관리됨
    • 그룹별로 사용자 정의 설정이 가능하며 최소, 최대, 원하는 개수를 지정가능하며 최소값 이하로는 줄어들지 않고 최대값 이상으로 늘어나지 않음
    • 모든 인스턴스를 강제적으로 종료해도 자동으로 최소 인스턴스만큼 다시 생성함
  • 다양한 확장/축소 방식
    • Scale-OUT, IN, UP, DOWN 지원
  • 지능형 정책 및 최적화
    • CloudWatch 와 연동하여 특정 리소스 매트릭 지표(CPU 사용률등) 기반으로 확장/축소 정책 설정 가능
    • 가용성 최적화 ,비용 최적화, 균형 유지 등 사전 정의된 추천 정책 제공

Auto Scaling 구성요소

시작 템플릿


시작 템플릿을 생성하여 AMI ID 와 인스턴스 유형 인스턴스를 시작하는 데 필요한 파라미터를 미리 지정해 이미지화가 가능하다. 시작 템플릿을 구성하며 Auto Scaling 그룹에서 EC2 인스턴스를 시작하는데 사용하는 인스턴스 구성 템플릿이며 EC2 인스턴스 대한 정보를 지정한다.

그룹 용량


그룹은 자동 크기 조정 및 관리를 위한 논리적 그룹으로 EC2 인스턴스 모음을 포함한다. 그룹을 통해 상태 확인 대체 및 크기 조정 정책등을 통해 기능을 사용할 수 있으며 각 그룹의 최소 인스턴스 수를 지정하여 해당 값 이하로 내려가지 않게 조정한다.

Auto Scaling 호출

  • 상태확인
    • 지정된 수의 실행 인스턴스를 항상 유지하도록 그룹을 구성할 수 있다. 인스턴스가 비정상 상태가 되면 그룹에서는 비정상 인스턴스를 종료하고 이를 대체할 다른 인스턴스를 시작한다.
  • CloudWatch 경보
    • 크기 조정 정책이 EC2 Auto Scaling 에게 특정 CloudWatch 지표를 추적하도록 명령한다. 이 정책은 연결된 CloudWatch 경보가 ALARM 상태일 때 수행할 작업을 정의한다.
  • 일정
    • 일정에 따라 크기를 조정할 수 있다. 그러면 크기 조정 작업이 시간 및 날짜의 함수로 자동으로 수행된다. 일정에 따른 크기 조정은 그룹의 인스턴스 수를 늘리거나 줄여야 할 떄를 정확히 파악하고 있는 경우에 유용하다.
  • 수동 크기 조정
    • 리소스 크기를 저장하는 가장 기본적인 방법이다. 그룹의 최대 용량, 최소 용량 또는 권장 용량의 변경 사항만 지정한다. EC2 Auto Scaling은 인스턴스를 생성 또는 종료하는 프로세스를 관리하여 업데이트된 용량을 유지

Auto Scaling을 사용하는 크기 조정 방법

  • 예약 조정 (Scheduled Scaling)
    • 트래픽을 미리 예측할 수 있을 때 정해진 시간에 맞춰 용량을 자동으로 Scale-UP 또는 Scale-IN
  • 동적 조정 (Dynamic Scaling)
    • 트래픽, CPU 사용률, CloudWatch의 실시간 변화에 따라 자동으로 인스턴스 수를 조정 주로 가변적인 트래픽 발생시 사용
    • 대상 추적
      - 평균 CPU 사용률 등 지표값을 설정해 그 값에 맞춰 인스턴스 수를 조정
    • 단계별 조정
      - 경보 임계값을 여러 단계로 나눠 초과 정도에 따라 증설/축소 폭을 다르게 적용
    • 단순 조정
      - 단일 임계값을 초과할 때마다 정해진 수만큼 인스턴스를 증설/축소
  • 예측 조정 (Predictive Scaling)
    • 과거 트래픽 패턴을 분석해 앞으로의 트래픽을 예측하고 예상 되는 트래픽 증가 시점 전에 미리 인스턴스를 증설함 주로 트래픽을 예측할 수 없을때 사용

Auto Scaling을 사용하여 비용 최적화

  • 온디맨드 인스턴스
    • 가장 기본적인 요금 방식
    • 필요할 때마다 즉시 인스턴스를 생성하여 사용하는 만큼 비용 지불
  • 스팟 인스턴스
    • AWS에서 남는 EC2용량을 경매 방식으로 저렴하게 사용할 수 있는 옵션
    • 온디맨드 대비 최대 90%까지 비용 절감 가능
    • 중요한 점은 인스턴스가 예고 없이 중단될 수 있음
  • 예약 인스턴스
    • 1년 또는 3년 단위로 인스턴스 유형과 용량을 예약하여 온디맨드 대비 할인된 가격에 사용 가능
  • Savings Plans
    • 사용량에 대해 일정기간 약정을 맺고 할인된 요금으로 인스턴스를 사용할 수 있는 옵션
profile
기록의 힘은 대단하다

0개의 댓글