
HPA는 애플리케이션의 리소스 사용량(CPU, 메모리 등)을 기준으로 Pod 수를 자동으로 조절하는 오브젝트이다.
일반적으로 Deployment, ReplicaSet, StatefulSet에 적용 가능하다.
리소스 사용량을 기반으로, 정의된 임계치를 넘기면 Pod의 수를 늘리고, 사용량이 줄어들면 다시 줄인다.
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
name: example-hpa
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: my-app
minReplicas: 2
maxReplicas: 10
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 50