Horizontal pod autoscaling : Contoller에 의해 관리되는 Pod 의 Replicas 수가 자동으로 스케일링 되는 것HPA(Horizontal Pod Autoscaler)가 Scaling 설정한다.Controller가 주기적으로 Metric을
쿠버네티스에서 서비스를 운영하기 위한 전체 Flow
Kubernetes를 운영하다보면, 특정 워커에는 배포가 되지 않도록 하고 싶은 경우가 있다.예를 들어, 딥러닝 어플리케이션들이 배포되는 클러스터에 일부 워커에만 GPU가 붙어있을 때 GPU가 필요 없는 어플리케이션들은 해당 워커들에 배포가 되지 않도록 막고 싶은 경우
앞서 작성한 포스팅에서 확인할 수 있겠지만 흔히 아는 HPA, CA에 관련한 정리를 참고하고 보면 좋다.앞서 설명했던 HPA는 => 수평적인 방향으로 새로운 Pod가 생성되는 것이라면, resource (more room for cpu or memory)를 추가하여 수
앞서 Kubernetes에서 Pod를 특정 노드에 할당하기 위해 방법을 많이 살펴보았다. NodeSelector 또한 Pod를 특정 노드 또는 노드 그룹에 제한적으로 스케줄링할 수 있다.우선 NodeSelector를 알아보기 전 'nodeName'에 대해 먼저 말하려
Service는 다른 Pod의 요청이나 외부 클라이언트로부터 오는 HTTP 요청에 모두 응답한다.외부 클라이언트가 서비스에 대한 요청을 하려면, 서비스를 노출시키기위해 L4로드밸런서를 사용하는 경우가 일반적이다. 이를 통해 외부 클라이언트의 트래픽이 서비스에 전달된다.
앞서 실습을 진행하면서 Requests와 Limits 값을 정해 Pod 를 배포했고, 이에 대한 더 자세한 설명을 하고자 생각해두고 있었다. 어떠한 형식으로 진행되기에 이 값들을 지정해 주어야 하는지에 대해 정확한 이해가 필요하다고 생각한다.대표적으로, Kuberne
단계 1 : Prometheus 설치 prometheus.yaml 파일을 작성한다. prometheus-config.yaml 파일을 작성한다. 단계 2 : 리소스 배포 Prometheus와 관련된 ConfigMap과 서비스를 배포한다. 단계 3 : Promethe