











쿠버네티스 API를 통해서 리소스 및 정보를 확인 할 수 있음
You will be able to view and explore all standard Kubernetes API resource types such as configuration, authorization resources, policy resources, service resources and more


default 는 로깅이 켜져 있지 않음

활성화


로그 그룹 확인

- 로그 tail 확인 : aws logs tail help
aws logs tail /aws/eks/$CLUSTER_NAME/cluster | more- 신규 로그를 바로 출력
aws logs tail /aws/eks/$CLUSTER_NAME/cluster --follow- 필터 패턴
aws logs tail /aws/eks/$CLUSTER_NAME/cluster --filter-pattern <필터 패턴>- 로그 스트림이름
aws logs tail /aws/eks/CLUSTER_NAME/cluster --log-stream-name-prefix kube-controller-manager --follow
kubectl scale deployment -n kube-system coredns --replicas=1
kubectl scale deployment -n kube-system coredns --replicas=2- 시간 지정: 1초(s) 1분(m) 1시간(h) 하루(d) 한주(w)
aws logs tail /aws/eks/$CLUSTER_NAME/cluster --since 1h30m- 짧게 출력
aws logs tail /aws/eks/$CLUSTER_NAME/cluster --since 1h30m --format short
aws logs get-query-results --query-id $(aws logs start-query \
--log-group-name '/aws/eks/myeks/cluster' \
--start-timedate -d "-1 hours" +%s\
--end-timedate +%s\
--query-string 'fields @timestamp, @message | filter @logStream ~= "kube-scheduler" | sort @timestamp desc' \
| jq --raw-output '.queryId')
eksctl utils update-cluster-logging --cluster $CLUSTER_NAME --region $AWS_DEFAULT_REGION --disable-types all --approve
aws logs delete-log-group --log-group-name /aws/eks/$CLUSTER_NAME/cluster



확인

그런데.. 저는 왜 Address에 주소가 안나올까요? 콘솔에는 나오는 것 같은데..

타겟그룹이 안묶이는 것 같은 느낌이다 다시 확인해볼 것

nginx 웹 서버 내에서 위 directory 안에 access , error 로그가 symbolic 링크가 걸려 있다.
kubectl logs로 pod내 로그가 output으로 나오는 것이 가능한 이유는
container이미지를 만들 때 중요한 로그를 stdout를 symbolic link를 걸고 error는 stterr로 symbolic link를 건다

그래서 pod 내 직접 들어가지 않고도 로그 확인 가능한 것
이렇게 로그를 확인 하는 것의 단점은
1. 명령어로 확인이 가능하다
2. kubelet 기본 설정은 로그 파일의 최대 크기가 10Mi로 10Mi를 초과하는 로그는 전체 로그 조회가 불가능함


경로에 들어가 보면 각 pod의 로그 확인 가능하다

2. host 로그 소스(Logs from /var/log/dmesg, /var/log/secure, and /var/log/messages), 노드(호스트) 로그













명령어 : kubectl describe cm fluent-bit-config -n amazon-cloudwatch








Metrics-server 확인 : kubelet으로부터 수집한 리소스 메트릭을 수집 및 집계하는 클러스터 애드온 구성 요소






이미지 업데이트 방안2 : set 사용 - iamge 등 일부 리소스 값을 변경 가능!

이거는 영상 보니 엄청 편리해보이는데 webhook 채널에 botkube가 보이지 않는다 ㅠ 나중에 꼭 써봐야겠다
설치, 확인



아래 처럼 프로메테우스가 각 서비스의 9100 접속하여 메트릭 정보를 수집
kubectl get node -owide
kubectl get svc,ep -n monitoring kube-prometheus-stack-prometheus-node-exporter
노드의 9100번의 /metrics 접속 시 다양한 메트릭 정보를 확인할수 있음 : 마스터 이외에 워커노드도 확인 가능
ssh ec2-user@$N1 curl -s localhost:9100/metrics

인증서 설정을 잘못했는지 뜨지 않습니다..
수정해서 다시 확인해보겠습니다


테스트 pod 배포

접속 확인

잘못된 설정으로 프로메테우스랑 그라파나 테스트를 해보지 못한거같습니다
다들 바쁘신데도 불구하고 자료 만들어 주셨는데 ㅠ_ㅠ 과제를 너무 데드라인에 임박해서 하는 바람에 우선 제출은 하지만 꼭 다시 해보겠습니다...ㅠㅠ
다음부턴 미리미리 과제를 진행하도록 하겠습니다ㅠㅠ