네이버클라우드 Cloud Insight소개

Burst·2022년 12월 27일
0
post-thumbnail

네이버 클라우드 모니터링 서비스

네이버 클라우드에서 제공하는 서비스 및 사용자 애플리케이션의 성능/운영 지표를 통합 관리하고, 장애 및 이벤트 발생 시 SMS/Email로 알람 통보를 해주는 서비스는 Cloud Insight와 Monitoring이 있다.

IaaS(Infrastructure as a Service)로 운영 인프라를 Migration을 하거나 구성을 하는 여러 이유 중 하나는 통합 모니터링을 쉽게 할 수 있다는 점이 있다. 이는 클라우드를 사용하는 매우 큰 이유 중 하나이다.
별도의 모티터링 서비스를 구축하거나 3rd Party 모니터링 서비스를 사용하지 않아도 쉽게 CSP에서 제공하는 모니터링 제품을 통해 서비스의 성능 및 운영 지표를 관리 및 확인 할 수 있다.

Cloud Insight VS Monitoring

Cloud Insight와 Monitoring은 Ncloud에서 제공하는 모니터링 서비스이다. 두 서비스 차이점은 아래와 같다.

  • Monitoring서비스는 Classic환경에서만 사용 가능
  • Monitoring서비스는 Server 관련 내용만 확인 가능
  • CloudInsight서비스는 Classic/VPC 모두 사용 가능
  • CloudInsight서비스는 Server 및 Object Storage, Load Balancer 등 10여개의 서비스의 대한 모니터링 가능

글을 작성하는 시점에서(2022년 12월 27일) Ncloud 공공존에서는 2023년 2월 Monitoring 서비스는 Fade Out 예정이다.
따라서 민간 및 금융존에서도 곧 Fade Out 될 서비스라 예상된다.

Cloud Insight

Cloud Insight는 위에서 설명했드시 Ncloud에서 제공하는 모니터링 서비스 이다.

기본적인 서비스 신청 및 사용 방법은 Ncloud에서 제공하는 문서를 확인하면 된다.
링크: https://guide.ncloud-docs.com/docs/cloudinsight-spec

이 글에서는 Cloud Insight의 기본 작동 방식 및 사용 방법에 작성하고자 한다.

1. Cloud Insight는 어떻게 Ncloud 서비스에 대한 Metric을 제공할 수 있을까?

Ncloud에서 제공하는 서비스는 기본적으로 System Metric을 Cloud Insight를 전달한다. 위 그림은 Ncloud 공식문서에서 제공하는 Cloud Insight 동작 그림이다.

서비스에 대한 Metric을 Cloud Insight에 전달하지 않으면 Cloud Insight에서는 확인할 수 가 없다. 그렇다면 어떤식으로 System Meric 즉, Ncloud에서 제공하는 서비스의 상태 정보를 Cloud Insgiht에서 확인 할 수 있을까? 간단하게 서버를 생성 후 확인해보면 쉽게 파악할 수있다.

서버 생성 후 ps -ef 명령어를 통해 실행 중인 프로세스 목록을 확인해 보면, Cloud Insight 관련 agent가 실행되고 있는 것을 확인 할 수 있다.

또한, Log를 확인해 보면 보다 정확히 알 수 있다. 실시간으로 서버의 Resuorce 관련 내용을 계속 전송하는것을 볼 수 있다.

이렇게 별도의 설정이 없이 기본적으로 Ncloud에서는 agent를 설치하여 자원 관련 Metric을 Cloud Insight으로 전송하고 있는 것을 볼 수 있다.
기본적으로 Cloud Insight로 전송되는 Metric을 System Meric이라 한다. System Metric 외 Extended Metric, Custom Metric이 있다.

[예시]
CPU Metric의 경우 Type이 Extended로 되어 있는것을 확인할 수 있다. 이는 상세 모니터링을 신청해야지만 확인 할 수 있다.

  • Custom Metric: 사용자가 정의하는 Metric으로 사용자 Application의 성능/운영 관련 Metric을 정의하여 Cloud Insight로 전송
    Custom Metirc을 사용하기 위해서는 Custom Schema를 생성하고 별도의 CW_KEY를 발급받아야 한다.

위에서 언급한 Cloud Insight API관련 상품목록 페이지를 확인하면 Cloud Insight 내 서비스 별 상품 이름 및 CW_KEY, 상품 세부 정보 등을 확인 할 수 있다.(🤩중요!)

해당 내용은 ManVSCloud 김수현님의 블로그를 참고하였다.
링크: https://manvscloud.com/?p=1842

2. Event 및 Event Rule

Cloud Insight서비스만 신청하더라도 기본적으로 제공하는 System Metric에 대한 정보를 Dashboard를 통해 확인 할 수있다.

세부 Metric 및 특정 Event에 대하여 모니터링을 구성하기 위해서는 Event Rule을 설정해야 한다.

콘솔 > Cloud Insight > Configuration > Template > Target Group / Rule Template

  • Target Group: 수집을 원하는 서비스 목록
  • Rule Template: 수집을 원하는 Event Rule 설정

Rule Template 생성 시 원하는 Metric을 선택하고, 해당 Metric에 대한 조건을 설정 할 수 있다.


CPU, MEMORY, FILE SYSTEM, NETWORK등 다양한 Metric이 있다.

위 그림의 빨간색 박스는 서버의 평균 CPU 사용량이 90% 이상이 되면 알람이 발생하는, 서버의 root 디렉토리의 평균 사용량이 90% 이상이 되면 알람이 발생하는 룰을 설정한 예시 이다.

콘솔 > Cloud Insight > Configuration > Event Rule
Event Rule 생성 시 위에 생성한 Target Group과 Rule Template를 선택하여 Event Rule를 생성 할 수 있다. 추가적으로 Event 발생 시 추가 액션에 대하여 설정 할 수 있다. 알람 메시지 발송(SMS/Emain), Integration(이벤트 내용을 별도 채널에 전송), Cloud Function, Auto Scaling 정책등을 설정 할 수 있다.

알림 메시지 발송의 경우 미리 통보 대상자 그룹을 생성하여야 한다.

😁결론

Cloud Insight 서비스가 어떻게 작동되고 Event를 생성하여 모니터링 하는 방식을 알아 보았다.
사실 Cloud Insight 서비스는 기존에 사용을 하고 있었고, 대략적으로 어떤 서비스인지는 알고 있었다. Cloud Insight API사용을 위해서는 보다 세부적진 사용방법 및 동작방식에 대하여 알아야 했다. Cloud Insight API 사용 글에서 추가적으로 말하겠지만, API 사용 시 제공하는 API 문서만으로는 어떻게 설정하고 어떻게 사용하는지를 알기가 어려웠다. 콘설에서 설정 내용을 확인하고 API문서를 참조해서 사용 할 수 있었다. Cloud Insight에 대한 설정 및 사용은 콘솔에서 제어하는냐 또는 API를 통해 제어하느냐 차이만 있지 실제 동작은 같기 때문이다. 이글은 Cloud Insight API사용 글을 쓰기 전 Cloud Insight가 어떠한 서비스고 어떻게 동작하는지를 먼저 작성해야 할거 같아서 작성해본다!!

profile
Cloud Developer

0개의 댓글