WhaTap DevOps Day 후기

노관옥·2022년 7월 5일
1
post-thumbnail

WhaTap

저는 AWS Summit Korea 2022 에서 김성조 CTO님의 강연을 들으면서 와탭을 처음 알게 되었는데요,
많은 스폰서들이 있었지만 가장 인상 깊었던 회사는 와탭랩스 였습니다.


DevOps에 관심을 가지게 된 이유

DevOps란?

사실 잘 이해한 건지 모르겠지만 😅, 개인적으로는

  • 오래 걸리는 업무를 더 효율적으로 처리하고
  • 반복되는 일을 자동화시키는 것

을 중요하게 보고 있습니다.

반복적 비효율의 연속

제가 처음 회사에 입사했을 땐 주로 기능을 개발하는 업무를 했습니다.

하지만, 현재는 인프라 관리와 기술지원까지 맡게 되면서,
사용자에게 서비스가 제공되는 과정의 전반적인 부분을 알게 되었습니다.

하지만, 풀어야 할 숙제도 역시 늘어났습니다.

그 중 가장 까다로운 부분은 문제의 원인을 파악하는 것 같습니다.

  • 로그를 찾는 시간이 오래 걸림
  • 트래픽 때문에 서버가 느린데, 어디서 문제가 생겼는 지 모르겠음

와 같은 불시에 찾아오는 문제는 당장 집중해야 할 업무에도 영향을 줍니다.

해결책

아직 보완해야 할 것들이 많지만..

저는 원인 파악에 들어가는 시간을 조금이라도 줄이기 위해 다음과 같은 작업을 합니다.

  • API 응답을 더 친절하게 수정한다
  • 분석할 로그를 더 예쁘게 뽑는다
  • 유형별로 로그의 채널을 나눈다

어렵지 않은 작업이지만, 이렇게 눈에 보이는 정보가 더 쉽게 들어오도록 개선하면
분석하는 시간이 꽤 많이 줄어들더라구요.

이렇게 불편한 부분을 하나하나 개선하다 보니 데브옵스라는 개념을 접하게 됐고,

데브옵스에 관심을 가지고, 와탭랩스에서 주최한 DevOps Day에 참여하게 되었습니다.


Monitoring vs Observability

김성조 CTO님은 행사가 시작하기 전 인삿말에서

"최근 주변에서 모니터링에서 옵저버빌리티로 명칭하는 것 같다" 라고 하셨는데요,

많은 사람들에게 익숙한 모니터링과 아직 생소한 옵저버빌리티의 다른 점은

Monitoring

  • 현재 상태(되는 걸) 알려준다

Observability

  • 현재 상황을 분석해 왜 안되는 지 알려준다

라고 합니다.


AWS의 옵저버빌리티 사례

이 날 첫 강연은 AWS Korea 최철우님이 발표해주셨습니다.

제 수준에는 많이 어려운 내용이었지만, 제가 앞으로 공부해야 할 것들을 알게 된 시간이었습니다.

강연에서는 Cloudwatch를 주로 다뤘는데요,

로그보는 용도로만 사용하는 제가 아직 많이 부족하다고 생각한 강연이었습니다.

서비스 메트릭 모니터링

우선 메트릭은 CPU 사용량, 5분 내 네트워크 Output 과 같은 특정 수치를 시각화 한 것을 의미합니다.

AWS Cloudwatch 에선 각 서비스들에서 메트릭 정보를 제공하고 있습니다.

이는 모니터링을 위해 필요한 지표를 수집 및 시각화하는 데 도움을 준다고 합니다.

백분위 값에 대한 매트릭

서비스 Latency, CPU 사용률 값의 이해

→ p99, p95, p90 등 지표를 사용해서 서비스의 병목현상을 파악할 수 있다고 합니다.

여기서 p99는 5분 내 Latency로 예를 들면

5분간 지연 시간이 7초라 했을 때 모든 요청의 99퍼센트는 7초 이내라는 말입니다.

나머지 1퍼센트는 7초보다 더 걸렸다는 말이죠.

저는 모니터링하면 보통 최대치나 평균값만 봤는데 이런 것도 있구나.. 했습니다

매트릭에 대한 알람 구성

Cloudwatch Alarm

시스템/서비스 별 어떤 지표가 중요한 지 설정하고

일정 값에 닿거나 넘어가면 알람을 보내는 기능도 있다는데

이 때 딴짓하느라 제대로 못들었습니다..

Composite Alarm

여러 알람을 종합해서 중요한 정보?

암튼 운영에 집중할 수 있도록 해준다고 합니다..

느낀 점

역시 저는 AWS (클라우드) 가 익숙한거지, 잘 하는건 아닌 것 같습니다. 😅

하지만 Cloudwatch를 더 깊게 탐구하고 싶은 마음도 생겼고 좋은 내용 알려주셔서 정말 감사했습니다. 👍


성장하는 엔지니어 학습 문화

다음은 코드스쿼드 CEO 김정 님의 기술적인 내용이 아니라 다소 가벼운 주제로 강연을 해주셨는데요,

이 부분은 최근 함께 자라기를 읽었는데 겹치는 부분이 많아서 나중에 따로 정리하고 싶습니다.

정말 좋은 내용이었습니다.

저는 이 강연이 제일 좋았습니다 😘


점심시간

와 점심 진짜 맛있었습니다.

도시락이지만, 최근에 먹은 음식 중에 가장 맛있었어요 😋

도시락을 제 자리에 가져다주셔서 움직이지 않고 식사를 할 수 있었습니다.

이런 경험은 처음이네요 😆

  • 밥 맛있었습니다 👍
  • 저 버섯 안좋아하는데 버섯전? 맛있었습니다 👍
  • 감자 계란 샐러드 맛있었습니다 👍
  • 계란말이 맛있었습니다 👍
  • 연어 안좋아하는데 연어스테이크 맛있었습니다 👍
  • 아스파라거스 잘 안먹는데 맛있었습니다 👍
  • 치킨 맛없는 치킨이 어디있을까요 👍
  • 메추리알 장조림 제가 정말 좋아하는데요 맛있었습니다 👍
  • 오징어 젓갈 좋습니다 👍
  • 자취생이 과일을 어디서 먹습니까 너무 좋았습니다 👍

밥 진짜 최고였어요~~


클라우드와 개발자, 모놀리틱부터 오케스트레이션까지

이번 강연은 메가존클라우드의 황학범이 발표해주셨습니다.

역시 제가 이해하기엔 저의 기본 지식이 정말 부족했고,

생각날 때 하나하나 정리해서 블로그에 올려봐야겠습니다..ㅎㅎ

이건 IT 서비스들 배포에 사용할 수 있는 방법들을 피자에 비유해서 표현한 그림을 소개해주셨습니다.

On-Premise

가장 왼 쪽에 있는 건 온프레미스(On-Premise) 방식으로, 모든 걸 다 스스로 구현하는 겁니다.

서버도 구매해야하죠, 어플리케이션 개발해서, 도메인 연결하고.. 만들고 싶은 서비스의 모든 걸 스스로 구현해야 하는 방식입니다.

피자를 1판만 만들거면 쿠팡이츠로 시켜서 고객님한테 드리면 되지만, 고객이 100명, 1000명 이 넘어가면 피자집을 차리는 게 원가가 더 저렴하겠죠?

그래서 온프레미스 방식은 뒤에 나오는 방식보다 상대적으로 원가가 적습니다.

IaaS (Infrastructure as a Service)

이건 피자 만드는 재료정도는 제공해줍니다.

클라우드 기준으로는 서버, 스토리지 등이 되겠네요.

PaaS (Platform as a Service)

피자를 만드는 사람은 오직 피자에만 집중할 수 있도록 재료는 물론, 피자를 만드는 데 사용하는 주방용품을 제공합니다.

이건 AWS의 람다를 예시로 들 수 있습니다.

개발자는 코드에만 집중하면 되는거죠.

SaaS (Software as a Service)

피자입니다.

그냥 먹으면 되듯이, 소프트웨어 그 자체입니다 그냥 사용하면 됩니다.

이건 완성품에 가깝기 때문에 앞에 나온 온프레미스 방식보다 원가는 비쌉니다.

하지만, 편하죠.

쿠버네티스 어렵지 않다

쿠버네티스를 도입하지 않은 분들은 쿠버네티스라는 단어만 듣고 어렵게 느껴진다고 합니다.

근데 사실 쿠버네티스는 생각보다 어렵지 않다고 했습니다.

저는 이 말에 꽤 공감을 했습니다.

쉬워서는 아니고, 쿠버네티스라는 단어를 처음 들었을 때 진짜 어려워보였거든요 😅

하지만, 따라서 만든다고 생각하면 정말 어려울 것 같습니다!

유용한 CI/CD 솔루션

추가로 다양한 솔루션들도 소개해주셨습니다.

들어보긴 했지만, 사용해보진 않았습니다 ^^

겉핥기라도 시도해보면서 이런 기술을 접해봐야한다고 생각하는데, 부지런하지 못했던 것 같습니다 하하..

네 아무튼! 메가존클라우드 황학범님의 강연 덕분에 최근 클라우드 동향을 알게 되어서 정말 유익한 강연이었다고 생각합니다! 🫶


롯데ON MSA 모니터링 최적화 사례

뒤이어 롯데이커머스의 정성민님이 강연을 해주셨습니다.

롯데ON은 그냥 어디서 들어본 어플이름 같았는데

꽤 역사가 깊더라구요!

1996년 제가 태어나기도 전에 롯데는 인터넷쇼핑몰을 만들었다고 합니다. 🙀

롯데는 꽤 오래전부터 마이크로서비스를 도입했더라구요.

그리고 6새의 사이트, 30개의 서비스, 2136개의 파드를 운영중이라고 합니다!

동접자가 6000명 정도라고 하는데 6000분 받으려면 이정도는 해야하나... 싶었습니다

와탭자랑시간

리뷰 작성하면 포인트 주는 적립행사 했는데, 한 사람당 한 번인 이벤트가

모든 리뷰에 3000 포인트가 지급돼버리는! 네, 이벤트 설정이 잘못된 상황인거죠..

근데 이걸 와탭의 실시간 모니터링으로 대처했다고 합니다.

와탭을 통한 이런 저런 문제 극복 경험을 풀어주셨습니다.

물론 전 써보진 않았지만, 이 날 들은 와탭의 전체적인 평가를 종합해보면 속도만큼은 정말 시원시원한가봅니다!

옵저버빌리티도 와탭이랑 하고싶다고했나 네 암튼 그랬던 것 같습니다.

슬슬 기억이 안나네요..


(신한카드) 금융권 퍼블릭 클라우드, DevOps 구축 여정

여기서부턴 집중력이 좀 떨어져서 대충 듣기도 했고,

중간중간 듣긴 했지만, 이 날 가장 어려운 내용이 아니었나... 해서 아무것도 모르겠습니다 ㅋㅋ

예상에 없던 회사 업무도 생겨가지고.. 아쉽네요 ㅠ.ㅠ

그래도 기억나는 내용은

  • 대한민국의 금융권은 기존에 법적으로 불가능했던 클라우드로 전환하고 있습니다.
  • 그리고 보안이 정말 중요하고, 아직도 풀어야 할 숙제나 작업들이 많이 있다고 합니다.

와탭랩스 DevOps 이야기

오늘 두 번째로 좋았던 강연입니다.

와탭랩스 데브옵스팀 송재진님이 발표해주셨습니다.

마지막 순서라서 저의 집중력이 바닥임에도 불구하고, 좋은 내용 마음에 새겨갑니다. 😊

와탭랩스의 데브옵스팀

1명의 리더와 4명의 주니어로 이루어진 팀이라고 합니다.

물론 리더는 발표해주신 송재진님입니다.

그리고 와탭랩스에서는 데브옵스는 물론이고, 운영업무도 한다고 합니다 (🧐..?)

네 이렇게 팀 소개를 해주셨습니다.

데브옵스를 가로막는 것

  • 기술의 부족 → 개발자가 다 아는 게 아님
  • 레거시 환경 → 뭔가 잘못될 것 같아서 아무도 손을 안댐

네.. 정말 공감합니다.

제가 이 강연 듣고 회사에 있는 서비스들 업그레이드 하고 있는데, 우쉬.. 개복치도 아니고 뭐 하나 건들면 뻗어버립니다...ㅜㅜ

운 좋게도 와탭랩스는 좋은 문화가 있다!

  • 실패를 장려한다 → 실수해도 다른 회사에 비해 잃을 게 별로 없기 때문이라고 합니다 ㅋㅋ
  • 책임 소재를 따지지 않는다
  • 부서간 장벽이 없다

업데이트 요령

버전 차이가 많이 나더라도, 한 버전씩 업그레이드하면 좀 더 쉽게 업그레이드가 가능하다고 합니다.

안티패턴

  • 이슈가 없으면 손대지 않습니다.
    = 네, 제가 그랬습니다.

안쓰는 리소스는 삭제하자

  • 복잡도를 줄일 수 있는 최고의 전략이 될 수 있습니다.

기술부채

현재 서비스에 뭔가 자꾸 알 수 없는 이상한 일이 일어난다면 기술부채가 늘어난다는 신호입니다.

점진적으로, 조금씩 바꿔서 기술부채를 모두 상환하는 날 까지...

저 말고는 시도할 사람이 없다는 걸 알기에, 트래볼루션의 서비스를 책임지고 개선해보도록 하겠습니다 🔥

profile
Go, MLOps를 공부중입니다

0개의 댓글