TIL 2022-06-16

김병호·2022년 6월 17일
0

우리회사는 위험을 어떻게 관리할까?

장애공지

  • 내가 속하지 않은 다른 팀에서 점심시간에 긴급대응을 해야하는 문제가 회사에 발생했다.
  • 장애공지는 추리소설의 단서같다. 관련부서에서 조각조각 단편적인 사실들이 올라온다.

원인

  • 중복적으로 요청이 발생해서 시스템 장애가 발생.
  • 알고보니 이전부터 발생했던 이슈였지만 빈도가 적어 몰랐다.

어떻게 대응했는가?

  • 관련부서별로 이슈 파악을 해보고 하나의 게시판에 공유를 했다.
  • 점심시간이라는 예상하지 못한 시간에도 적극적으로 시간을 내어 대응하는 것이 인상깊다.
  • 누구 잘못이라든지 부서탓하는 것이 없이 장애해결이라는 문제에 최우선적으로 접근하는 것이 보였다.
  • 바로 당일에 문제를 해결할 사람들을 사람들을 소집해서 이슈를 수정했다.

나는 뭐했지?

  • 다른 부서일이라 특별히 액션을 취하지 않았다.
  • 게시글을 계속 모니터링 했다.
  • 어떤 이슈때문에 문제가 발생했고, 그것의 결과는 제대로 팔로우업을 못했던 것같다.

미래계획

  • 이슈 공유를 정리해서 사람들에게 공유해보면 좋지 않을까?
  • 모르는 점에 대해 과감하게 접근해보자.
profile
노력하는 개발자입니다!

0개의 댓글