우리회사는 위험을 어떻게 관리할까?
장애공지
- 내가 속하지 않은 다른 팀에서 점심시간에 긴급대응을 해야하는 문제가 회사에 발생했다.
- 장애공지는 추리소설의 단서같다. 관련부서에서 조각조각 단편적인 사실들이 올라온다.
원인
- 중복적으로 요청이 발생해서 시스템 장애가 발생.
- 알고보니 이전부터 발생했던 이슈였지만 빈도가 적어 몰랐다.
어떻게 대응했는가?
- 관련부서별로 이슈 파악을 해보고 하나의 게시판에 공유를 했다.
- 점심시간이라는 예상하지 못한 시간에도 적극적으로 시간을 내어 대응하는 것이 인상깊다.
- 누구 잘못이라든지 부서탓하는 것이 없이 장애해결이라는 문제에 최우선적으로 접근하는 것이 보였다.
- 바로 당일에 문제를 해결할 사람들을 사람들을 소집해서 이슈를 수정했다.
나는 뭐했지?
- 다른 부서일이라 특별히 액션을 취하지 않았다.
- 게시글을 계속 모니터링 했다.
- 어떤 이슈때문에 문제가 발생했고, 그것의 결과는 제대로 팔로우업을 못했던 것같다.
미래계획
- 이슈 공유를 정리해서 사람들에게 공유해보면 좋지 않을까?
- 모르는 점에 대해 과감하게 접근해보자.