장애상황을 어떻게 해결하셨나요?

bluesky·2022년 9월 17일
0
  • 이것을 잘 답하지 못했다.
  • 내가 답했던 것은 로그와 정보 요청, 코드 분석, 재현시도 그리고 참고하여 해결… 이정도로 답했다. 이것밖에 생각하지 못했고, 실제로 그렇게 해왔었다.
  • 지인의 의견 참고하면, 디테일에서 부족했고, 그리고 지금 생각해보니, 해당 장애상황도 테스트 할수 있는 코드가 필요했다.
  • 그래서 내가 다시 답한다면…
    • 우선 장애를 제기한 담당자에게 버그 관리시스템(ex) 레드마인 )에 이슈를 상세하게 올려달라고, 재현하기 위한 상황도 같이 달라고 요청합니다. 관련된 사진과 당시 로그자료 전달또한 요청합니다.
    • [1] 정보를 충분히 모아봅니다.
      • 전달 받은 정보를 토대로
        • 재현을 시도합니다.
        • 에러 로그나 이슈 관련 로그에 명시된 클래스의 코드를 분석합니다.
        • 재현이 가능할경우, 재현이 가능한 테스트 코드를 작성하여 fail이 되도록 설정해봅니다.
    • [2] 위와 같은 방법으로 원인 분석 후, 해결 방안을 모색합니다.
      • 해결 방안이 다른 코드에 끼치는 영향, 성능, 보안 이슈도 고려합니다.
    • [3]해결합니다.
      • 코드를 작성합니다.
      • 테스트 코드가 작성 가능했다면, 테스트가 성공하도록 코드를 구현합니다.
    • [4] 회고합니다.
      • 팀내에 공유할만한 내용인지 파악후 공유합니다.
      • 개인 스스로 해당 장애를 어떻게 예방할수 있을지 고민합니다. 그리고 그것을 실천에 옮깁니다.
  • 앞으로는 장애 해결 과정도 가능하면 공유해보고 싶다.

참고자료

https://www.teamblind.com/kr/post/백엔드-면접-질문-yGdfZzvE

https://engineering.linecorp.com/ko/blog/line-failure-reporting-and-follow-up-process-culture/

profile
SMART https://github.com/dongseoki?tab=repositories

0개의 댓글