IT 관련 학과 전공자이거나 IT 업계에 종사하고 계신 분이시라면 ITSM이라는 용어는 익숙하거나 낯설지 않으실 것이라고 생각합니다. ITSM은 IT 서비스 관리(IT Service Management)의 약자로 아래와 같은 의미를 가지고 있습니다.
IT 서비스를 수명주기 전반에 걸쳐 관리하고 지원하기 위한 정책 및 프로세스의 집합
잘 이해가 가지 않으실 수도 있는데 기존의 기술 중심 관리에서 벗어나 경영 지향적, 서비스 관점에 입각해서 보다 체계적으로 관리하기 위한 접근 방법이라고 보시면 됩니다.
구성 관리(Configuration Management)는 구성 항목(Configuration Items)의 버전을 식별하고 통제, 유지 관리, 증명하는 작업을 의미함
구성 관리는 이러한 작업들을 통해 IT 인프라에 대한 논리적인 모델을 제공하는데, 여기서 IT 인프라는 서버, 네트워크, 애플리케이션이 포함됩니다. 구성 관리는 서비스 데스크에 구성 항목의 정확한 정보를 제공함으로써 인시던트, 문제, 변경 및 릴리즈 관리와 같은 타 프로세스를 위한 기준점을 제공합니다.
변경 관리(Change Management)는 IT 환경에서의 시작부터 구현까지 발생하는 변경 요청을 관리하고 통제하는 것을 의미함
여기에서 변경은 서비스에 직간접적인 효과를 줄 수 있는 어떠한 것의 추가, 수정 또는 제거 행위를 의미합니다. 간단히 말해서 조직의 운영에 영향을 줄 수 있는 조직의 IT 인프라에 대한 모든 변경은 IT 변경이라고 불립니다.
인시던트 관리(Incident Management)는 서비스 중단이나 서비스 품질의 저하를 일으킬 수 있는 경우를 관리하여 서비스의 품질 및 가용성의 수준을 최대한 유지하는 것을 의미함
인시던트 관리는 발생한 인시던트를 신속하게 처리함으로써 서비스의 품질과 가용성을 최대한으로 유지할 수 있습니다. 인시던트 관리는 아래에서 설명할 서비스 수준 관리와도 밀접한 연관이 있습니다.
릴리스 관리(Release Management)는 시스템 운영 환경에서 릴리스 적용을 통제하고 변경과 관련된 위험을 최소화하는 것을 의미함
여기에서 릴리스란 실제 운영환경에 테스트하고 적용하는 IT 서비스와 관련된 인가된 변경을 의미합니다. 소프트웨어 릴리스의 계획, 설계, 일정 관리, 테스트, 배포 및 제어 프로세스를 뜻하는 릴리스 관리는 릴리스 팀이 기존 생산 환경의 무결성을 유지하면서 기업이 요구하는 애플리케이션과 업그레이드를 효율적으로 제공할 수 있도록 보장합니다.
서비스 수준 관리(Service Level Management)는 모든 IT조직이 비즈니스를 지원하기 위해 제공하는 시스템 운영 서비스의 수준을, 정량적으로 측정하고 실적을 평가하여 미흡한 부분을 개선함으로써 궁극적으로 서비스의 품질을 보장하는 활동
서비스 수준 관리는 어떠한 서비스를 측정하고 보고할 것인가에 대해 구체적인 목표를 정의하므로 상호 간에 명확한 기대치를 공유하여 잠재적인 오해나 불만요소를 제거할 수 있고, 고객과 서비스 제공자 간의 역할과 책임을 명시하므로 책임 있는 서비스 수행과 의사소통이 가능해집니다.
IT 서비스 연속성 관리(IT Service Continuity Management)는 비즈니스에 중단을 초래하는 상황이 생겼을 때, 정해진 복구 스케줄에 의해 IT 서비스가 비즈니스 요구사항을 중단 없이 제공하기 위한 활동을 의미함
IT 서비스 연속성 관리에서는 IT 서비스의 연속성을 유지하기 위한 여러 가지 방안들을 마련해야 하고, 장애 발생 시 복구할 수 있는 계획을 수립하고 끊임없이 테스트를 수행해야 합니다. 장애 복구에 대해서는 재해 복구 시스템(Disaster Recover, DR)까지 고려하여 다양한 장애 상황에 대응하여 빠른 복구를 지원해야 합니다.
이렇게 ITSM에는 여러 관리 프로세스들이 존재합니다. ITSM은 IT 서비스를 수명 주기 전반에 걸쳐 관리하고 지원하기 위한 정책 및 프로세스의 집합이며 기업의 효율성을 강화하고 직원 생산성을 높여줍니다.
최근 많은 기업들이 B2B 또는 B2C 형태로 고객에게 SaaS 서비스를 제공하고 있는데 안정적인 서비스 제공 측면에서 인시던트 관리에 대한 중요성이 점차 높아지고 있습니다. 지금부터는 ITSM의 여러 관리 프로세스 중 인시던트 관리에 대해서 살펴보도록 하겠습니다.
그렇다면 우리는 먼저 인시던트(Incident)라는 용어를 이해해야 합니다. ITSM에서는 인시던트 관리와 유사한 문제 관리라는 프로세스가 있습니다. 인시던트와 문제는 얼핏 생각하면 큰 차이가 없는 것 같은데 둘은 과연 어떤 차이가 있을까요?
인시던트 : 계획되지 않은 IT 서비스의 중단이나 IT 서비스의 질을 감소시키는 이벤트
문제 : 하나 이상의 인시던트의 근본 원인을 해결해야 하는 것. 해결방안을 아직 모르는 인시던트
인시던트 관리의 경우 가능한 신속하게 정상적인 서비스 운영을 복원하는 것을 목표로 한다면 문제 관리는 정상적인 서비스 운영을 위해 근본적인 원인을 파악하는 것을 목표로 합니다. 기업은 높은 효율성과 생산성을 달성하기 위해 중단 없는 서비스를 제공해야 하고, 이러한 측면에서 봤을 때 인시던트 관리는 상당히 중요한 부분입니다.
이러한 인시던트 관리는 서비스의 품질 및 높은 가용성을 유지하는데 필수적인 프로세스라고 할 수 있습니다. 그렇다면 인시던트 관리에 있어서 중요한 포인트는 어떤 것들이 존재할까요? 바로 인시던트 식별과 신속한 해결일 것입니다. 인시던트가 발생한 사실을 빠르게 인지하고 이를 해결할 수 있도록 적절한 담당자들에게 알림을 전송하고 그들의 지원을 통해 인시던트를 빠르게 해결하고 안정적인 서비스를 유지할 수 있을 것입니다.
지정된 시간에 종결된 모든 인시던트의 수와 관련하여 SLA 목표 시간 내에서 종결된 인시던트의 개수입니다. 인시던트 해결 시 SLA 목표 시간을 준수하도록 MTTA와 MTTR을 관리해야 합니다.
지정된 시간에 종결된 모든 인시던트의 수와 관련하여 고객이 Solution을 승인하지 않았기 때문에 종결되었다가 다시 연 인시던트의 개수입니다. 다시 연 인시던트의 비율이 낮게 유지되도록 관리해야 합니다.
지정된 시간에 아직 종결되지 않은 인시던트의 개수입니다. 종결되지 않은 인시던트의 개수가 많다는 것은 서비스가 안정적이지 못하다는 증거가 될 수 있습니다.
지정된 기간에 새로 보고된 총 인시던트 수입니다. 총 인시던트 수가 낮게 유지되도록 관리해야 합니다.
앞서 이야기 한대로 인시던트 관리는 고객에게 제공하는 서비스의 품질 및 높은 가용성을 유지할 수 있도록 하는 하나의 전략, 방법입니다. 만약 서비스가 중단된다고 가정해보겠습니다. 서비스 중단은 막대한 재산적 피해 뿐 아니라 기업, 비즈니스 자체의 명성에도 손상을 입힐 수 있습니다. 서비스 중단 시간을 단축할 수 있도록 준비하여 매출 손실을 보호하고 브랜드 평판을 유지할 수 있어야 합니다. 이런 측면에서 인시던트 관리는 매우 중요합니다.
지금까지 ITSM의 주요 항목들과 인시던트 관리에 대해서 살펴봤습니다. SaaS 서비스를 고객들에게 제공하고 있다면 안정적이고 가용성 높은 서비스 제공을 위해 인시던트 관리는 중요합니다. 인시던트 관리의 전략을 세우고 효율적인 도구를 이용하여 인시던트 관리를 수행한다면 고객들이 만족할 수 있는 서비스를 제공할 수 있을 것입니다.
의종님~ 굿!!!