이상 탐지 문제해결 프로세스

1. 정상(normal) 데이터 정의

  • 정상데이터란 특별한 이상이 없는 정상적인 데이터, 이상(abnormal)이라고 정의된 데이터 이외에 데이터
  • 제조 도메인 : 제품의 명확한 Spec이 존재하기 때문에, Spec안에 위치한 정상 제품의 데이터
  • 금융 도메인 : FDS 시스템에 검출 되지 않는 일반적인 거래 데이터
  • 게임 도메인 : 블랙리스트 및 버그 의심 유저를 제외한 일반 유저들의 Play Data

2. 이상(abnormal) 데이터 정의

  • 이상(abnormal) 데이터란 사전에 감지하고 싶은 이상 데이터
  • 제조 도메인 : 고장이 발생하기 전 이상을 탐지하는 것이 주 목적이기 때문에 Spec 상, 하한치에 근접해 있는 제품 / 시계열 센서 데이터의 경우 오차범위를 지정하고 오차 범위 진입 시 이상으로 판단한다.
  • 금융 도메인 : 스코어링 및 룰 기반 이상 데이터 정의
    (*스코어링, 룰 개념 https://velog.io/@jjong2961/Anomaly-Detection3 / 금융파트)
  • 게임 도메인 : 사전에 탐지된 버그 및 어뷰징 유저의 사용 패턴.

3. 데이터 수집 및 추출 과정 오류 확인

※이상 탐지의 목적은 이상치를 사전에 빠르게 찾아야 하는 것이 주된 목표이다.※

  • 데이터 적합성 검증 : 수집 및 추출/변환 과정에서 오류가 없었는지 확인할 것.
  • 데이터 ETL 과정에서 각 단계별 이슈를 확인 할 것.
    (Extract : 추출 / Transform : 변환 / Load : 로드)

4. Outlier Detection

  • Data type, Data Label, Train Data
  • 학습 유형 : Supervised Learning, Semi-Supervised Learning, Unsupervised Learning
  • 패턴 유형 : Outlier Detection, Novelty Data
  • 데이터 유형 : Univariate Data, Multivariate Data
  • 데이터 종류 : Time-Series, Non-Time_Series Data

5. 평가 방법 선정

  • Scoring 평가 : Threshold의 수준에 따라 경고의 수준을 전달
  • Prediction 평가 : Threshold를 설정하여 Normal(1), Abnormal(0)을 구분하여 전달.
  • 민감도 설정 : 민감도 설정에 따라 탐지하는 이상의 개수와 Point가 달라진다.

6. 모니터링 및 대응 프로세스 수립

  • 이상을 감지하기 위한 현업 모니터링 시스템 설계 ex)대시보드, Slack 알람, e-mail 알람 등..
  • 이상 감지 후 점검하기 위한 현업 Action 프로세스 설계 ex) 유선 확인, 전문가 점검, 주요 지표 수치 확인 등..
  • False Alarm(오탐지) 이벤트에 대한 대응체계 마련해야 함!!
  • 정상 데이터 패턴 변화에 대응하기 위한 재학습 체계 수립.
    ※ 정상 데이터 패턴 변화에 대해서도 인지해야 한다. 즉, 현업에서 변경되는 프로세스를 파악하는 것이 중요하다.
profile
please bbbbbbbbb 😂

0개의 댓글