How to Evaluate the Quality of Unsupervised Anomaly Detection Algorithms?

TaeJong Kim·2024년 4월 11일

논문 초록 해석

목록 보기
4/7

paper link : https://arxiv.org/abs/1607.01152

Abstract

When sufficient labeled data are available, classical criteria based on Receiver Operating Characteristic (ROC) or Precision-Recall (PR) curves can be used to compare the performance of un-supervised anomaly detection algorithms. However , in many situations, few or no data are labeled. This calls for alternative criteria one can compute on non-labeled data. In this paper, two criteria that do not require labels are empirically shown to discriminate accurately (w.r.t. ROC or PR based criteria) between algorithms. These criteria are based on existing Excess-Mass (EM) and Mass-Volume (MV) curves, which generally cannot be well estimated in large dimension. A methodology based on feature sub-sampling and aggregating is also described and tested, extending the use of these criteria to high-dimensional datasets and solving major drawbacks inherent to standard EM and MV curves.

Translate

  1. When sufficient labeled data are available,
    -> 라벨 데이터가 충분히 이용가능할 때,

  2. classical criteria based on Receiver Operating Characteristic (ROC) or Precision-Recall (PR) curves can be used to compare the performance of un-supervised anomaly detection algorithms.
    -> ROC나 PR에 기반을 둔 전통적인 평가방법은 비지도학습 이상치 탐지의 성능을 비교하는데 사용할 수 있다.

  3. However, in many situations, few or no data are labeled.
    -> 그러나, 많은 상황에서, 데이터는 거의 라벨되어있지 않거나 없다.

  4. This calls for alternative criteria one can compute on non-labeled data.
    -> 대안적인 평가 방법으로 불리는 이것은 라벨링 되지 않은 데이터에서 계산할 수 있다.

  5. In this paper, two criteria that do not require labels are empirically shown to discriminate accurately (w.r.t. ROC or PR based criteria) between algorithms.
    -> 이 논문에서, 라벨이 필요없는 두 개의 평가 방법은 경험적으로 ROC나 PR 기반의 평가방법과 정확하게 차이를 보여왔다.

  6. These criteria are based on existing Excess-Mass (EM) and Mass-Volume (MV) curves, which generally cannot be well estimated in large dimension.
    -> 이 평가방법들은 EM과 MV 커브의 존재 위에 기반한다. 그것은 일반적으로 큰 차원에서 잘 평가될 수 없다.

  7. A methodology based on feature sub-sampling and aggregating is also described and tested, extending the use of these criteria to high-dimensional datasets and solving major drawbacks inherent to standard EM and MV curves.
    -> 피쳐 서브 샘플링과 집계 기반의 방법은 또한 묘사되고 테스트된다. 고차원의 데이터셋으로 이 평가들의 사용을 확장하면서 그리고 표준적인 EM과 MV 커브 에서 이어진 주요한 단점을 해결하면서

Conclusion

  • 기존의 labeled data를 기반으로 한 이상치 탐지의 평가 방법은 사실 이상치 탐지만을 위한 방법이라기 보단 분류 모델에서 파생된 느낌이 강했다.
  • 하지만 이상치 탐지에서는 labeled data가 거의 없거나 있어도 많지 않다. 때문에 비지도 학습에 맞는 새로운 평가방법이 필요했다.
  • 실제로도 precision이나 recall, AUC 등을 사용한데 어려움이 있었다.
profile
AI 엔지니어 김태종입니다. 추천시스템, 이상탐지, LLM에 관심이 있습니다. 블로그에는 공부한 기술, 논문 혹은 개인적인 경험을 올리고 있습니다.

0개의 댓글