ABOD는 점과 점 사이의 각도를 이용하여 이상치를 탐지하는 방법입니다. 주어진 점이 주변 점들과 이루는 각도가 급격하게 변하거나, 다른 점들과 일관성 없는 각도를 가질 경우, 이 점을 이상치로 간주합니다.
Anomaly Score: ABOD의 Anomaly Score는 해당 점과 다른 점들이 이루는 각도의 분산을 기반으로 계산됩니다. 각도의 분산이 클수록 해당 점이 이상치일 가능성이 높습니다.
의미: 스코어가 높으면 해당 점이 주변의 다른 점들과 이루는 각도가 일정하지 않아 이상치일 가능성이 크다는 의미입니다.
이 방법은 클러스터링을 기반으로 이상치를 탐지합니다. 데이터를 여러 클러스터로 나눈 후, 클러스터에서 멀리 떨어져 있는 점들을 이상치로 간주합니다.
Anomaly Score: 클러스터에서 점이 떨어진 거리 또는 점의 밀도를 고려하여 Anomaly Score가 계산됩니다. 클러스터 중심으로부터의 거리가 멀거나 밀도가 낮을수록 스코어가 높아집니다.
의미: 스코어가 높을수록 해당 점이 클러스터와 잘 어울리지 않으며 이상치일 가능성이 크다는 것을 의미합니다.
COF는 데이터 점들이 연결된 방식에 따라 이상치를 탐지합니다. 특히, 각 점이 주변 점들과 얼마나 잘 연결되어 있는지에 따라 이상치를 식별합니다.
Anomaly Score: 주변 점들과의 연결 강도를 기반으로 Anomaly Score가 계산됩니다. 연결이 약할수록 스코어가 높아집니다.
의미: 스코어가 높으면 해당 점이 주변 점들과 연결이 부족해 이상치일 가능성이 크다는 의미입니다.
히스토그램을 이용한 이상치 탐지 방법입니다. 데이터의 분포를 히스토그램으로 표현하고, 분포에서 벗어난 점들을 이상치로 간주합니다.
Anomaly Score: 데이터가 속한 히스토그램 빈의 빈도를 기반으로 Anomaly Score를 계산합니다. 빈도가 낮을수록 스코어가 높아집니다.
의미: 스코어가 높으면 해당 데이터가 드문 영역에 위치하며, 따라서 이상치일 가능성이 크다는 의미입니다.
Isolation Forest는 데이터의 분리를 통해 이상치를 탐지합니다. 랜덤하게 분리된 데이터에서 이상치는 분리가 더 쉽게 이루어지는 경향이 있습니다.
Anomaly Score: 트리 구조에서 분리되는 깊이를 기반으로 Anomaly Score를 계산합니다. 분리 깊이가 얕을수록 스코어가 높습니다.
의미: 스코어가 높으면 해당 점이 분리가 더 쉽게 이루어져 이상치일 가능성이 크다는 의미입니다.
KNN 기반 이상치 탐지는 각 점의 주변 k개의 이웃들과의 거리를 통해 이상치를 탐지합니다.
Anomaly Score: 해당 점과 k개의 이웃 간의 평균 거리로 Anomaly Score를 계산합니다. 거리가 멀수록 스코어가 높아집니다.
의미: 스코어가 높으면 해당 점이 주변 이웃들과 거리가 멀어 이상치일 가능성이 크다는 의미입니다.
LOF는 점의 밀도를 기반으로 이상치를 탐지합니다. 특정 점의 밀도가 주변의 다른 점들보다 낮으면 이상치로 간주합니다.
Anomaly Score: 주변 점들과 비교한 상대적인 밀도 차이를 기반으로 Anomaly Score가 계산됩니다.
의미: 스코어가 높으면 해당 점이 주변 점들보다 밀도가 낮아 이상치일 가능성이 크다는 의미입니다.
SVM 기반 이상치 탐지 방법으로, 주어진 데이터를 하나의 클래스로 분류한 후, 경계에서 멀리 떨어진 점들을 이상치로 간주합니다.
Anomaly Score: 점이 결정 경계에서 얼마나 멀리 떨어져 있는지를 기반으로 Anomaly Score가 계산됩니다.
의미: 스코어가 높으면 해당 점이 결정 경계에서 멀리 떨어져 있어 이상치일 가능성이 크다는 의미입니다.
PCA는 고차원 데이터를 저차원 공간에 투영하여 이상치를 탐지합니다. 투영된 공간에서의 거동이 다른 점들을 이상치로 간주합니다.
Anomaly Score: 재구성 오차(reconstruction error)를 기반으로 Anomaly Score가 계산됩니다. 오차가 클수록 스코어가 높습니다.
의미: 스코어가 높으면 해당 점이 저차원 공간에서 잘 설명되지 않아 이상치일 가능성이 크다는 의미입니다.
MCD는 공분산을 최소화하는 방식으로 이상치를 탐지합니다. 공분산이 낮은 데이터 하위 집합을 찾은 후, 이와 크게 벗어나는 점들을 이상치로 간주합니다.
Anomaly Score: Mahalanobis 거리를 기반으로 Anomaly Score가 계산됩니다. 거리가 멀수록 스코어가 높아집니다.
의미: 스코어가 높으면 해당 점이 공분산 구조에서 벗어나 이상치일 가능성이 크다는 의미입니다.
SOD는 고차원 공간에서 하위 공간을 선택하여 이상치를 탐지합니다. 특정 하위 공간에서 이상하게 보이는 점들을 탐지합니다.
Anomaly Score: 점이 여러 하위 공간에서 나타나는 빈도나 일관성을 기반으로 Anomaly Score가 계산됩니다.
의미: 스코어가 높으면 해당 점이 여러 하위 공간에서 이상 행동을 보여 이상치일 가능성이 크다는 의미입니다.
SOS는 확률적인 방법을 사용하여 이상치를 탐지합니다. 각 점에 대해 이상치일 확률을 계산합니다.
Anomaly Score: 점이 다른 점들과의 거리 및 상호작용을 기반으로 계산된 확률로 Anomaly Score가 산출됩니다.
의미: 스코어가 높으면 해당 점이 확률적으로 이상치일 가능성이 크다는 의미입니다.