Machine Learning by professor Andrew Ng in Coursera
Anomaly Detection
1) Multivariate Gaussian Distribution
- 기존 데이터와 새로 들어온 데이터 x1,x2와의 거리는 꽤 멀다.
- 그런데 오른쪽 그래프를 보면 그렇게 anomalous한 것 같지는 않다.
-> 즉, anomaly 감지를 실패했다.
- x1이 x2보다는 기존 데이터들과 잘 섞여 있기때문에 x1의 확률이 더 높아야 한다.
하지만 왼쪽 그래프에서 파란색 선들을 보면 x1과 x2의 확률은 같다.
-> detection 알고리즘을 Multivariate Gaussian distribution을 이용해 개선해 본다.
Multivariate Gaussian (Normal) examples
2) Anomaly Detection using the Multivariate Gaussian Distribution
Parameter fitting:
주어진 훈련 세트 {x(1),x(2),x(3)...,x(m)} (x∈Rn) 일 때,
μ=m1i=1∑mx(i)
Σ=m1i=1∑m(x(i)−μ)(x(i)−μ)T
주어진 데이터가 multivariate Gaussian distribution을 따른다면 위와 같이 μ와 Σ를 구한다.
Anomaly detection with the multivariate Gaussian