<Anomaly Detection Using One-Class Neural Network>

남연하·2021년 3월 22일

OC-NN을 이용한 anomaly detection
Deep learning model을 통해서 추출한 features와 전통적인 anomaly detection 기법인 One-Class SVM을 결합한 하이브리드 방법과 비교해, Autoencoder과 Feed-Forward Neural Network를 결합한 Anomaly detection 방법을 제안

OCSVM
· SVM과 달리 unsupervised learning이다.
· 주어진 데이터를 잘 설명할 수 있는 최적의 support vector를 구하고 이 영역 밖의 데이터들은 outlier로 간주하는 방식으로 이상치 탐지

제안하는 모델은

(a) 그림에서 보이는 것과 같이 먼저 입력의 대표적인 특징을 얻기 위해 Auto Encoder를 학습시킨다. 이후,
(b) 이렇게 학습된 Encoder을 이용하여 원본 이미지로부터 특징을 추출한 뒤, 이를 하나의 은닉층을 갖는 Feed-Forward Neural Network에 입력으로 이용하여 anomaly detection을 시도하였다.

Autoencoder는 입력을 압축한 다음 다시 복원하는 구조로, 원하는 출력값이 입력값과 같기 때문에 레이블링 없이 입력의 특징을 학습할 수 있다. 예를 들어 정상 샘플만을 이용해 학습한 Autoencoder에 정상 샘플을 넣어주면 입력과 유사한 결과를 산출할 것이다. 하지만 이렇게 학습된 오토인코더에 정상 샘플이 아닌 이상치를 넣었을 때, 원본인 이상치가 아닌 정상 샘플과 같이 복원하고, 이로 인해 입력과 출력의 차이가 커져 이상치를 탐지할 수 있다.

Binary classification을 할 때 class의 데이터가 매우 불균형하거나 class에 한 개의 데이터만 있고 나머지 데이터가 없는 경우들이 있다. 이런 경우는 하나의 class만 학습시켜서 분류를 할 수 있는데 그 중 사용되는 방법 중 하나가 OCSVM

본 논문에서는 딥 러닝의 특징과 SVM을 이용하는 OC-SVM을 대체하는 오토인코더(Autoencoder)와 Feed-Forward Neural Network를 결합한 OC-NN을 제안, 그 과정에서 OC-NN의 손실함수 최소화 문제가 결국 경계 함수의 quantile을 선택하는 문제라는 것을 확인.

제안한 방법은 특정 데이터에 특화된 특징을 학습할 수 있다는 점에서, 기존에 제안된 Hybrid 방법론들과의 차이점이 있다. 기존 Hybrid 방법에서는 이미 학습된 딥 러닝 모델을 이용해 특징을 추출하기 때문에 추출된 특징이 이상치 탐지에 맞게 학습되었다고 할 수 없지만, 제안한 방법에서는 학습된 Autoencoder로 특징을 추출하고 다시 전이 학습(Transfer Learning)을 이용해 재학습시키기 때문에 특정 데이터의 이상치 탐지에 적합한 특징을 학습할 수 있다.

profile
Ewha Electric

0개의 댓글