[Paper Research] UNSUPERVISED ANOMALY DETECTION AND LOCALIZATION OF MACHINE AUDIO: A GAN-BASED APPROACH

Na young·2024년 1월 12일
0

Study

목록 보기
6/6

본 논문 리뷰는 졸업프로젝트인 PBL 과정 중 하나 입니다.

1. anomaly detection 의 확장성, 중요성 강조

2. 오디오 기반 anomaly detection의 어려운 점**

1. 추출되는 특징들이 직관적이지 않고, 고차원적이다

    1. 눈으로 볼 수 있는 특징인, 파형이 시간 - 주파수이기 때문에 어려움
    2. 스펙트로그램은 시계열에 대해 계산되어서 고차원적이다.
    3. 즉, KNN / LOF 같은 자주 쓰이는 알고리즘을 사용할 수 없다
    

2. 간접적이고 신뢰할 수 없는 지시

    1. 딥러닝은 고차원 입력을 처리할 수 있지만, anomaly detection 부분으로 봤을 때는, 
    2. 직접적인 지시를 하지 않고, 다량의 데이터에서 숨겨진 패턴을 찾아내도록 학습해야하기 때문에 간접적이다.
    3. 선행된 분류 모델(Robust anomaly sound detection framework for machine condition monitoring) 은 보조 레이블을 사용하여 간접적임을 극복하려고 했지만, 이건 좋은 특징을 추출할 것이라는 보장이 없다.
    

3. 작업 환경이 변동적이다.

    1. 따라, 독특한 특징이 나타나기 때문에 정상 / 비정상 탐지가 어렵다
    2. 특히, 정상 / 비정상 분포를 볼 때 유사한 패치가 나타나면 더 어려워진다.

⇒ 따라, GAN은 오디오 anomaly detection에서 획기적이다. 보조 레이블을 사용하지 않고 훈련되며, 다량의 데이터를 학습하고, 여러 도메인에서 일반화 할 수 있는 잠재력을 가지고 있기 때문이다.


최근, 이미지 anomaly detection에서 GAN의 효과가 두드러졌다. 최적의 잠재 변수를 찾는 AnoGAN과 , 생성자가 오토인코더로 수정된 GANomaly를 포함한다.

하지만,
AnoGAN이 오디오 탐지에 적합하지 않은 이유: 스펙트로그램의 정상 / 비정상 분포에는 미세한 차이가 있기 때문에, AnoGAN의 기본 가정과 모순된다.


따라, DCASE Challenge에서 재구성 모델이 제안되었다.

(여기서 재구성 모델은 그냥 gan 처럼 원본이미지-생성이미지 이런 느낌인거겠죠?)

선행된 전형적인 재구성 모델(논문의 레퍼런스 7,8)은 스펙트로그램을 재구성하도록 훈련되고, reconstruction error는 지표가 된다.

즉, 모델이 정상 데이터로만 훈련되었기 때문에, 비정상 데이터의 경우 reconstruction error가 클 것이라는 예측을 한다. ⇒ 하지만 아님.


본 논문에서는

재구성 모델이 정상 / 비정상 분포가 겹치는 경우에만 올바르게 소음을 제거하는 방식으로 학습해야한다고 주장한다.

즉, 전체 분포를 학습하는 것이 아니라 (무엇이 나타나야하고 나타나지 말아야 하는지를)

평균제곱오차(MSE)로 훈련된 재구성 모델은 PCA와 유사하다. MSE를 사용하여, 주요 구성 요소를 보존하고 무작위 노이즈를 버리는 방식으로 학습한다.

둘 다 비정상 데이터. 1열은 원본이미지, 2열은 생성이미지, 3열은 특징 추출.

a는 앞에서 말했던 (모델이 정상 데이터로만 훈련되었기 때문에, 비정상 데이터의 경우 reconstruction error가 클 것이라는 예측을 한다) 것의 상황과 같은데. 이 패턴에 속하는 데이터는 몇개 없다.

b는 대부분의 데이터이다. 생성 이미지를 보면, 급격한 변화는 잘 재구성(생성)되었다.

즉, 앞서 말했던 가설이 틀렸다는.. 거 인.. 듯…
그래서 위 논문에선 어떤 걸 중점으로 모델을 만들었냐면.

reconstruction error는 랜덤노이즈로 인해 비정상 데이터의 부적절한 지표로 만들어진다 (???)

따라서 판별자가 오토인코더에게 특징을 제공하며, 표면적인 노이즈에 중점을 두는 대신 오토인코더가 표현에 깊이 파고들도록 강화하는 것을 목표로 한다.


AEGAN-AD의 이상치 탐지 기법 소개 : 생성자 기반의 reconstruction error와 판별자에서 추출한 임베딩에 기초하였고, 이후에는 전통적인 감지 알고리즘에 의해 처리됨.

생성된 스펙트로그램과 평균 표현을 비교하여 비정상 군집을 예상한다 → 스마트 진단에도 큰 도움이 될 수 있다.

profile
개발어린이

0개의 댓글

관련 채용 정보