GAN-based Multivariate 시계열 데이터 정상 탐지

행동하는 개발자·2023년 2월 22일
0

PHM

목록 보기
28/43

MAD-GAN

  • 정상 데이터만으로 LSTM 구조의 Generator와 Discriminator를 학습하여 정상 데이터의 분포를 학습함

  • 새로운 input의 optimal latent space를 기방으로 생성한 reconstructed sample과 input의 reconstruction loss와 input에 대한 discrimination loss의 가중합이 특정 threshold를 초과하면 이상치로 탐지

USAD

  • AE-based & GAN-based 모델에는 한계점이 존재

    • AE-based: 정상 데이터를 잘 복원하도록 학습되기 때문에 이상치가 정상 데이터와 유사하면 재구성 손실값이 작아 이상치로 탐지되지 않음
    • GAN-based: GAN은 학습이 불안정하여 mode collapse와 non-convergence같은 문제가 발생하기 쉬움

-> 본 연구에서는 모델에 adversarial training을 접목하여 한계점을 해결하고자 함

adversarial training

AE2는 실제 데이터와 AE1의 재구성 데이터를 잘 구분하고, AE1은 AE2를 잘 속이도록 적대적으로 학습을 진행해 AE가 정상 데이터와 유사한 이상치를 탐지할 수 있도록 함

Two-phase training

USAD를 구성하는 두 AE의 학습목표는 다음과 같음

AE1: INPUT을 잘 복원하면서 AE2를 잘 속이는 모델 학습
AE2: INPUT을 잘 복원하면서 AE1이 복원한 데이터와 INPUT을 잘 구별하느 모델 학습

  • 학습이 완료된 두 AE를 기반으로 아래와 같이 ANOMALY SCORE를 산출함

ANOMALY SCORE

계수의 합은 1이며, 계수의 비중에 따라 FALSE POSITIVE와 TRUE POSITIVE 간의 TRADE-OFF(상반관계)가 발생함

profile
끊임없이 뭔가를 남기는 사람

0개의 댓글