[TSAD] Deep Learning for Time Series Anomaly Detection: A Survey review

onseo·2025년 9월 17일

논문

목록 보기

10/14

Deep Learning for Time Series Anomaly Detection: A Survey
ZAHRA ZAMANZADEH DARBAN, GEOFFREY I. WEBB,
SHIRUI PAN, CHARU C. AGGARWAL, MAHSA SALEHI
ACM Computing Surveys (CSUR), 2024.

1. Introduction

TSAD는 의료, 자연재해 등 광범위한 영역에서 적용 가능성이 증가함에 따라 주목받고 있음
Deep Learning을 이용한 TSAD 중심으로 설명

2. Background

2.1 Univariate Time Series

UTS(Univariate Time Series): 시간에 따라 변하는 한가지 변수
$X = (x_1, x_2, \dots, x_t)$ : Time Series $X$ , timestamp $t$

2.2 Multivariate Time Series

MTS(Multivariate Time Series): 시간에 따라 변하는 여러 변수
temporal dependency: 과거 값에 영향 받음
spatial/intermetric dependency : 서로 다른 변수 사이 상관관계
$X = (X_1, X_2, \dots, X_t) = \left( (x_1^1, x_1^2, \dots, x_1^d), (x_2^1, x_2^2, \dots, x_2^d), \dots, (x_t^1, x_t^2, \dots, x_t^d) \right)$
time $i$ 에서의 Time Series $X_i$ , Dimension $d$

2.3 Time Series Decomposition

1) Secular Trend

long term trend: 증가, 감소, 안정 등
전체 시간 동안의 일반적인 pattern을 나타냄
선형이 아니여도 됨

2) Seasonal Variations

계절성 (특정 달, 일, 기간 등)
일정 주기마다 반복됨

3) Cyclical Fluctuations

cycle: 장기 추세 및 계절적 변동에 의해 정의된 기본 시계열에서 벗어나는 확장된 편차
시작 시점, 지속 기간 다양

4) Irregular Variations

랜덤, 불규칙적인 event
다른 모든 요소들이 제거되고 남은 것

2.4 Anomalies in Time Series

2.4.1 Types of Anomalies

1. temporal

1) Global

시리즈 전체와 비교했을때 튀는 point
$\left| x_t - \hat{x}_t \right| > \mathit{threshold}$

2) Contextual

인접한 시점에서의 벗어남 = context에서 벗어남
어떤 맥락에서의 이상치는 다른 맥락에서는 이상치가 아닐 수 있음
$threshold \approx \lambda \times var(X_{t-w:t})$
$X_{t-w:t}$ : data point $x_t$ 에서의 context, window size $w$ , 조절 변수 $\lambda$

3) Seasonal

전체적인 계절성에서 벗어나는 point
$diss_s(S, \hat{S}) > threshold$
$S$ : 실제 계절성 , $\hat{S}$ : 예상 계절성

4) Trend

데이터를 평균으로부터 영구적인 변화를 야기 / 시계열의 추세 전환을 발생시키는 이벤트
정상적인 주기성과 계절성을 유지하면서도 기울기를 크게 변경
$diss_t(T, \hat{T}) > threshold$
$T$ : 실제 trend , $\hat{T}$ : 정상 trend

5) Shapelet

보통 패턴과 구별되는 subsequence pattern
$diss_c(C, \hat{C}) > threshold$
$C$ : 실제 cycle , $\hat{C}$ : 예상 cycle

2. intermetric
: 변수들 간의 상관관계가 깨질 때 발생하는 이상 행동

특정 시점에서 여러 변수들 간의 상호작용이 평소와 달라지는 것을 의미
개별 변수 자체는 정상 범위 내에 있더라도, 변수들 간의 관계가 비정상적으로 변화
DTW를 활용하여 패턴에서 벗어난 정도를 정량화
Dynamic Time Warping (동적시간워핑)
- 두 시계열을 최적으로 정렬(optimally align)하여 두 시계열 간의 비유사성(dissimilarity)을 측정하는 데 유용한 방법
- 시간 축에서 늘어나거나 줄어들 수 있는 비선형적인 왜곡을 허용하면서 유사도 측정 가능
- 같은 패턴인데 속도가 다르거나 시작 양상이 달라도 같은 패턴으로 인식 가능

3. temporal-intermetric
: Intermetric anomaly와 Temporal anomaly가 동시에 발생하는 복합적인 이상 현상

여러 변수 간의 상관관계도 깨지고, 동시에 시간적 의존성(temporal dependencies)도 위반하는 경우
여러 측면에서 이상 징후가 나타나므로 오히려 뚜렷하게 드러날 수 있음

3. Time Series Anomaly Detection Methods

: Statistical-based, Clustering-based, Distances-based, Density-based

3.1 Deep Models for Time Series Anomaly Detection

supervised learning : 레이블 존재하는 정상/이상 데이터셋을 사용하여 학습. 그러나 실제 데이터는 이상치가 사전에 알려져 있는 경우가 적음
unsupervised learning: 레이블 사용 안함. 데이터 자체의 특징을 학습.
semi-supervised learning: 정상 데이터셋만 존재할때, 정상 패턴을 파악함
self -supervised learning: 외부 레이블 없이 입력 데이터 자체의 감독 신호를 생성하여 학습. 데이터 일부를 가리거나 변형한 뒤 원본을 예측하게 하는 등 데이터의 본질적인 구조와 표현을 학습

TSAD 모델의 입력 데이터 처리 방식
1) step-by-step 모델