-
정상성을 나타내는 시계열은 시계열의 특징이 해당 시계열이 관측된 시간에 무관함
-
또한 정상성을 나타내는 시계열은 평균, 분산, 공분산이 모두 시간에 따라 일정해야 한다.
- 추세와 계절성이 있는 시계열의 경우 서로 다른 시계열의 값에 영향을 주기 때문에 정상성을 나타내는 시계열이 아님
- 단, 백색잡음(white noise) 시계열의 경우 언제 관찰하는지에 상관이 없고, 시간에 따라 어떤 시점에서 보더라도 똑같이 보이므로 정상성을 나타내는 시계열이라 할 수 있다
- 주기성 행동을 가지는(추세나 계절성은 없는) 시계열은 주기가 고정된 길이를 가지고 있지 않아 시계열 관측 전 주기의 고점/저점 확인하기 어려워 정상성을 나타내는 시계열이라 할 수 있다
-
정상성 만족하는 데이터 구분
- (d), (h), (i) → 계절성이 보이므로 비정상 시계열
- (a), (c), (e), (f), (i) → 추세가 존재하고 수준이 변하므로 비정상 시계열
- (i) → 분산이 증가하므로 비정상 시계열
- (b), (g) → 정상시계열
- (g)의 경우 뚜렷한 주기(cycle)이 보여 비정상 시계열처럼 보일 수 있으나, 이러한 주기는 불규칙적(aperiodic)한 주기이다
- 불규칙적 주기의 경우 장기적으로 볼때 주기의 시작이나 끝을 예측할 수 없다
-
정상성을 나타내지 않는 데이터를 정상 시계열로 변환하는 방법
- 변동폭이 일정하지 않은 경우 → 로그 변환
- 추세, 계절성이 존재하는 경우 → 차분(differencing)
-
(a) : 비정상 시계열
-
(b) : 로그변환을 통해 변동폭 일정하게 변환
-
(c) : 차분을 통한 평균 일정한 정상 시계열로 변환
-
(d) : 로그변환, 차분 동시에 진행시켜 평균, 분산 일정한 정상 시계열로 변환