시계열 데이터
- 시계열 데이터 란?
- 시간의 흐름에 따라 순서대로 관측되며 시간의 영향을 받는 데어터
- Daily, Monthly, Quarterly, Yearly
- 구성 요소
- 추세 변동 Trend
- 관측값이 지속적으로 증/감하는 변동
- 특징 : 장기간(최소 1년 이상 지속)의 변동을 보임 ex) 경제
- Downward/Upward 용어 주의
- 순환 변동 Cycle ⊃ 계절 변동 Seasonal variation
- 주기적인 변화를 가지면서 계절에 의한 것이 아닌 주기가 긴 변동
- 주기 : 주별, 월별, 계절별 등
- 우연 변동 Random fluctuation
- 시간에 따른 랜덤한 원이에 의한 변동(규칙적인 움직임과는 무관)
- 대표 : 백색잡음 White Noise(평균 0, 분산이 일정한 ts data)
변동들의 예시 | White Noise |
---|
| |
시계열 예측 정확도 평가
-
예측오차 Prediction error
et=yt−y^t
t=1∑n=yt−y^t
- yt : t시점에서 실제값, y^t : t시점에서 예측값
- et가 작을 수록 모델을 제대로 만들었다고 할 수 있음
- 단순한 정도/크기 차이(양수, 음수 부호는 중요하지 않음)
-
평균 절대 편차(MAD : Mean Absloyte Deviation)
- Absolyte Deviation : ∣et∣=∣yt−y^t∣
- MAD : nt=1∑n∣et∣=nt=1∑n∣yt−y^t∣
-
평균 제곱 편차(MSE : Mean Squared Error)
- Squared error : (et)2=(yt−y^t)2
- MSE : nt=1∑n(et)2=nt=1∑n(yt−y^t)2
- MAPE (Mean Absolute Pecentage Error)
MAPE=nt=1∑n∣ytyt−y^t∣∗100
- 단점
- yt=0일때 정의가 되지 않는다 ?
- 분모가 0에 가까울 수록, MAPE가 차이와 상관없이 무한으로 커짐
- bias가 존재
- yt>y^t 일때, 호의 적인 경우가 있다. ?
https://white-joy.tistory.com/10