자기 회귀 모델
→ 현재 시점 t에 대한 데이터는 이전 시점의 자기 데이터에 가중치 w를 곱하고 상수 b를 더하고 error term인 e(t)에 가중치 u를 곱한 것을 더해서 표현한다.
e(t)는 white-noise라고 불리며, 일반적인 정규분포에서 도출된 random한 noise값이다.
AR모델은 추세가 변하는 상황에서는 적합하지 않은 모델이다
이동 평균 모델
→ AR모델에서의 t가 e로 변함, 이는 이전 상태의 자기 자신을 보는 것이 아닌 이전 상태의 error term을 현 시점에 반영하겠다는 의미를 가진다. 즉 추세(trend)에 맞춰 추론하겠다는 의미
AR + MA
차분을 통해 통계적이지 않은 상황에서 좀 더 나은 예측을 하는 것 (현실 세계에서의 데이터는 거의 통계적이지 못하다)
1차분이 필요한 ARIMA(1,1,1)모델의 경우 ARIMA(1,1)모델의 수식에서 X위치에 1차분이 들어간 식을 대입한다.
d : 시계열 plot을 보고 정상성 여부를 확인하고, 차분을 진행하고, 차분 후의 plot을 보고 여부를 확인하는 프로세스로 진행한다.
p와 q는 보통 ACF(Autocorrelation function)와, PACF(Partial Autocorrelation function)를 보고 결정한다. ACF는 k lag 단위로 구분된 시계열 관측치 Xt와 Xt-1간의 상관 측도이고, PACF는 다른 모든 짧은 시차 항에 따라 조정한 후 k시간 단위로 구분된 시계열의 관측치(X_{t})와 Xt-k 간의 상관 측도이다.
ACF | PACF | |
---|---|---|
AR(p) | ACF plot이 서서히 감소하는 형태 | PACF plot이 p lag 이후 절단되는 형태 |
MA(q) | ACF plot이 q lag이후 절단되는 형태 | PACF plot이 서서히 감소하는 형태 |
저도 개발자인데 같이 교류 많이 해봐요 ㅎㅎ! 서로 화이팅합시다!