ARIMA Model

Minjung·2023년 7월 16일
1
post-thumbnail

ARIMA Model

AR(Autoregressive) Model

자기 회귀 모델

  • 과거 시점의 자기 자신의 데이터가 현 시점의 자기 자신에게 영향을 미치는 모델
X(t)=Wt(t1)+b+ue(t)X(t) = W* t(t-1) + b + u*e(t)

→ 현재 시점 t에 대한 데이터는 이전 시점의 자기 데이터에 가중치 w를 곱하고 상수 b를 더하고 error term인 e(t)에 가중치 u를 곱한 것을 더해서 표현한다.

e(t)는 white-noise라고 불리며, 일반적인 정규분포에서 도출된 random한 noise값이다.

AR모델은 추세가 변하는 상황에서는 적합하지 않은 모델이다

MA(Moving average) Model

이동 평균 모델

  • 추세가 변하는 상황에서 적합한 모델
X(t)=we(t1)+b+ue(t)X(t) = w*e(t-1) + b + u*e(t)

→ AR모델에서의 t가 e로 변함, 이는 이전 상태의 자기 자신을 보는 것이 아닌 이전 상태의 error term을 현 시점에 반영하겠다는 의미를 가진다. 즉 추세(trend)에 맞춰 추론하겠다는 의미

ARMA Model

AR + MA

  • 과거 시점의 자기 자신과 추세까지 반영하는 모델
X(t)=w1,1X(t1)+w2,1e(t1)!+b+ue(t)X(t) = w_1,1 * X(t-1) + w_2,1 * e(t-1)! + b + u * e(t)

ARIMA Model

차분을 통해 통계적이지 않은 상황에서 좀 더 나은 예측을 하는 것 (현실 세계에서의 데이터는 거의 통계적이지 못하다)

  • 차분이라는 차수 d가 포함되어 ARIMA(p,d,q)로 표현
  • 차분이라는 개념은 현재 상태에서 이전 상태를 빼주는 것을 의미한다.
    d=0:xt=Xtd = 0 : x_t = X_t
    d=1:xt=XtXt1d = 1 : x_t = X_t-X_{t-1}
    d=2:xt=(XtXt1)(Xt1Xt2)d=2 : x_t = (X_t-X_{t-1}) - (X_{t-1} - X_{t-2})

1차분이 필요한 ARIMA(1,1,1)모델의 경우 ARIMA(1,1)모델의 수식에서 X위치에 1차분이 들어간 식을 대입한다.

차수의 결정 : (p,d,q)

  • d : 시계열 plot을 보고 정상성 여부를 확인하고, 차분을 진행하고, 차분 후의 plot을 보고 여부를 확인하는 프로세스로 진행한다.

  • p와 q는 보통 ACF(Autocorrelation function)와, PACF(Partial Autocorrelation function)를 보고 결정한다. ACF는 k lag 단위로 구분된 시계열 관측치 Xt와 Xt-1간의 상관 측도이고, PACF는 다른 모든 짧은 시차 항에 따라 조정한 후 k시간 단위로 구분된 시계열의 관측치(X_{t})와 Xt-k 간의 상관 측도이다.

    ACFPACF
    AR(p)ACF plot이 서서히 감소하는 형태PACF plot이 p lag 이후 절단되는 형태
    MA(q)ACF plot이 q lag이후 절단되는 형태PACF plot이 서서히 감소하는 형태

3개의 댓글

comment-user-thumbnail
2023년 7월 17일

저도 개발자인데 같이 교류 많이 해봐요 ㅎㅎ! 서로 화이팅합시다!

1개의 답글
comment-user-thumbnail
2023년 8월 29일

화이팅 하세요~

답글 달기