221122 Time Series Regression Model-2

문소정·2022년 11월 22일
0

통계

목록 보기
4/8

Time Series Regression Model

yt=TRt+ϵty_t = TR_t + \epsilon_t

  • yty_t : t 시점에서의 값
  • TRtTR_t : t 시점에서의 trend, 모델로 잡을 수 있는 trend
  • ϵt\epsilon_t : t 시점에서의 error, trend로 설명하기 어려운 부분

1) Trend 패턴의 종류

  1. No trend : t에 따라서 변화하지 않음
    • TRt=β0TR_t = \beta_0 ⇨ Point forecast(점추정)
  2. Linear trend : 증/감이 직선의 형태로 표현
    • TRt=β0+β1tTR_t = \beta_0 + \beta_1t
  3. Quadratic(or Curvelinear) trend : 증감의 형태가 곡선으로 표현
    • TRt=β0+β1t+β2t2TR_t = \beta_0 + \beta_1t + \beta_2t^2

2) Kth order polynomial time series regression models

yt=β0+β1t+β2t2++βktk+ϵt,ϵtiid  N(0,σ2)y_t = \beta_0 + \beta_1t + \beta_2t^2 + \cdots + \beta_kt^k + \epsilon_t, \qquad \epsilon_t \sim iid \; N(0, \sigma^2)

  • 오로지 시간(time)이 설명변수(explanantory variable)이다.
  • input 변수가 단지 시간에 의해 결정된다.
  • yty_t는 오직 시간에 의해서만 결정된다.
  • linear trend

(1) 최소제곱법(Least-Squared Estimation)

β^=argminβL(β)\hat\beta = arg \min_{\beta} L(\beta)
L(β)=t=1T(ytβ0β1tβ2t2βktk)2=t=1T(ytE(yt))2=t=1T(실제값예측값)2\begin{matrix} L(\beta) &=& \displaystyle\sum_{t = 1}^{T}(y_t - \beta_0 - \beta_1t - \beta_2t^2 - \cdots - \beta_kt^k)^2 \\ &=& \displaystyle\sum_{t=1}^{T}(y_t - E(y_t))^2 \\ &=& \displaystyle\sum_{t=1}^{T}(실제값 - 예측값)^2 \end{matrix}

  • β\beta, coef 추정하는 방법
  • L(β)L(\beta) : loss function


(2) Autocorrelation

  • 기존 회귀분석과는 다르게 time series data는 시간에 따른 영향을 받는 데이터 이므로, ϵi\epsilon_iϵj\epsilon_j는 independence하지 않기 때문에 최소제곱법을 통한 추정은 문제가 될 수 있다.
    • Cov(ϵi,ϵj)=0,(ij)Cov(\epsilon_i, \epsilon_j) = 0, \qquad (i \ne j)라는 가정이 위배될 가능성이 多
    • Ordinary regression analysis
      • Yi=β0+β1x1++βpxp+ϵiY_i = \beta_0 + \beta_1x_1 + \cdots + \beta_px_p + \epsilon_i
      • x변수 : p개
      • ϵi\epsilon_i는 정규분포를 따르며
      • Cov(ϵi,ϵj)=0,(ij)Cov(\epsilon_i, \epsilon_j) = 0, \qquad (i \ne j)
      • 때문에 ϵi\epsilon_i, \epsilon_j$는 독립이다.
  • 방법의 접근이 필요하기 때문 autocorrelation을 사용한다.






0개의 댓글