Time Series Regression Model
yt=TRt+ϵt
- yt : t 시점에서의 값
- TRt : t 시점에서의 trend, 모델로 잡을 수 있는 trend
- ϵt : t 시점에서의 error, trend로 설명하기 어려운 부분
1) Trend 패턴의 종류
- No trend : t에 따라서 변화하지 않음
- TRt=β0 ⇨ Point forecast(점추정)
- Linear trend : 증/감이 직선의 형태로 표현
- TRt=β0+β1t
- Quadratic(or Curvelinear) trend : 증감의 형태가 곡선으로 표현
- TRt=β0+β1t+β2t2
2) Kth order polynomial time series regression models
yt=β0+β1t+β2t2+⋯+βktk+ϵt,ϵt∼iidN(0,σ2)
- 오로지 시간(time)이 설명변수(explanantory variable)이다.
- input 변수가 단지 시간에 의해 결정된다.
- yt는 오직 시간에 의해서만 결정된다.
- linear trend
(1) 최소제곱법(Least-Squared Estimation)
β^=argminβL(β)
L(β)===t=1∑T(yt−β0−β1t−β2t2−⋯−βktk)2t=1∑T(yt−E(yt))2t=1∑T(실제값−예측값)2
- β, coef 추정하는 방법
- L(β) : loss function
(2) Autocorrelation
- 기존 회귀분석과는 다르게 time series data는 시간에 따른 영향을 받는 데이터 이므로, ϵi와 ϵj는 independence하지 않기 때문에 최소제곱법을 통한 추정은 문제가 될 수 있다.
- Cov(ϵi,ϵj)=0,(i=j)라는 가정이 위배될 가능성이 多
- Ordinary regression analysis
- Yi=β0+β1x1+⋯+βpxp+ϵi
- x변수 : p개
- ϵi는 정규분포를 따르며
- Cov(ϵi,ϵj)=0,(i=j)
- 때문에 ϵi, \epsilon_j$는 독립이다.
- 방법의 접근이 필요하기 때문 autocorrelation을 사용한다.