시계열 분석은 독립 변수를 사용해 종속 변수를 예측하는 일반적인 머신러닝에서 시간을 독립 변수로 사용
AR(AutoRegressive, 자기 회귀) 모델이란?
이전 관측 값이 이후 관측 값에 영향을 준다는 아이디어에 대한 모형
① : 시계열 데이터에서 현재 시점을 의미
② : 과거가 현재에 미치는 영향을 나타내는 모수(𝜙)에 시계열 데이터의 과거 시점을 곱한 것
③ : 시계열 분석에서의 오차 항 (백색 잡음)
∴ p 시점을 기준으로 그 이전의 데이터에 의해 현재 시점의 데이터가 영향을 받는 모형
MA(Moving Average, 이동 평균) 모델이란?
MA 수식
① : 시계열 데이터에서 현재 시점을 의미
② : 매개변수(θ)에 과거 시점의 오차를 곱한 것
③ : 오차 항
∴ AR 모델처럼 이전 데이터의 '상태'에서 현재 데이터의 상태를 추론하는 것이 아닌, 이전 데이터의 오차에서 현재 데이터의 상태를 추론
ARMA(AutoRegressive Moving Average, 자기 회귀 이동 평균) 모델이란?
AR과 MA 두 가지 관점에서 과거의 데이터를 사용, 연구기관에서 주로 사용
ARIMA(AutoRegressive Integrated Moving Average, 자기 회귀 누적 이동 평균) 모델이란?
ARMA와 달리, 과거 데이터의 선형 관계뿐 아니라 추세(cointegration)까지 고려한 모델
ARIMA는 파이썬 코드를 통해 살펴보자.
statsmodels 라이브러리를 이용하여 ARIMA를 구현
ARIMA 구현 절차
ARIMA(p,d,q) 함수를 호출하여 사용.
fit() 메소드로 모델에 데이터를 적용하여 훈련
predict() 메소드로 미래의 추세/동향 예측
💡 statsmodels 라이브러리란?
/ statsmodels는 다음 통계 분석 기능을 제공하는 파이썬 패키지
- 검정 및 추정
- 회귀분석
- 시계열 분석