간단 코드: 링크텍스트
프로젝트 : 링크텍스트
정의: 시간 순서대로 발생한 데이터의 수열
수식:
전제 조건:
일정 조건
Covariance
주어진 시계열 데이터의 안정성이 없다는 귀무 가설 세움
통계적 가설 검정 과정을 통해 귀무가설 기각
안정적인 데이터라는 대립가설 채택
--> 귀무가설의 가정이 틀렸다는 것을 방증
R에서 제공하는 통계검정, 시계열 분석 등의 기능을 파이썬에서도 이용하게 도움을 주는 통계 패키지
adfuller메소드: 주어진 timeseries에 대한 Augmented Dickey-Fuller Test 수행 코드
1-1. 로그 함수 변환
1-2. Moving average 제거- 추세 상쇄하기
1-3. 차분(Differencing) - 계절성(Seasonality) 상쇄하기
seasonal_decompose 메소드: 시계열 안에 존재하는 trend, seasonality를 직접 분리한다.
moving average제거, differencing등을 거치지 않아도 안정적인 시계열 만든다.
순서
AR(Autoregressive) + I(Integrated) + MA(Moving Average)
시계열 데이터 예측 모델을 자동적으로 만든다.
과거 값들에 대한 회귀를 통해 미래 값 예측
Yt가 이젠 p개의 데이터의 가중합으로 수렴
-
I는 Yt이 이전 데이터와 d차 차분의 누적 합
모수: 핵심적인 숫자들을 정하기
p: 자기회귀 모형(AR)시차(BY PACF)
q: 이동평균 모형(MA)시차(BY ACF)
d: 차분누적(I)횟수
모수 선택법
ACF(Autocorrelation Function)
시차에 따른 관측치들 사이의 관련성 측정
주어진 시계열의 현재 값이 과거 값과 상관성 섦여
ACF plot에서 X축은 상관계수 나타내고 y축은 시차 수
PACF(Partial Autocorrelation Function)
다른 관측치의 영향력 배제한 후 두 시차의 관측치 간 관련성 측정
k이외의 모든 시차를 갖는 관측치의 영향력 배제 후 특정 두 관측치가 얼마나 관련 있는지 나타냄