Day52

김재현·2023년 8월 2일

JUPYTER/DL/ML

목록 보기
29/73

시계열 분석

시간의 흐름에 따라 관찰된 값으로 시계열 데이터 분석을 통해 미래의 값을 예측하고 경향, 주기, 계절성 등을 파악해 활용.
변동폭과 계절적 영향이 없다면 시계열 분석이 원활하게 이루어지지 않음(해당 특성을 찾아내는 것이 목적이기 때문).

정상성 시계열 자료

비정상에서 정상성 시계열 자료로 변환 시 변환, 차분, 일반차분, 계절 차분을 진행

비정상성 시계열 자료


시계열 데이터 분석의 정석

acf, pacf 그래프를 그려 값을 비교하며 분석, 결과를 도출.

AR모델 : 첫 번째 모델(ACF)이 천천히 감소.
MA모델 : 두 번째 모델(PACF)이 천천히 감소.

adfuller를 사용해 데이터가 정상성을 만족하는지 판단할 수 있음.

  • p-value

    p-value의 기준

  • P-value < 0.01 : 귀무가설이 옳을 확률이 0.01 이하 → 틀렸다(깐깐한 기준) --> 귀무가설 기각, 대립가설 채택
  • P-value < 0.05 : 귀무가설이 옳을 확률이 0.05 이하 → 틀렸다(일반적인 기준) --> 귀무가설 기각, 대립가설 채택
  • 0.05 < P-value < 0.1 : 애매한 경우(샘플링을 다시한다)
  • 0.1 < P-value : 귀무가설이 옳을 확률이 0.1 이상 → 귀무가설 기각 불가, 틀리지 않았다(맞다와 다름)

시계열 데이터 분석의 간략화

0개의 댓글