시계열 데이터를 추세, 계절성, 불규칙성 성분으로 나누어 plot 그리는 작업


period ⇒ 1년 기준으로 주기를 나타내는 변수(월별 데이터면 12, 주별 데이터면 52, 일별데이터면 365)
1) Additive (덧셈 모델)
시계열 데이터=추세+계절성+잔차 (변화량이 일정한 크기로 발생하는 데이터에 적합)
즉, 계절성의 크기가 일정한 경우에 사용
2) multiplicative(곱셈 모델)
시계열 데이터=추세×계절성×잔차 (분들이 곱해지는 모델로, 변화가 비율적으로 발생하는 데이터에 적합)
즉, 계절성이 증가하거나 감소하는 경우에 사용
3) 잔차 (Residuals)
원본 데이터에서 추세와 계절성을 제거한 후 남는 변동성
만약, 잔차(Residual)에 특정 패턴이 보이면 추가적인 계절성이나 주기성이 존재할 가능성이 있음
통계적 모델은 비정상 데이터를 정상성 데이터로 변환해야함
단, 통계적 모델이 아닌 경우, 정상성 데이터로 변환하지 않아도 됨
비정상성 데이터란?
- 시간이 지날수록 데이터의 평균(Trend)이 증가/감소하는 경우
- 계절성(Seasonality) 이 포함되어 특정 주기마다 패턴이 달라지는 경우
- 시간이 지날수록 데이터의 변동성(Variance)이 증가하는 경우
정상성 데이터란?
(1) 모든 시점 t에 대해 평균이 같다.
(2) 모든 시점 t에 대해 분산이 같다.
(3) 자기 공분산 (자기 상관관계)이 시간이 아닌 시차에 의존한다.
왜 비정상성데이터를 정상성 데이터로 변화해야할까?
시계열 데이터가 정상성을 띠고 있어야 ARIMA 분석을 통해 미래 시계열 값을 예측할 수 있음
시계열 데이터가 비정상성을 띤다면 평균과 분산이 다르기 때문에 임의의 시점 t-1, t에서 얻은 모델은 t+1~t+n에서 사용할 수 없게 됨
비정상성 데이터를 정상성 데이터로 변화하는 방법
1) 차분
트렌드(추세)를 제거하여 데이터를 정상성으로 만드는 방법

2) 로그 변환
지수적 성장이나 비대칭적인 분포를 선형적이고 정규분포에 가까운 형태로 변환.

3) 로그 차분
로그 차분(Log Differencing) 은 시계열 데이터에서 트렌드(추세)와 변동성(Variance)을 동시에 안정화하기 위해 사용하는 변환 기법

4) 계절 차분
일정한 주기로 반복되는 계절성(Seasonality)을 제거하는 방법



ARIMA 모델은 시계열 데이터의 자기상관성(AR), 차분(D), 이동 평균(MA)을 이용해 미래 값을 예측하는 시계열 통계 모델입니다.

ARIMA(p, d, q)가 중요/ ARMA(p,q)
d : 시계열 plot을 보고 정상성 여부를 확인하고, 차분을 진행하고, 차분 후의 plot을 보고 여부를 확인하는 프로세스로 진행한다.


1차 차분으로도 트렌드(추세)가 완전히 제거되지 않는 경우 추가적으로 2차 차분을 적용하여 데이터의 평균과 분산을 일정하게 만듬
ARIMA(1,2,0)
p, q의 경우 보통 ACF와, PACF를 보고 결정
p: PACF에서 첫 번째 유의미한 지점(즉, 자기상관이 급격히 0으로 떨어지는 시점)을 p 값
q: ACF에서 첫 번째 유의미한 지점(즉, 자기상관이 급격히 0으로 떨어지는 시점)을 q 값

결론 : ARIMA(1, 2, 0)
ACF와 PACF를 통해서 비정상성 분석이 가능
AR(p)
현재 값이 과거 값들의 선형 결합으로 표현되는 모델(추세가 강한데이터)
MA(q)
현재 값이 과거 오차(White noise)의 선형 결합으로 표현되는 모델
과거의 오차를 기반으로 미래를 예측
AR(p)+MA(q)
자기회귀(AR) + 이동 평균(MA) 요소를 동시에 반영
ARIMA 모델에 계절성(Seasonality)을 추가한 확장 모델
✅ 수식:
(p, d, q): ARIMA의 일반적인 차수
(P, D, Q, s): 계절성 차수
P: 계절성 자기회귀(Seasonal AR)
D: 계절 차분(Seasonal Differencing)
Q: 계절성 이동 평균(Seasonal MA)
s: 계절 주기(예: 월별 데이터 → 12, 주별 데이터 → 52)
(P, D, Q, s) 찾기
s (계절 주기) 결정
s=52, 월별이면 s=12 사용D (계절 차분 차수) 찾기
s)만큼 차분 수행 후 정상성이 확보되면 D=1P, Q 찾기
- 계절 차분 후, ACF/PACF에서 계절 패턴을 분석하여 결정
✅ 특징:
계절성이 있는 데이터에 적합
비정상성 + 계절성까지 해결 가능




