9:00 ~ 11:00 : ADsP, 태블로 강의
11:00 ~ 12:00 : 시계열 세션
12:00 ~ 13:00 : 시계열 세션 복습
15:00 ~ 17:00 : 태블로 강의
15:00 ~ 17:00 : 태블로 세션
19:00 ~ 20:00 : 시계열 세션 실습
20:00 ~ 21:00 : 오후 스크럼 및 TIL 작성
https://sonstory.tistory.com/112
참고하면 좋을 블로그
데이콘 들어가서 살펴보기
EDA가 젤 중요하다
자격증 시험은 시험일 뿐
실무에선 정의보단 이걸 왜 쓰는지 어떻게 활용할 수 있는지 실제 상황에 적용할 수 있는지가 중요하다는 것 잊지말기
용어들 영어로도 알아두기
일단 기본형만 알아두고 확장형은 그때그떄 찾아보기
▶이동 평균법 Moving Average Method: 일정 기간의 평균
기간 설정에 따라 결과가 민감하게 변함. 장기 예측에 한계
단순 이동평균, 가중 이동평균
▶지수 평활법 Exponential Smoothing
최근 데이터일 수록 가중치 둠 -> 이동 평균보단 유연. 최근의 변화를 빠르게 반영
단순 지수평활 - 추세, 계절성 X
Holt - 추세 O
Holt-Winters - 추세, 계절성 O
▶EWMA 지수 가중 이동 평균
구데이터 영향력은 감소, 신데이터에는 가중치
요걸 조절하는 파라미터가 a(알파)
a가 1에 가까우면? → 최신 변화에 매우 민감 (노이즈에 취약)
a가 0에 가까우면? → 아주 부드러운 곡선 (변화 감지가 늦음)
+) 미니탭..? 엑셀같은 인터페이스인데 통계 분석용
https://blog.minitab.com/ko/blog/detect-small-shifts-in-the-process-mean-with-exponentially-weighted-moving-average-ewma-charts

시계열 데이터 = 추세 + 계절성 + 잔차 의 조합
▶가법모델 Additive Model: 이상적인 경우에 적용하기 좋은 모델. 더하기
봉우리가 균일함
▶승법모델 Multiplicative Model: 규모가 커질 수록 변동폭이 커지는 경우에 잘 맞음. 곱하기

ㄴ 봉우리 크기가 점점 커짐. 이런 케이스가 승법 모델에 잘맞는다~

ㄴ Multiplicative Model로 시계열 분해한 결과. 젤 밑에가 잔차임.
분해한 결과가 얘처럼 패턴이 안보여야 충분히 분해된 거임
(약간 지직지직하는 정도만 있어야 한다~)

▶ARIMA: 비정상 시계열을 로그변환, 차분 등을 통해서 정상화해서 ARMA 모델 적용
▶프로펫은 메타에서 만든거
게임, 이커머스 이런데서 많이 쓰인다고 함
실제 사례 꼭꼭 찾아보기!!!!!!!!!

프로세스, 분석 흐름 등을 쭉 훑어보고 프로젝트 진행하기
▶ACF 자기상관함수
상관관계를 보여줌. 히트맵 같은 거임~

사진에서 파랑 영역에 들어가는 걸 보는 건데 사진에선 해당되는 게 없음
MA 모델의 차수를 정할 때 사용
▶PACF 편자기상관함수
중간 시차를 없애서 독립적인 상관관계를 보여줌
AR 모델 설정할 때 주로 사용
▶AR AutoRegression 자기회귀 모델
과거 관측값으로 현재를 예측
과거 데이터에 대한 의존성이 반영됨
ACF가 지수적으로 감소
PACF가 특정 시점 이후에 절단

2를 기점으로 절단이 난 걸 볼 수 있음. p=2, AR(2) 이런 식으로 표현함
코딩을 할 때는 오토 아리마나 오토 인코더를 주로 쓸거다
지금은 일단 전통적인 방법으론 이렇게 했었다~하고 알아두기
가장 사람들이 많이 쓰는 건 아마 아리마
▶MA Moving Average 이동평균 모델
과거 잔차로 현재를 예측
ACF가 특정 시점에 절단
PACF가 지수적으로 감소

▶ARIMA
비정상 시계열에 차분(I)을 해서(추세, 불안정성 제거) 정상성 확보
과거의 값(AR)과 과거의 오차(MA)를 조합하여 미래를 예측
데이터에 추세가 흐를 때, 비정상 시계열일 때 사용
예시 추가적으로 찾아보기
▶Auto-ARIMA 자동 모델 탐색
p,d,q를 굳아 안 찾아도 ai가 딸깍 해줌
최소한의 변수로 최대한의 설명력을 가진 모델을 찾아줌. 가성비갑
▶SARIMA Seasonal ARIMA
ARIMA + 계절성
▶ARIMAX ARIMA with Exogenous variables
과거 데이터 + 외부의 추가 변수(X)까지 고려

SARIMAX - 아리마 패밀리의 가장 윗 단계가 얘임
SARIMA: 오직 '자기 자신'의 과거 데이터(내생 변수)만 보고 미래를 예측합니다.
SARIMAX: 나 자신의 과거뿐만 아니라, 외부 요인(X, 외생 변수)까지 고려합니다.
(예: 전력 수요를 예측할 때 '기온'이나 '공휴일 여부'를 추가하는 것)
▶잔차 분석
잔차에서는 패턴이 보이면 안됨. 백색잡음 형태로 되어있어야 함
뭔가 추세가 보인다? 뭔가 중요한 정보를 놓치고 있다
얘는 그냥 눈으로 보는거
▶융박스
p벨류 봄
여기선 0.05보다 커야함!
그래야 잔차들 간의 상관관계가 없고 모델이 충분히 설명하고 있다는 결론이 됨