time series 데이터를 다루다 보면
위 세가지 transformation 이야기가 자연스럽게 나온다.
공식으로만 설명하면
당연히 이해가 어려울 수도 있다.
먼저 직관적인 이해가 필요하다.
일단은 왜 transformation이 필요한지 부터 알아야 한다.
어떠한 선이 있는데 그걸 좀 더 간단하게 만들어 줄려고 한다고 생각하면 된다.
예)
1.
2.
1번 선 보다
2번 선 이 직관적이고 설명하기가 쉽다.
그러면 3번은?
뭔가 더 복잡하다.
이렇게 뭔가 설명하기 어려운 변화를
보기 쉽게,
예측할 수 있게 정형화 해주는 작업이
square root, log, and BOX-COX transformation 라고 생각하면 되겠다.
기울기가 더 급할수록
log transformation
좀 더 정교하게 정해야 하면
box cox transformation에서 lamda를 조절해주면 된다.
참고로 lamda=0 으로 설정하면 log transformation이랑 동일하다.
이제 직관적인 이해가 되었으니,
출처가서 예제를 보면서 배워보아라.
나중에 ARIMA, ARCH, GARCH를 배우려면 기본적인 요소이니 꼭 한 번 보길 권한다.
출처:
https://machinelearningmastery.com/power-transform-time-series-forecast-data-python/