여러가지 머신러닝 데이터를 공부하다 시간의 흐름에 따른 분석 기법이 따로 존재한다는 것을 알게 되었다. 시간의 흐름에 따른 분석은 가장 기본적인 분석 중 하나라고 생각했다. 예를 들어 물건을 파는 업체 입장에서 계절별 소비자들의 소비 패턴, 평일과 휴일별 소비자들의 소비 패턴 등을 분석해 알고 있다면 효과적인 마케팅을 진행할 수 있을 것이기 때문이다. 그래서 이번에 시계열 분석에 대해 집중적으로 공부했고, 그 내용을 정리해 공유해본다.
시계열은 일정 시간 간격으로 배치된 데이터들의 수열을 의미한다. 예를 들어 일주일간 기록된 기상정보, 1년간 기록된 일별 판매량 등이 있다. 시계열 데이터를 이용해 미래를 예측하고자 하는 것이 시계열 분석이라고 할 수 있다.
대표적인 시계열 데이터를 나누는 기준을 설명한다.
이런 성분들을 이용해 시계열 데이터를 분해하는 일반적인 방법들을 알아본다.
위 사진을 통해 덧셈 분해와 곱셈 분해를 쉽게 이해할 수 있다.
참고한 블로그 : https://tjansry354.tistory.com/14
실습한 내용 : https://github.com/SHINDongHyeo/Kaggle/tree/main/%EC%8B%9C%EA%B3%84%EC%97%B4%20%EB%B6%84%EC%84%9D%20%EA%B3%B5%EB%B6%80