시계열 데이터
• 개요
• 일정시간 간격으로 측정되었거나 특정 시간 간격으로 수집된 데이터• 주기성을 가지며 현업에서 매우 흔한 형태의 데이터
• 예) 금융 분야
• 분석 방법
• ARIMA 등 매우 다양한 통계적 시계열 분석 모델 존재
• 시계열 머신러닝, 시계열 딥러닝이 최근 좋은 성능 보이고 있음• 예) RNN, LSTM
의사결정나무로 시계열 분석을?
• 변수가 많아지는 건 걱정할 것 없음
• 참고) 통계 모형에서는 일반적으로 변수 개수를 최소한으로 통제• 직관적으로도 큰 의미가 없어 보이는 변수들은 제거하는 것이바람직할수있음
• 기준은 모델의 성능에 둘 것
• 보너스 문제
• 어제 변수와 오늘 변수들 모두 활용
모델 평가

• 최선의 모델 구현 방법이 정해져 있지 않음
• 여러 모델을 만들어 최선의 모델을 찾는 것이 일반적
• ROC 커브를 통해 모델 간 종합적인