❔ Timeseries data(시계열 데이터)
일정한 시간 간격으로 배치된 data를 시계열 data라고 한다. 보통 주가 data가 대표적인 시계열 data라고 할 수 있다.
위의 사진은 구글 주식의 일별 주가 데이터 이다.
(Open = 시작가, High = 최고가, Low = 최저가, Volume = 거래량, Close = 종가)
이 주식 데이터를 RNN에 넣어보면
이 모델은 물론 불가능 하겠지만 '8일차의 종가를 예측하기 위해 그 전 1주일 간의 data를 보면 될것이다'라는 전제로 출발하고 있다.
minmax_scalar : 데이터 값을 0~1사이의 값으로 linear하게 스케일링 해주는 함수다.
build_dataset : 학습 데이터와 레이블을 분리해주는 함수이다. dataX에 7일치 데이터를 저장하고, dataY에 8일차 종가를 저장한다.