Future 10 min Reailzed Volatility Prediction을 목표로 두고
DeepLOB 모델을 사용하며 겪은 문제 및 기존 방식을 고민.
https://github.com/zcakhaa/DeepLOB-Deep-Convolutional-Neural-Networks-for-Limit-Order-Books/blob/master/jupyter_pytorch/run_train_pytorch.ipynb
기존 코드에서는 이전 100개의 행을 하나의 행으로 다뤄서 RAM 공간에 무리없이 많은 양의 데이터를 저장 후 모델에 전달이 가능했지만, 현재 목표에서는 이전 1800개의 orderbook을 다 다뤄야하는 상황이 발생해 메모리 공간의 부담이 커지게 됨
이렇게 하면 Grouping에서 문제가 발생하게 됨
혹은
다만 위 방법을 사용하게 되면 호가 단위의 가격이 이상하게 바뀌는 현상이 발생하게 됨
위의 방식에 따른 방안으로 호가 단위가 같은 가격을 모으는 방법을 시도
Github에서 진행한 사항들을 보면
모델의 Train Loss: 0.6513, Validation Loss: 0.8832 정도이고
정확도도 0.75로 꽤 정확한 모습을 보여주고 있음
현재 마지막 부분을 LSTM을 사용해 Prediction에 사용하고 있는데, Inception 이후 부분의 데이터를 EDA하거나 LSTM이 아닌 Transformer, GBM 모델을 사용
AutoML 또한 적용