DeepLOB Hyper Parameters
Classification Label
Percentile
Number of Classification
- Classification의 수가 적을수록 모델의 성능은 향상됨
Regression
Classification but Regression
<연속적인 값인 종속 변수를 특정 구간 나누어 Classification 하는 경우>
- 구간을 어떻게 정의하느냐에 따라 모델의 성능과 해석이 크게 달라짐
- 임계값의 선택에 따라 같은 데이터셋에서도 전혀 다른 분류 결과가 도출
- Labeling을 어떻게 정했는지를 모델이 추가로 학습해야하는 일종의 부담이 발생함
- 임계값 근처의 Prediction의 경우 애매한 포지션으로 Performance 감소로 이어짐
- Regression 예측 결과에 대해 Labeling을 하는 방식으로 수정
- Regression 결과를 FC Layer를 통해 Classification 하는 모델이므로, Regression Task 시도
- Vaildation Loss가 줄어들지 않는 현상 해결
Orderbook Level
Look Back
- 1 row : 30s
- 120 (1 hour), 240 (2 hour), 360 (3 hour) , 480 (4 hour), 600 (5 hour), 720 (600min)
Machine Parameter
Head Model
(Advanced CNN e.g. IMAGE Model ...)
- DeepLOB의 Main Idea인 Inception이 호가 움직임을 일종의 Video로 보는 관점에서 시작했을 것이란 생각.

- 따라서 DeepLOB의 전체 틀인 CNN-LSTM 외 Video Embedding으로 접근해보는 것도 유의미한 시도라 생각
Tail Model
(LSTM, GRU, Transformer, LLAMA, GPT ...)
- 현재 LSTM, GRU, Transformer 3개의 모델 코드로 학습 모델 생성 중
Result
LEVEL Depth
T : 120

T : 240

lv 28, T 240, Deeplob 일부

RMSPE: 0.7864623
Look Back
- Train / Val / Test : 70 / 15 / 15
- Model : CNN + GRU
- Learning Rate : 0.0003
- epochs : 20
