[Trading Machine Project] DeepLOB Hyper Parameters

immanuelk1m·2024년 2월 26일
0

Trading Machine Project

목록 보기
11/20

DeepLOB Hyper Parameters

Classification Label

Percentile

  • 종속 변수가 정규 분포를 띄는 경우 아래 같은 구간 분류로 Labeling

  • 데이터가 적은 구간 (상,하위 4% 변동)에 대해서는 예측력이 많이 떨어지는 모습을 보여줌

Number of Classification

  • Classification의 수가 적을수록 모델의 성능은 향상됨

Regression

Classification but Regression

<연속적인 값인 종속 변수를 특정 구간 나누어 Classification 하는 경우>

  • 구간을 어떻게 정의하느냐에 따라 모델의 성능과 해석이 크게 달라짐
  • 임계값의 선택에 따라 같은 데이터셋에서도 전혀 다른 분류 결과가 도출
  • Labeling을 어떻게 정했는지를 모델이 추가로 학습해야하는 일종의 부담이 발생함
  • 임계값 근처의 Prediction의 경우 애매한 포지션으로 Performance 감소로 이어짐
  • Regression 예측 결과에 대해 Labeling을 하는 방식으로 수정
  • Regression 결과를 FC Layer를 통해 Classification 하는 모델이므로, Regression Task 시도
  • Vaildation Loss가 줄어들지 않는 현상 해결

Orderbook Level

Look Back

  • 1 row : 30s
  • 120 (1 hour), 240 (2 hour), 360 (3 hour) , 480 (4 hour), 600 (5 hour), 720 (600min)

Machine Parameter

Head Model

(Advanced CNN e.g. IMAGE Model ...)

  • DeepLOB의 Main Idea인 Inception이 호가 움직임을 일종의 Video로 보는 관점에서 시작했을 것이란 생각.

  • 따라서 DeepLOB의 전체 틀인 CNN-LSTM 외 Video Embedding으로 접근해보는 것도 유의미한 시도라 생각

Tail Model

(LSTM, GRU, Transformer, LLAMA, GPT ...)

  • 현재 LSTM, GRU, Transformer 3개의 모델 코드로 학습 모델 생성 중

Result

LEVEL Depth

  • Train / Val / Test : 70 / 15 / 15

  • Model : deeplob

  • Learning Rate : 0.0003

  • epochs : 20

  • LightGBM RMSPE : 1.8875

T : 120

T : 240

lv 28, T 240, Deeplob 일부

RMSPE: 0.7864623

Look Back

  • Train / Val / Test : 70 / 15 / 15
  • Model : CNN + GRU
  • Learning Rate : 0.0003
  • epochs : 20

profile
개발 새발

0개의 댓글

관련 채용 정보