immanuelk1m.log

immanuelk1m.log

[Trading Machine Project] DeepLOB Hyper Parameters

immanuelk1m·2024년 2월 26일

0

Trading Machine Project

목록 보기

11/20

DeepLOB Hyper Parameters

Classification Label

Percentile

종속 변수가 정규 분포를 띄는 경우 아래 같은 구간 분류로 Labeling
데이터가 적은 구간 (상,하위 4% 변동)에 대해서는 예측력이 많이 떨어지는 모습을 보여줌

Number of Classification

Classification의 수가 적을수록 모델의 성능은 향상됨

Regression

Classification but Regression

<연속적인 값인 종속 변수를 특정 구간 나누어 Classification 하는 경우>

구간을 어떻게 정의하느냐에 따라 모델의 성능과 해석이 크게 달라짐
임계값의 선택에 따라 같은 데이터셋에서도 전혀 다른 분류 결과가 도출
Labeling을 어떻게 정했는지를 모델이 추가로 학습해야하는 일종의 부담이 발생함
임계값 근처의 Prediction의 경우 애매한 포지션으로 Performance 감소로 이어짐
Regression 예측 결과에 대해 Labeling을 하는 방식으로 수정
Regression 결과를 FC Layer를 통해 Classification 하는 모델이므로, Regression Task 시도
Vaildation Loss가 줄어들지 않는 현상 해결

Orderbook Level

DeepLOB Order Level Performance
Bid-Ask 7호가 사용한 경우 높은 정확도를 보임

Look Back

1 row : 30s
120 (1 hour), 240 (2 hour), 360 (3 hour) , 480 (4 hour), 600 (5 hour), 720 (600min)

Machine Parameter

Head Model

(Advanced CNN e.g. IMAGE Model ...)

DeepLOB의 Main Idea인 Inception이 호가 움직임을 일종의 Video로 보는 관점에서 시작했을 것이란 생각.

따라서 DeepLOB의 전체 틀인 CNN-LSTM 외 Video Embedding으로 접근해보는 것도 유의미한 시도라 생각

Tail Model

(LSTM, GRU, Transformer, LLAMA, GPT ...)

현재 LSTM, GRU, Transformer 3개의 모델 코드로 학습 모델 생성 중

Result

LEVEL Depth

Train / Val / Test : 70 / 15 / 15
Model : deeplob
Learning Rate : 0.0003
epochs : 20
LightGBM RMSPE : 1.8875

T : 120

T : 240

lv 28, T 240, Deeplob 일부

RMSPE: 0.7864623

Look Back

Train / Val / Test : 70 / 15 / 15
Model : CNN + GRU
Learning Rate : 0.0003
epochs : 20

개발 새발

이전 포스트

[Trading Machine Project] DeepLOB Order Level Performance

다음 포스트

[Trading Machine Project] 02/29 Review & LOB + Other Features

0개의 댓글

관련 채용 정보