[Trading Machine Project] NN Advanced

immanuelk1m·2023년 8월 17일
0

Trading Machine Project

목록 보기
4/20
post-thumbnail

Last Meeting

Scale

정규분포를 띄지 않는 high_low_gap, bidask_spread 특성만 log scale 하는 것은 논리적 NN Search에 영향이 있으므로, 모든 특성을 정규화 후 NN Search 하였음.

기존 RMSPE가 0.55 ~ 0.60 사이 값에서 0.5 초반으로 크게 줄어듦

RMSPE High

USE_TWO_FEATURE

Distance Metric 중 minkowski의 값이 설명력이 높게 나옴
2차원 Data의 Distance에 최적화된 Canberra의 장점을 사용해
설명력이 높다고 생각하는 realized_volatility와 bidask_spread0 두 특성을 사용한 NN 추가 생성

time_id_neigbor_sizes

2 ~ 64 단위로 모니터링 해본 결과 대체적으로 단위가 높을수록
dv1_realized_volatility 비교 RMSPE가 낮게 나오는 경향이 있었음
추가 데이터들로 확인이 필요함

Feature Importance

현재 대략 5700개의 Feature가 생성되었지만
dv1_realized_volatility를 제외한 다른 파생 변수는 어떻게 Selection 할 지는 리서치 중

ToDo

  • BTC 이외의 Coins
  • Feature Selection
  • Task를 Multi Classification Problem으로 해석하면 난이도가 내려가지 않을까
  • Outlier Detection Problem?
profile
개발 새발

1개의 댓글

comment-user-thumbnail
2023년 8월 17일

좋은 정보 얻어갑니다, 감사합니다.

답글 달기

관련 채용 정보