stock-id nearest neighbor 에서 동시간대에만 다뤘는데,다른 시간대의 element또 끌고 와서 사용해도 되지 않을까? 라는 Question업비트, 바이낸스 price 흐름을 보면서 New Approach 구상 중...https://upbit
하나의 특성을 기준으로 Nearest Neighbor를 Search 후, 결과 값으로 나온 Nearest Neighbor를 Index 삼고, 기존 Feature의 값을 numpy function을 사용하여 Feature를 생성주요 특성들을 관찰하고 유사한 특성을 찾고자
2^N 개 단위로 NN을 추출하였고적은 수의 NN을 묶어서 추출한 데이터는 큰 의미가 없음단일 유전자를 관찰하기 위해 해당 유전자를 증폭시켜 실험하는 PCR과 유사 맥락이고 생각.Nearest Neighbor의 역할은 하나의 Feature을 여러 개로 증폭시켜 Pred
정규분포를 띄지 않는 high_low_gap, bidask_spread 특성만 log scale 하는 것은 논리적 NN Search에 영향이 있으므로, 모든 특성을 정규화 후 NN Search 하였음.기존 RMSPE가 0.55 ~ 0.60 사이 값에서 0.5 초반으로
https://github.com/rorysroes/SGX-Full-OrderBook-Tick-Data-Trading-Strategy/tree/masterTimestampAsk Price 1,2,3Bid Price 1,2,3Ask Size 1,2,3Bid Si
1. Start with a System update 2. Import the InfluxDB GPG key 3. Add APT repository 4. Installing InfluxDB on Ubuntu 22.04 5. Start and Enable the
안정된 데이터 수집을 위해 Upbit Websocket API를 사용하여 데이터 수집 데이터 종류로는 Ticker / OrderBookTicker : 현재가 변경 시 데이터 제공 (거래가 일어남에 따라 변화)Orderbook : 단위 시간별로 수집된 주문을 정리한 호가
코드는 해당 Github에서 참조한 틀을 일부 수정해서 진행기존 코드는 Lookback 100개 Orderbook을 사용해 향후 방향성 예측Upbit는 1초에 6개 orderbook이므로 약 1800개(10분)이상의 Lookback을 두고 진행해야 함기존 코드에서는 이
Non-aggrigation
호가 Depth가 깊을수록 더 많은 Noise가 발생하지 않을까라는 의문으로 DeepLOB의 호가 Depth 최적화 실험종속 변수 : 향후 5분간 High - Low Price Size에 대한 Label해당 모델 특징 중 하나인 CNN PART에서 호가 깊이에 따른 두
DeepLOB Order Level PerformanceBid-Ask 7호가 사용한 경우 높은 정확도를 보임Classification but Regressioncontinuous한 종속 변수를 특정 구간 나누어 Classification하게 되는 경우구간을 어떻게 정의
Conv 1d, 2d, 3d Reference DeepLOB CNN N개의 호가를 1개의 Feature로 변환하는 작업 T개의 LookBack을 압축하며 Time Series Noise 제거하는 작업 Inception 64개의 1x1 Filter로 차원 구체화 3
Concept : 각 시점을 학습하는 순간마다 학습 (Train-Loss 계산)ReferenceDeepLOB 모델에서의 EMA Filter Part의 역할을 정교하게 할 것으로 예상Pytorch 지원 X, Keras(Tenserflow)에서 모델링 진행CNN Secon
RMSPE: 1.2320882R-squared: -26027.513671875MAE: 0.000666171LOB + Others (LSTM)
평균 변동성 확인 (최근 vs 2022-12-16~2023-02-25)새벽 필터링 개선https://github.com/khuangaf/CryptocurrencyPrediction/tree/master
Aggregation
기존 모델과 달리, 과거 가격과 호가 잔량 정보만을 입력으로 사용Orderbook을 사용해 Classification 문제를 해결모델이 훈련 데이터 세트에서 자체적으로 특징을 학습해 데이터에 적응하는(data-adaptive) 방식LOB의 '공간-시간 이미지' 형태의
Index Data Source
tick level lookback forcast range problem변동성 작은 자산에서 짧은 range는 errordeeplob를 쓰기 위한 발표 : 주객전도 모델링다른 모델도 검토, 통계 모델은 왜 사용 안했나통계 모델의 결과값도 feature로 사용 가능
Total Bid SizeTotal Ask SizeBid/Ask RatioMid PriceBid Ask SpreadFOREHEAD_RANGE : 300sLookback : 900sModel : CNN + GRUAccuracy: 0.7437Precision: 0.4531