강의 소개
퀀트 트레이딩 일을 하게 되면서 배운 것들에 대해 이야기합니다.
퀀트 트레이딩이 어떻게 이루어지는지, 퀀트 트레이딩에서 사용하는 수많은 전략들은 무엇인 지 예시를 바탕으로 소개합니다. 이 과정 속에서 머신러닝/딥러닝이 어떻게 활용될 수 있을지도 간략히 소개합니다.
추가적으로 소프트웨어 엔지니어에서 리서치 쪽으로 커리어를 전환하면서 느낀 점에 관해서도 이야기합니다.
- 퀀트 트레이딩 업계 소개
- 무슨 일인가?
- AI/ML으로 풀 수 있는 문제들은 어던 것이 있는가?
- 어떤 알고리즘을 사용하는가?
- 리서치 과정은 무엇을 연구하는가?
트레이딩이란?
- 투자(investment, 장기간)와 트레이딩(trading, 상대적 단기간)
퀀트 트레이딩이란?
- Quantitative(계량적) 트레이딩
- 모델 기반(가격이 특정 수학적 성질을 가진다고 가정) 혹은 데이터 기반(시장의 과거 데이터 분포 추정) 접근
- Automated/system/algorithmic trading이라고도 부름
퀀트 트레이딩 스펙트럼
- 수많은 종류의 전략이 존재
- 포지션을 얼마나 오래 유지하는가(트레이딩 시간)
- 어떤 상품군을 거래하는가
- 자동화 vs 트레이딩 주관
- 주문 집행 vs 자체 수익
- 어디서 수익이 오는가(시장 특성, 훌륭한 통계적 모델 등...)
- 전략 예시
- arbitrage : 하나의 상품이 여러 곳에서 거래될 때 싼 곳에서 사서 비싼 곳에 판매
- market making : 매수(구입)주문과 매도(판매) 주문을 동시에 진행하여 수익 창출(e.g., 환율)
- statistical arbitrage : 미래 가격 변화를 예측해서 거래
퀀트 트레이딩 플레이어
- 퀀트 헤지펀드/로보 어드바이저
- 고객의 자본(수천억~수십조)을 운용하고 운용자금과 이익의 일부를 보수로 받음
- 프랍 트레이딩(자기 자본 거래)
Stat Arb 전략
- input : 거래소 호가, 공시자료, 뉴스, 빅데이터
- 모델 : 선형회귀(대다수), 머신러닝(일부), 딥러닝(일부)
- 이러한 모델을 토대로 R2 score 확인하는데, 실질적으로 10%,30%,90%의 성능을 내는 모델들은 잘못 설계되어 있을 가능성이 높음
- 반면, 0.5%, 1%, 3%의 낮은 점수의 모델들로도 충분히 성능을 낼 수 있음
- 가격 예측 배팅을 수십만번 반복을 통해(대수법칙) 이론값으로 수렴
- 결과적으로 거래의 수익량은 0.01%, 이 것을 수차례 반복하여 수익을 창출
시장에서 딥러닝을 잘 사용하지 않는 이유
- 우리가 보는 정보는 항상 뒤늦게 확인 가능
- 예측 불가한 사건들 : 코로나, 암호화폐, 경영진의 스캔들 등...
- 시장은 지속적으로 변화
- 접근 방법 고도화
- 내 모델과 다른 참가자들 모델 사이의 피드백(내 거래를 보고 다른 참가자가 비슷한 모델을 사용)
- 모델 학습 시간 제한
- 달라지는 규제
- 새로운 시장 및 상품군 출현
- 문제가 어려움
- 오버피팅 위험 : 오버피팅이 진짜 오버피팅인지 아닌지 장담 불가
- 시장이 변화할 때 변화하는 속성과 그렇지 않은 속성을 분리해야 함
- 단, 명확히 알고 있으면 선형회귀로도 대부분 가치를 뽑아낼수 있음
러서치 역할
- 새로운 정보에서 모델을 통해 요점을 출력할 수 있는 알고리즘 확보
- 리서치 과정:
- 가설
- 대부분 리서치는 가설로부터 시작
- 설득력이 있는 가설이 없이 시작된 리서치는 결론이 조금만 안좋아도 쉽게 끝남
- 학습된 모델의 형태나 성능으로부터 점진적으로 더 나은 가설을 얻기도 함
- 데이터 수집
- 다양한 데이터를 수입하여 사용
- 데이터의 엑기스를 추출할 수 있는 방안 고려
- 필터링, 노이즈 제거, 클리핑, outlier 감지 등...
- 알고리즘 선별
- 내가 정의한 가설을 가잘 잘 표현할 수 있는 알고리즘 선별
- monetization(수익화)
- output을 가지고 실제 수익을 낼 수 있는 방안을 고려