(특강) 구종만 - AI + ML과 Quant Trading

newbie·2021년 9월 23일

[boostcampAI Special stage] week 8

목록 보기

4/9

강의 소개

퀀트 트레이딩 일을 하게 되면서 배운 것들에 대해 이야기합니다.

퀀트 트레이딩이 어떻게 이루어지는지, 퀀트 트레이딩에서 사용하는 수많은 전략들은 무엇인 지 예시를 바탕으로 소개합니다. 이 과정 속에서 머신러닝/딥러닝이 어떻게 활용될 수 있을지도 간략히 소개합니다.

추가적으로 소프트웨어 엔지니어에서 리서치 쪽으로 커리어를 전환하면서 느낀 점에 관해서도 이야기합니다.

퀀트 트레이딩 업계 소개
- 무슨 일인가?
- AI/ML으로 풀 수 있는 문제들은 어던 것이 있는가?
- 어떤 알고리즘을 사용하는가?
- 리서치 과정은 무엇을 연구하는가?

트레이딩이란?

투자(investment, 장기간)와 트레이딩(trading, 상대적 단기간)

퀀트 트레이딩이란?

Quantitative(계량적) 트레이딩
모델 기반(가격이 특정 수학적 성질을 가진다고 가정) 혹은 데이터 기반(시장의 과거 데이터 분포 추정) 접근
Automated/system/algorithmic trading이라고도 부름

퀀트 트레이딩 스펙트럼

수많은 종류의 전략이 존재
포지션을 얼마나 오래 유지하는가(트레이딩 시간)
어떤 상품군을 거래하는가
자동화 vs 트레이딩 주관
주문 집행 vs 자체 수익
어디서 수익이 오는가(시장 특성, 훌륭한 통계적 모델 등...)
전략 예시
- arbitrage : 하나의 상품이 여러 곳에서 거래될 때 싼 곳에서 사서 비싼 곳에 판매
- market making : 매수(구입)주문과 매도(판매) 주문을 동시에 진행하여 수익 창출(e.g., 환율)
- statistical arbitrage : 미래 가격 변화를 예측해서 거래

퀀트 트레이딩 플레이어

퀀트 헤지펀드/로보 어드바이저
- 고객의 자본(수천억~수십조)을 운용하고 운용자금과 이익의 일부를 보수로 받음
프랍 트레이딩(자기 자본 거래)
- 회사 파트너들의 자본(수십~수백억)을 거래

Stat Arb 전략

input : 거래소 호가, 공시자료, 뉴스, 빅데이터
모델 : 선형회귀(대다수), 머신러닝(일부), 딥러닝(일부)
이러한 모델을 토대로 R2 score 확인하는데, 실질적으로 10%,30%,90%의 성능을 내는 모델들은 잘못 설계되어 있을 가능성이 높음
반면, 0.5%, 1%, 3%의 낮은 점수의 모델들로도 충분히 성능을 낼 수 있음
가격 예측 배팅을 수십만번 반복을 통해(대수법칙) 이론값으로 수렴
결과적으로 거래의 수익량은 0.01%, 이 것을 수차례 반복하여 수익을 창출

시장에서 딥러닝을 잘 사용하지 않는 이유

우리가 보는 정보는 항상 뒤늦게 확인 가능
예측 불가한 사건들 : 코로나, 암호화폐, 경영진의 스캔들 등...
시장은 지속적으로 변화
- 접근 방법 고도화
- 내 모델과 다른 참가자들 모델 사이의 피드백(내 거래를 보고 다른 참가자가 비슷한 모델을 사용)
- 모델 학습 시간 제한
- 달라지는 규제
- 새로운 시장 및 상품군 출현
문제가 어려움
- 오버피팅 위험 : 오버피팅이 진짜 오버피팅인지 아닌지 장담 불가
시장이 변화할 때 변화하는 속성과 그렇지 않은 속성을 분리해야 함
- 단, 명확히 알고 있으면 선형회귀로도 대부분 가치를 뽑아낼수 있음

러서치 역할

새로운 정보에서 모델을 통해 요점을 출력할 수 있는 알고리즘 확보
리서치 과정:
- 가설
  - 대부분 리서치는 가설로부터 시작
  - 설득력이 있는 가설이 없이 시작된 리서치는 결론이 조금만 안좋아도 쉽게 끝남
  - 학습된 모델의 형태나 성능으로부터 점진적으로 더 나은 가설을 얻기도 함
- 데이터 수집
  - 다양한 데이터를 수입하여 사용
  - 데이터의 엑기스를 추출할 수 있는 방안 고려
    - 필터링, 노이즈 제거, 클리핑, outlier 감지 등...
- 알고리즘 선별
  - 내가 정의한 가설을 가잘 잘 표현할 수 있는 알고리즘 선별
- monetization(수익화)
  - output을 가지고 실제 수익을 낼 수 있는 방안을 고려

DL, NLP Engineer to be....

이전 포스트

김상훈 (Upstage) - 캐글 그랜드마스터의 경진대회 노하우 대방출

다음 포스트

(특강) 문지형 - 내가 만든 AI 모델은 합법일까, 불법일까

0개의 댓글