(특강) 구종만 - AI + ML과 Quant Trading

newbie·2021년 9월 23일

강의 소개

퀀트 트레이딩 일을 하게 되면서 배운 것들에 대해 이야기합니다.

퀀트 트레이딩이 어떻게 이루어지는지, 퀀트 트레이딩에서 사용하는 수많은 전략들은 무엇인 지 예시를 바탕으로 소개합니다. 이 과정 속에서 머신러닝/딥러닝이 어떻게 활용될 수 있을지도 간략히 소개합니다.

추가적으로 소프트웨어 엔지니어에서 리서치 쪽으로 커리어를 전환하면서 느낀 점에 관해서도 이야기합니다.


  • 퀀트 트레이딩 업계 소개
    • 무슨 일인가?
    • AI/ML으로 풀 수 있는 문제들은 어던 것이 있는가?
    • 어떤 알고리즘을 사용하는가?
    • 리서치 과정은 무엇을 연구하는가?

트레이딩이란?

  • 투자(investment, 장기간)와 트레이딩(trading, 상대적 단기간)

퀀트 트레이딩이란?

  • Quantitative(계량적) 트레이딩
  • 모델 기반(가격이 특정 수학적 성질을 가진다고 가정) 혹은 데이터 기반(시장의 과거 데이터 분포 추정) 접근
  • Automated/system/algorithmic trading이라고도 부름

퀀트 트레이딩 스펙트럼

  • 수많은 종류의 전략이 존재
  • 포지션을 얼마나 오래 유지하는가(트레이딩 시간)
  • 어떤 상품군을 거래하는가
  • 자동화 vs 트레이딩 주관
  • 주문 집행 vs 자체 수익
  • 어디서 수익이 오는가(시장 특성, 훌륭한 통계적 모델 등...)
  • 전략 예시
    • arbitrage : 하나의 상품이 여러 곳에서 거래될 때 싼 곳에서 사서 비싼 곳에 판매
    • market making : 매수(구입)주문과 매도(판매) 주문을 동시에 진행하여 수익 창출(e.g., 환율)
    • statistical arbitrage : 미래 가격 변화를 예측해서 거래

퀀트 트레이딩 플레이어

  • 퀀트 헤지펀드/로보 어드바이저
    • 고객의 자본(수천억~수십조)을 운용하고 운용자금과 이익의 일부를 보수로 받음
  • 프랍 트레이딩(자기 자본 거래)
    • 회사 파트너들의 자본(수십~수백억)을 거래

Stat Arb 전략

  • input : 거래소 호가, 공시자료, 뉴스, 빅데이터
  • 모델 : 선형회귀(대다수), 머신러닝(일부), 딥러닝(일부)
  • 이러한 모델을 토대로 R2 score 확인하는데, 실질적으로 10%,30%,90%의 성능을 내는 모델들은 잘못 설계되어 있을 가능성이 높음
  • 반면, 0.5%, 1%, 3%의 낮은 점수의 모델들로도 충분히 성능을 낼 수 있음
  • 가격 예측 배팅을 수십만번 반복을 통해(대수법칙) 이론값으로 수렴
  • 결과적으로 거래의 수익량은 0.01%, 이 것을 수차례 반복하여 수익을 창출

시장에서 딥러닝을 잘 사용하지 않는 이유

  • 우리가 보는 정보는 항상 뒤늦게 확인 가능
  • 예측 불가한 사건들 : 코로나, 암호화폐, 경영진의 스캔들 등...
  • 시장은 지속적으로 변화
    • 접근 방법 고도화
    • 내 모델과 다른 참가자들 모델 사이의 피드백(내 거래를 보고 다른 참가자가 비슷한 모델을 사용)
    • 모델 학습 시간 제한
    • 달라지는 규제
    • 새로운 시장 및 상품군 출현
  • 문제가 어려움
    • 오버피팅 위험 : 오버피팅이 진짜 오버피팅인지 아닌지 장담 불가
  • 시장이 변화할 때 변화하는 속성과 그렇지 않은 속성을 분리해야 함
    • 단, 명확히 알고 있으면 선형회귀로도 대부분 가치를 뽑아낼수 있음

러서치 역할

  • 새로운 정보에서 모델을 통해 요점을 출력할 수 있는 알고리즘 확보
  • 리서치 과정:
    • 가설
      • 대부분 리서치는 가설로부터 시작
      • 설득력이 있는 가설이 없이 시작된 리서치는 결론이 조금만 안좋아도 쉽게 끝남
      • 학습된 모델의 형태나 성능으로부터 점진적으로 더 나은 가설을 얻기도 함
    • 데이터 수집
      • 다양한 데이터를 수입하여 사용
      • 데이터의 엑기스를 추출할 수 있는 방안 고려
        • 필터링, 노이즈 제거, 클리핑, outlier 감지 등...
    • 알고리즘 선별
      • 내가 정의한 가설을 가잘 잘 표현할 수 있는 알고리즘 선별
    • monetization(수익화)
      • output을 가지고 실제 수익을 낼 수 있는 방안을 고려
profile
DL, NLP Engineer to be....

0개의 댓글