다음 내용은 한빛미디어 <퀀트 전략을 위한 인공지능 트레이딩>을 공부하며 요약한 내용입니다.
chap1. 금융과 투자 영역의 머신러닝
- 투자 업계에서는 금융 데이터를 손쉽게 처리해주는 효율적인 라이브러리가 마들어져도, 업무 특성상 성능 좋은 알고리즘이나 방법론이 공유되는 경우가 적음.
- 검증 방법이 제한적
- 백테스트 backtesting 검증 방법이 자주 사용되지만, 신뢰도가 높지 않음.
- 신뢰성 있는 백테스트 방법론의 개발이 필요
- 페이퍼 트레이딩 같은 방법을 통해 검증을 진행하긴 하지만 소요시간이 길어 검증 과정 동안 시장 환경이 바뀜
- 양질의 데이터가 부족함
1.1 AI, 금융, 투자의 삼각관계
<전통적인 금융 관점에서 AI기술이 활용되는 곳>
1. 이상탐지 (금융 사기 탐지)
2. 리스크 평가 및 관리
3. 플랫폼 서비스 제공
4. 투자 관리
- AI가 투자 금융 업계에 막대한 영향을 미칠 것에는 공감하지만, 실제로 준비된 곳이 많지 않음
- 투자 영역에서 AI 기술의 활용은 잠재적 규모와 파급력에 비해 아직 초기 단계에 머물러있음.
- 투자 영역의 특성상, 특정 저략이 공개되면 성능이 떨어질 공산이 매우 크기 때문.
<금융 시장에 영향을 주는 기술>
<트레이더가 선정한 향후 금융 시장에 영향을 미칠 기술>
1.2 실제 투자 영역의 머신러닝 응용 사례
AI 기술을 투자에 활용하는 방법
-
market cycle 혹은 regime을 예측
: 거시적인 시장 전체의 움직(레짐)을 예측해 이에 대응하는 자산 배분 혹은 주식 서정 stock selection
-> 거시지표 (macro index) 사용법, 자연어 처리 (NLP) 기술을 활용한 패턴 인식 혹은 순환 검출 cycle detection 방법, 팩터 기반의 접근법 등 이용
-
거시적인 시장 전체의 움직임에 상관없이 자산 자체의 움직임을 예측
응용 사례
- New York Life Investment
: 다양한 자산을 세계 경제 사이클의 움직임에 따라 배분하기 위해 마켓 사이클을 예측하는 알고리즘을 개발.
- 사용하는 리스크 팩터 기반의 접근법에서 사이클, 모멘텀, 밸류, 감성분석의 핵심 기술이 머신러닝
- 크래프트테크놀로지스
: 국내 인공지능 스타트업. 뉴욕증시에 AI기반 ETF를 상장함.
- 기술블로그 https://www/qraftec.com/blog/
- 전통 금융사 중 신한금융그룹 - 딥러닝과 강화학습을 활용한 펀드 출시
- 한국투자증권 - 인공지능 기술을 적용한 리서치 서비스 오픈
- MAN AHL
: 140조의 자산을 운용하는 세계적인 헤지펀드.퀀트 투자 담당.
- 전통적인 통계나 계량 경제 기법의 한계를 보안하기 위해 베이지안 머신러닝,딥러닝 등 패턴 인식 알고리즘과 NLP기술을 활용한 전략 개발
- 주가 데이터 뿐만 아니라 호가창 limit order book 데이터를 활용해 ML로 시장 미시구조에 대한 연구를 진행
- Castle Ridge Asset Management
: 자체 개발한 알고리즘 프로그램 "W.A.L.L.A.C.E"를 사용
- 유전 알고리즘과 머신러닝을 결합
- 주가데이터 45%, 재무 데이터 35%, 텍스트 데이터 15% 로 구성
- 마켓 하강 국면을 정확히 포착함
- State Street Corporation
: 트레이딩 볼륨을 예측하기 위해 딥러닝 알고리즘 사용한 사례
- 일간 트레이딩 행위를 다섯가지 요소로 분류
- 금융 마켓 인덱스
- 마켓 인덱스 재조정 스케줄
- 과거 트레이딩 볼륨
- 지역별 마켓의 상관관계
- 스페셜 캘린더 데이
- 두 개의 인코더 네트워크와 한 개의 디코더 네트워크를 가진 CNN에 기반한 시퀀스-투-시퀀스 모델
1.3 투자 영역에서 활용하는 알고리즘
투자 영역에서 머신러닝의 강점
: 마르코스 로페즈 교수의 <자산운영사를 위한 머신러닝>
1. 샘플 내 분산 조정이 아닌 샘플 외 데이터에 대한 예측력에 초점
2. 컴퓨터의 계산 능력을 활용해 잠재적으로 비현실적인 가정을 피할 수 있게 해줌
3. 비선형, 계층적 혹은 고차원에서 연속되지 않은 상호효과 등 복잡한 내용을 학습할 수 있음
4. 다중공선성과 다른 대체효과에 견고한 방법으로 변수탐색과 상황 탐색을 구분할 수 있도록 해줌
1.4 투자 영역에서 활용하는 데이터
- 전통적인 금융 데이터
: 대체 데이터를 제외한 펀더멘털,마켓,분석 데이터
- 특정 주가의 방향이나 특정 자산이나 회사의 가치를 예측할 때 베이스라인
- 주의점 : 시계열 길이가 길지않고, 주가 데이터 자체에 노이즈가 많아서 과적합 위험이 큼
- 마켓 사이클 예측시엔 거시경제 지표의 발표 주기, 형태 등이 제각각이므로 사용할 때 주의해야함
- 대체 데이터
: 전통적인 금융 데이터 외의 데이터.
- 뉴스, SNS 데이터
- 트윗 데이터 분석 스타트업 : DataMinr
< 데이터 유용성 검증을 위한 여섯가지 접근법 >
: 2019 Monk < 다시 생각하는 기관 투자에서의 대체 데이터>
- 신뢰성 : 데이터가 얼마나 정확한가
- 세분화 : 데이터 포인트가 얼마나 세분화되었는가
- 효용성 : 데이터를 언제 반영했으며, 최신 트렌드를 반영했는가
- 사용 범위 : 데이터가 포괄할 수 있는 범위가 얼마나 되는가
- 행동가능성 : 데이터에 기반해 구체적인 행동과 결정을 실행/내릴 수 있는가
- 희소성 : 데이터가 얼마나 희소성이 있는가