- 한국거래소의 정보사업 확대
- 시장참가자들에게 더욱 유용한 투자 참고 정보를 제공하기 위함
전체 : 자본시장 데이터 및 공공 데이터를 활용한 주식 투자 알고리즘 경진대회
예선 : 자본시장 데이터 및 공공 데이터를 활용하여 Long-Short 포트폴리오 구성
본선 : 자본시장 데이터 및 공공 데이터를 활용하여 가상투자를 진행하는 알고리즘 제작
Sharp Index(샤프 지수)
시계열 형태
2021~2023 데이터 (20210601~20230530)
- 코스피 - 대부분 우량 기업 포진 -> 가격 변동률이 낮아 안정성이 높음
- 코스닥 - 유망주 -> 가격 변동률이 높아 안정성이 떨어짐
업종, 시장 구분 컬럼 매칭 추가
거래량, 시가, 종가, 고가, 저가 피쳐들 모두 차분 적용 (정상성을 위해서)
차분 전의 피쳐들 제거 필요
어느 정도의 기간 데이터를 활용할지
어느 파생변수가 추가되면 좋을지 (도메인 지식)
어떤 모델을 활용해야 할지
데이터를 2년, 1년, 6개월 단위로 해서 분석 진행
추가적 데이터 확인 필요
어느 정도의 데이터를 활용해야할지
input_dim : 산업별, 업종별 다르게 적용
hidden_dim : 이게 애매하구마이
output_dim : 15 (15일치가 필요) 본선땐 다름