[Dacon] KRX 주식 투자 알고리즘 경진대회

Jihoon·2023년 7월 14일
0

AI_CONTEST

목록 보기
6/7
post-thumbnail

대회 목적

  1. 한국거래소의 정보사업 확대
  2. 시장참가자들에게 더욱 유용한 투자 참고 정보를 제공하기 위함

주제

전체 : 자본시장 데이터 및 공공 데이터를 활용한 주식 투자 알고리즘 경진대회
예선 : 자본시장 데이터 및 공공 데이터를 활용하여 Long-Short 포트폴리오 구성
본선 : 자본시장 데이터 및 공공 데이터를 활용하여 가상투자를 진행하는 알고리즘 제작

분석지표

Sharp Index(샤프 지수)

데이터 파악

시계열 형태
2021~2023 데이터 (20210601~20230530)

도메인 지식

  1. 코스피 - 대부분 우량 기업 포진 -> 가격 변동률이 낮아 안정성이 높음

  2. 코스닥 - 유망주 -> 가격 변동률이 높아 안정성이 떨어짐

전처리 상황

업종, 시장 구분 컬럼 매칭 추가
거래량, 시가, 종가, 고가, 저가 피쳐들 모두 차분 적용 (정상성을 위해서)

추가 전처리 과정

차분 전의 피쳐들 제거 필요

분석 방향

어느 정도의 기간 데이터를 활용할지
어느 파생변수가 추가되면 좋을지 (도메인 지식)
어떤 모델을 활용해야 할지

1. Facebook Prophet

1.1 2년, 1년, 6개월 분석 진행

데이터를 2년, 1년, 6개월 단위로 해서 분석 진행
추가적 데이터 확인 필요

2. LSTM Model

어느 정도의 데이터를 활용해야할지
input_dim : 산업별, 업종별 다르게 적용
hidden_dim : 이게 애매하구마이
output_dim : 15 (15일치가 필요) 본선땐 다름

profile
장난감이 데이터인 사람

0개의 댓글