나만의 AI 연구 프로젝트 AIFFELthon
아이펠 과정을 시작했을 때부터 제일 궁금했던 과정, 아이펠톤이 벌써 1/3을 지나가고 있다! 🤪

기업에서 제시한 주제는 심플했다. PYKRX 활용 주가 시계열 예측 프로젝트 세부적으로는 일간 시계열 예측 과제 혹은 상승/하락 확률 예측으로 나눠볼 수 있다. 우리 팀은 주제를 정하는 것부터 아주 오랜 시간 논의 했다(사실 지금도 하고 있다).

  • 투자 전략 vs 모델링

분석과 피처엔지니어링을 통한 트레이딩 전략, 혹은 여러 모델/ 새로운 모델 만들어 돌려보며 찾는 최적의 모델링? 여기서 성과는 수익으로 귀결된다.

그래서 어렵다. 우리가 특정 종목의 추세를 예측한다고 하여 100% 수익을 낼 수 있는 게 아니다. 매수, 매도 타이밍을 잡는 건 또 다른 문제니까. 현실 세계 문제는 그렇게 간단하게 정의되지 않는다.

트렌드건 확률이건 가격 예측이건 우리는 쓸모 있는 무언가를 결과로 가져가고 싶었다. 예측을 넘어서서 수익을 낼 수 있는 모델을 만들어보고 싶은 것! 한 종목 예측도 어려운데, 수익성 모델까지?

0주차
(4/16~ 23) Pre AIFFELthon 주제 정하고 팀원 구하기

1주차
(4/24~ 5/1) : 팀 빌딩 및 주제 구체화

  • 4/26 기업멘토링 OT
  • 하루 week1 분량 (강의 10개) 개인 학습시간
  • 각자 성과 보고 (근데 방향성이 아직 안 보임)

멘토님과 OT를 진행하고 "오호 정말 어렵군" 하고 문제 상황을 날카롭게 정의해야 할 필요성을 느꼈는데(거기까지는 좋았는데) 다음날부터 바로 시작됐다. 삽질이. 가끔 내가 뭘 하고 있는지도 모를만큼 길을 잃었다.

2주차
(5/2~ 5/9) : 데모 시연

  • 5/8 1차 멘토링
  • 5/9 GCP 설명회

첫 번째 멘토링

  • 5월 8일 첫 번째 멘토링까지
  • 우리 팀의 목표는 데모 시연이었다. 각자 갖고 있는 방법론이 있고 주제가 있는데 의견이 잘 모아지지 않았다. 각자 아이디어를 모두가 다 하고 싶은 상황이라기 보다는, 뾰족한 무언가가 나오지 않았던 것.
  • 그래서 생각하는 걸 일단 만들어서 돌려보기로 했다. 돌려서 상대방에게 보여주고, 또 멘토링 받으며 방향성에 피드백을 받고자 했다.

5월 5일 어린이날 오후 9시.. 
우리가 만나서 회의한 시간. 끝나기 전에 다같이 사진 찍자고 했다. 
오랜만에 특별하게 던전에서🏕 던전은 퀘스트 깨던 곳이다.

그리고 오늘 고대하던 첫 번째 멘토링을 했다!

결론은 실험, 실험, 실험이다! 전부 다 케이스 바이 케이스로 '잘' 실험을 해야알 수 있는 것. 그러니까 백테스팅을 했는데 수익률이 오~ 괜찬네? << 일단 의심하기 😳

트렌드 라벨링시 설정한 데이터 포인트가 너무 특정 종목에 피팅된 건 아닌지?, 어디선가 미래 데이터가 참조된 건 아닌지?, 변동성이 없는 기간으로 설정하여 다른 추세를 보이는 시기에도 쓸 수 있는 모델인지?

  • 매매전략 Robust :백테스팅 그리고 포워드테스팅(real-time)
  • 재학습주기 연구 : 이 모델의 유효기간이 얼마인지? 2025년, 2026년, 2027년.. 언제까지 쓸 수 있는 모델인지?
  • 시계열 연구 : train/val/test 기간, 종목 별 클러스터링

앞으로 계획

그래서 앞으로, 우리가 고려해야 할 사항은 다음과 같다.

  1. 종목별 거래량
  2. 운용 금액
  • 얼마를 굴릴 수 있는 전략인가? (100억 전략 != 100억 버는 전략)
  • 100억을 운용할 수 있는 전략인지. 1000억을 운용할 수 있는 전략인지.
  1. 매수, 매도 전략 백테스팅 설계
  • 현실 세계에서는 100억을 풀매수하거나 풀매도 할 수가 없다 😇
  • 일단 우리는 방법론을 테스트하고 있기 때문에 풀매도 or 풀매수 전략으로 가고 있다
  1. 비시계열데이터 - 재무제표 활용
  • 분기 단위 리밸런싱 or 월 단위(개인투자자들이 많이 쓰는데 쉽지 않음 왜? [2, 3] 문제 때문에)
profile
사실천재

0개의 댓글