[Kaggle-UMP] #0 시작과 목표

신예진·2022년 3월 1일
0
post-thumbnail

Posting Plan

YBIGTA 공모전 스터디를 통해 kaggle competition에 참여하게 되었고, 사실 이 스터디는 지금 이 글을 쓰는 시점에는 이미 끝났다. 하지만 스터디 이후에도 competition 마감까지 계속해서 공부를 위해 도전해보려고 한다. 본 시리즈에서는 지난 스터디를 하며 겪었던 시행착오들 + 공부한 것들을 정리해보려고 한다. 그리고 앞으로 competiton을 통해 배운 점들을 적을 것이다!

First Impressions

Ubiquant Market Prediction (Kaggle)

우선 간단하게 competition에 대해서 설명하자면, financial 데이터셋을 활용해서 수익률을 예측하는 task라고 볼 수 있다. 금융과 관련된 대회이다보니 초반에는 시계열과 관련된 여러 알고리즘들을 경험해볼 수 있을 것 같다는 나름의 기대를 가졌던 것 같다.

Goal

작게라도 목표를 가지고 시작하면 좋을 것 같아서 세웠던 목표들이 있었는데, 간단하게 언급하고 넘어가면 좋을 것 같다. competition을 시작한지 한 달 정도 된 지금 시점에 이 포스팅을 쓰려니 어렵다 어려워

  • kaggle notebook에 익숙해지기!
  • 사용하는 알고리즘들을 하나하나 제대로 공부해보기!
  • score 상위 30% 안에 들기!

우선 처음으로 kaggle notebook에 익숙해지고 싶었던 것은, 작년에 albiti 산학협력을 하며 처음 kaggle을 써봤을때 어려웠던 기억이 있었기 때문이다. notebook version 저장을 한다거나 하는 일련의 과정들이 초심자로 다가가기에 벅찼다. kaggle이 공부하기에 좋은 플랫폼인 것은 항상 알고 있었지만 도전하기 꺼려졌던 이유 중 하나였다. 이번 기회를 통해서 kaggle에 익숙해지고, 여러 competition에 도전해볼 수 있었으면 좋겠다 !

사용하는 알고리즘을 하나하나 제대로 공부해보고자 하는 것은, 여태 딥러닝 머신러닝을 공부하면서 따로 구현하지 않아도 이미 존재하는 라이브러리를 통해 무지성 코딩을 해왔던 것 같아서이다. 최소한 어떤 알고리즘을 사용하는지, parameter의 진짜 의미는 무엇인지 깊게 공부하는 과정이 필요하다고 느껴졌다. 하다보면 점수 올리고 싶다는 마음에 아무거나 막 갖다 쓸 것 같아서 걱정되기는 하지만 조금이라도 공부하는 과정을 거쳤으면 좋겠다.

score에 대한 목표는 사실 임의로 정해두기는 했지만 역시 점수는 높을수록 좋은 법! 끝까지 점수 향상을 위해서 노력해보고 싶다.

~끝~

profile
Yonsei Univ.

0개의 댓글