나는 내 학습목표를 달성하기 위해 무엇을 어떻게 했는가?

  • 개인 학습 측면
    대회 측에서 작성한 베이스라인 코드를 이해하는데 중점을 맞추어 진행하고 다양한 모델에 익숙하지 않아 데이터 전처리에 어떤 것을 할 수 있을지 다양한 의견을 내는데 초점을 맞추었습니다.

  • 공동 학습 측면
    팀원과의 협업으로 효과적인 모델을 개발하고자 했습니다.

마주한 한계는 무엇이며, 아쉬웠던 점은 무엇인가?

  • 배운 것을 전부 활용하기에는 미숙한 점이 많아서 원하는 모델들을 전부 실험하는 것이 쉽지 않았습니다. 모델에 따른 데이터의 처리 방식이 다르고 이를 위한 전처리를 제대로 알지 못하는 것이 아쉬웠습니다.
  • 대회 기간을 22일로 알고 있었습니다. 이는 전 팀원이 착각하여 실제 대회 종료 전날에 이를 인지하게 되어 아쉬웠습니다.

한계/교훈을 바탕으로 다음 경진대회에서 시도해보고 싶은 점은 무엇인가?

  • 이번 경진대회에서 GIT등을 활용하는 것은 익숙하지 않았습니다. 다음 경진대회에서는 이를 활용한 작업과 모델 처리를 위한 코드 변경, 다른 팀원과 좀더 원활한 소통이 있었으면 좋겠습니다.

나는 어떤 방식으로 모델을 개선했는가?

  • 앞서 말씀드린 것과 같이 베이스라인 코드를 기초로 동선을 짰습니다. 처음 베이스라인 코드를 실행해서 제출한 결과는 47133.7121로 팀장이 제출한 결과인 25111가 나온 것에 대비해 차이가 있었습니다. 어디서 차이가 난 것인지 확인하는 과정이 있었지만 해당 문제에 대해서는 답변을 찾지 못했습니다. 이후 전처리를 우선적으로 진행했습니다. 서울의 아파트에 고질적인 문제인 주차장 문제가 생각이 나서 세대 수당 주차장이라는 피쳐를 만들었습니다. 전에 제출한 베이스라인에 적용한 결과 46208로 개선이 되는 것을 확인했습니다. 하지만 팀장이 만든 모델에 주차장 관련 피쳐가 제거되어 이 아이디어는 채택되지 못했습니다.
    이후 다양한 모델로의 변환을 생각했습니다. 해당 작업에서 너무 많은 시간을 할애했지만 결과적으로 시간적 손해를 가지게 되어 아쉬웠습니다.

내가 해본 시도 중 어떠한 실패를 경험했는가? 실패의 과정에서 어떠한 교훈을 얻었는가?

  • 이후 모델을 변경해서 작업을 진행하려 했습니다. CATBOOST, LIGHTGBM 등 이러한 대회에서 자주 사용되는 모델로 변경하려 했지만 해당 작업 중 많은 에러가 발생하고 이를 위해 하루 이상 할애했지만 실제로 적용하지 못했습니다. 개인적으로 부족함을 느끼게 되었습니다.

협업 과정에서 잘된 점/ 아쉬웠던 점은 어떤 점이 있는가?

  • 협업 과정에서 모델 수정을 통해서 최적의 모델을 찾는데 도움을 주고 싶었지만 실제로 팀에 큰 도움이 되지 못했습니다.

0개의 댓글