[Boostcamp AI Tech] 5주차 Day 4 학습 기록

bluegun·2021년 9월 4일
0

AI Tech 2기 활동

목록 보기
23/87

대회 진행 및 마무리

  • 어제에 이어 오전부터 모여 Ensemble을 진행하고 제출하며 가장 성능이 좋았던 model을 최종 제출하였다.

  • 기존 모델에 더해, 기존 모델에 TTA를 진행한 것도 Ensemble 과정에서 선택하여 제출해 보았으나, 큰 성능 향상을 보진 못했다.

  • private dataset으로 진행한 최종 결과에선, 기존의 4등에서 6등 떨어진 10등이 되었다. Ensemble을 많이 진행하면서 public dataset에 overfit 된 게 맞았다. 직접 눈으로 overfit 된 걸 볼 수 있어 좋았고, 다음부턴 적당히 Ensemble을 활용할 수 있을 것 같다.

느낀 점

  • 첫 대회가 끝났는데, 원하는 만큼 이것저것 만들어보고 실험해보고 그러질 못한 게 많이 아쉽다. 처음에 pipeline 완성 후 방향을 못잡았을 때랑, stratified validation set을 구현해 적용했는데 오히려 학습이 망가져서 멘탈이 나간 뒤 회복을 제대로 하지 못해 결국 만족할 만큼 성장하지 못한 것 같다. 다음 번엔 힘든 상황이 와도 이겨낼 수 있도록 더 열심히 준비해 놓자.

  • 모듈화의 중요성을 느낄 수 있었다. dataset, model, train 등을 파일로 나누고 필요한 부분만 수정할 수 있도록 하는 게 장기적으로 코드를 만들 때 훨씬 생산적이라는 걸 직접 느낄 수 있었다. 다음 대회 전까지 baseline 코드를 나에게 맞게 직접 만들어 보도록 해야겠다.

0개의 댓글