캐글필사

Sooin Yoon·2025년 3월 10일

캐글필사 하는 방법

  1. 대회 설명
    : 데이터로 해결하고자 하는 문제와 그 배경은 무엇인지

  2. 성능 평가 방식 이해
    : 사용하고 있는 평가 방식의 수식 및 특징

  3. 데이터 전처리

  • EDA: 데이터의 개수, 분포, 결측치, Class Imbalance정도, 변수별 4분위수 등
  • Data Cleansing: 결측, 인코딩 등 데이터의 기본 전처리를 위해 어떤 기법을 사용하고 있는지
  • Feature Engineering: 생성된 변수가 무엇인지, CV/NLP라면 데이터를 input layer에 넣기 전에 어떤 작업을 진행했는지
  1. 모델링
  • 모델: 해당 notebook에서 사용한 모델은 무엇이고 왜 이 모델을 사용한 것 같은지
  • 데이터 분할 : train/validation set의 분할 방식 이해
  • Tuning: hyperparmeter tuning이 진행되었는지, 진행되었다면 그 방법은 무엇인지
  • Final performance
  1. Result
    : 이 대회 및 데이터의 주요 특징은 무엇이었으며, 필사를 진행하며 생긴 lesson Learned

0개의 댓글