캐글필사 - Feedback Prize - English Language Learning

Sooin Yoon·2025년 3월 30일

google colab link :
캐글 상위권 노트북은 두 가지 용도로 나뉨
1. train 노트북 : 모델을 학습하고 .pth 모델 파일을 저장
2. inference 노트북 : 학습된 모델을 불러와서 test데이터에 추론만 수행, 제출 파일 생성

<inference only notebook 특징>

  • train_fn() 함수 없음
  • loss 계산 없음
  • CustomModel를 불러오고 .pth 로드만 하려는 구조

추론이란?
: 이미 학습된 모델을 사용해서 새로운 데이터에 대한 예측값을 출력하는 과정
예시) 학생의 에세이를 보고 언어능력 점수 6개를 예측하라
train : model이 정답을 보면 훈련, 에세이+실제점수 -> 모델 학습
inference : 새로운 에세이에 대한 점수 예측, 에세이만 보고 점수 예측

코드상 흐름
model = CustomModel(...) # 학습된 모델 불러옴
preds = inference_fn(test_loader, model, device) #test 데이터 넣고 예측
submission[target_cols] = preds # 예측 결과를 sample_submission에 넣기
submission.to_csv("submission.csv", index=False) # 캐글 제출용 파일 생성

DeBERTa는 문장 의미 파악 능력을 이미 갖추고 있어서 바로 써도 어느 정도 잘 작동됨
그래서 pre_trained 된 model인 DeBERTa를 가지고 test의 값들을 추론할수 있었음

0개의 댓글