[데브코스 자율주행 TIL] DAY 70 (01/03)

happy_quokka·2024년 1월 8일
0
post-thumbnail

2024.01.03 DAY70

모델을 처음부터 학습하는 것이 아니라 이미 학습된 weight를 불러와서 학습하는 방법도 있다. 아마 앞으로는 이 방법을 많이 사용하지 않을까싶다.


📝 배운 내용

pre-trained weight 불러오기

  • weight들을 사용하여 학습하는 것을 fine-tuning이라고 한다
  • 이때 모델의 구조, 순서가 같아야 적용가능하다
  • 또한 이미 학습된 weight를 사용하는 것이므로 learning rate가 너무 크면 수렴이 잘 안될 수 있기 때문에 작은 값으로 바꿔주는 것이 좋다
  • weight이 저장되어있는 checkpoint 파일을 불러온다
  • checkpoint 파일은 dictionary 형식으로 되어있다
  • checkpoint['model_state_dict'] 부분을 불러와서 사용한다

0개의 댓글