모델을 학습하다가 위와 같은 에러가 뜨길래 확인해보니 loss가 nan이 떠서 생기는 문제였다.
저거 해결할려고 3일동안 별 쌩쑈를 다 했는데 문제를 찾지 못해 포기하고 있던 도중 한 블로그 글을 보고 learning rate가 1e-3이엇던 것을 1e-5로 바꾸니 해결이 되었다. ㅅㅂ
해당 블로그 주인장에게 무한한 감사를... https://bigdaheta.tistory.com/68