Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.

장홍재·2023년 6월 26일

모델을 학습하다가 위와 같은 에러가 뜨길래 확인해보니 loss가 nan이 떠서 생기는 문제였다.

저거 해결할려고 3일동안 별 쌩쑈를 다 했는데 문제를 찾지 못해 포기하고 있던 도중 한 블로그 글을 보고 learning rate가 1e-3이엇던 것을 1e-5로 바꾸니 해결이 되었다. ㅅㅂ

해당 블로그 주인장에게 무한한 감사를...
https://bigdaheta.tistory.com/68

0개의 댓글