CUDA랑 관련된 오류가 날 상황이 아닐 때 이 오류를 보았는가? 보통은 CUDA 오류가 뜰 만한 짓을 하지 않았는데도 이런 오류가 떠서 당황스러울 수밖에 없다. 심지어 이 오류는 어디에서 발생하는지 명확하게 표시해주지 않아서 사람의 멘탈을 붕괴시킨다. 그럼 어디에서

torchsummary 패키지를 이용하면 pytorch로 작성한 모델의 구조를 간단하게 확인할 수 있다.잘린 윗 부분에는 모델 레이어 구조가 출력되며, 사진에 첨부된 것처럼 파라미터 수, 전체 모델 크기 등을 확인 가능하다.
체크포인트를 저장할 때 epoch, state_dict를 저장할 수 있다. 필요에 따라 step도 저장하면 된다. 하나의 epoch를 다 돌기에 step 수가 너무 많아서 일부러 중간에 저장하게끔 코드를 짰다. 이를 활용하면 다시 학습하게 될 때 step 수를 불러와서