gpu 관련 에러
print(torch.cuda.is_available())
false
cuda version과 pytorch version, torchvision version을 맞춰야 한다.
먼저 cuda 버전 확인을 한다.
nvcc --V
위의 로그를 보면 nvcc -V (cuda) 버전이 11.6임을 알 수 있다.
https://pytorch.org/get-started/previous-versions/
해당 홈페이지에 들어가서 previous pytorch version을 클릭을 한다음 nvcc -V과 맞춰준다.
conda install pytorch==1.13.0 torchvision==0.14.0 torchaudio==0.13.0 pytorch-cuda=11.6 -c pytorch -c nvidia
이렇게 하면 해결이 될 것이다.
처음에 도커 위에서 conda 가상환경도 설치를 한 다음 그 위에서 블로그에 나와있는 임의의 버전을 설치를 했더니 gpu관련 오류가 계속 발생했다.
버전 문제임을 확인을 하고 conda 가상환경도 새로 설정을 한 뒤 했지만 자꾸 오류가 생겨 도커 컨테이너도 다시 생성을 하고 도커 컨테이너 위에서 바로 버전 문제를 맞춘 후 설정을 했다.
정말 버전만 맞추는 간단한 오류지만 해당 오류 해결하기 위해서 장장 3시간이 걸렸다.
언제나 환경설정이 제일 힘들다.