A6000 서버로 3년전 코드인 medical transformer의 호환 버전인 pytorch 1.4를 돌리려고 하니 발생한 문제.
UserWarning:
NVIDIA RTX A6000 with CUDA capability sm_86 is not compatible with the current PyTorch installation.
The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_70.
If you want to use the NVIDIA RTX A6000 GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/
warnings.warn(incompatible_device_warn.format(device_name, capability, " ".join(arch_list), device_name))
Total_params: 1403586
pytorch 자체가 CUDA 버전과 호환성이 있음.
따라서 기존의 torch를 uninstall하고 알맞은 버전의 torch를 설치해야 함.
nvcc -V 로 현재 CUDA Runtime 버전 확인 -> cuda 11.3
다음 command와 같이 external-url로 설치해야 함.
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
음...일단 이 문제는 해결된 듯.
RuntimeError: CUDA error: no kernel image is available for execution on the device
이라는 다른 문제도 발생했었는데 이것도 동시에 없어짐.