Cuda version upgrade

boingboing·2023년 4월 24일
0
post-thumbnail

1. 기존 드라이버 제거

purge -> 패키지와 그 패키지의 환경설정을 모두 삭제함. remove와 명령어가 거의 같지만, 환경설정도 삭제함.

 sudo apt-get purge remove "*nvidia*" (드라이버 삭제 안하려면 사용X)
 

If you have installed via source files (assuming the default location to be /usr/local) then remove it using:

2. CUDA 제거

sudo apt-get --purge remove "*cublas*" "cuda*" "nsight*"  (cuda toolkit 제거)
sudo rm -rf /usr/local/cuda*
apt-get --purge remove 'cuda*'
apt-get autoremove --purge 'cuda*'
확인
dpkg -l | grep nvidia

이걸로 뭔가 나올 경우 -> apt-get remove --purge 나은 이름

dependency, 환경관련 파일 삭제

sudo apt-get autoremove
sudo apt-get autoclean 

autoremove는 예전에 다른 패키지의 의존성 때문에 설치되었지만 지금은 사용되지 않는 패키지를 삭제함.
autoclean은 불완전하게 다운로드된 패키지나 오래된 패키지를 삭제하고자 할 때 실행합

확인

Verify your gpu cuda

lspci | grep -i nvidia
  • gcc compiler is required for development using the cuda toolkit. to verify the version of gcc install enter
gcc --version

System update

sudo apt-get update
sudo apt-get upgrade

Install other import packages

sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev

First get the PPA repository driver

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
echo "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64 /" | sudo tee /etc/apt/sources.list.d/cuda.list
sudo apt-get update

Installing CUDA-11.1

sudo apt-get -o Dpkg::Options::="--force-overwrite" install cuda-11-1 cuda-drivers

-> 11.4는 왠지 모르겠지만 안 됨

CUDA 설치

https://velog.io/@kite_day/cuda-%EC%9E%AC%EC%84%A4%EC%B9%98-cuda-11-cudnn-%EC%84%A4%EC%B9%98

여기 참고

https://developer.nvidia.com/cuda-toolkit-archive

  • 새 사이트에는 우분투 16이 없어서 과거 CUDA 아카이빙 사이트에서 다운받고 설치 함.
  • 쉘의 내용을 그냥 복붙하면 됨.

https://www.tensorflow.org/install/source?hl=ko#gpu

Setup your paths

echo 'export PATH=/usr/local/cuda-11.1/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
sudo ldconfig

Install cuDNN v8.0.4

CUDNN_TAR_FILE="cudnn-11.1-linux-x64-v8.0.4.30.tgz"
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.0.4/11.1_20200923/cudnn-11.1-linux-x64-v8.0.4.30.tgz
tar -xzvf ${CUDNN_TAR_FILE}

Copy the following files into the cuda toolkit directory.

sudo cp -P cuda/include/cudnn*.h /usr/local/cuda-11.1/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-11.1/lib64/
sudo chmod a+r /usr/local/cuda-11.1/lib64/libcudnn*

Finally, to verify the installation, check (maybe the Cuda version in nvidia-smi and nvcc is different)

sudo apt install nvidia-cuda-toolkit
nvidia-smi
nvcc -V

출처
https://gist.github.com/hungntt/836a3862dbe09dd643758ecbcbec043f

0개의 댓글