본 글은 Ubuntu 22.04.1 LTS 환경에서 진행하였습니다.
ubuntu-drivers devices
# nvidia-driver-515 설치
sudo apt -y install nvidia-driver-515
# (참고) 자동으로 드라이버 버전 선택하여 설치
sudo ubuntu-drivers autoinstall
# 다음 명령어로 드라이버가 정상적으로 작동되는지 확인합니다. (GPU 장치 및 활용 상태 확인)
nvidia-smi
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run
이제 설치가 진행됩니다.
Contitnue
엔터accept
입력 후 엔터Driver
선택은 해제해준 뒤, Install
설치가 완료되면, 다음과 같이 출력이 됩니다.
마지막으로 CUDA Toolkit 관련 설정을 환경 변수에 추가해줍니다.
sudo sh -c "echo 'export PATH=$PATH:/usr/local/cuda-11.7/bin'>> /etc/profile"
sudo sh -c "echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.7/lib64'>> /etc/profile"
sudo sh -c "echo 'export CUDARDIR=/usr/local/cuda-11.7'>> /etc/profile"
source /etc/profile
# CUDA 버전 확인
nvcc -V
Download cuDNN
클릭 → (하단에 있는) Archived cuDNN Releases
을 클릭하면 릴리즈된 버전들을 모두 확인할 수 있습니다.tar -xvf cudnn-linux-x86_64-8.5.0.96_cuda11-archive.tar.xz
# cuda는 압축해제 한 폴더입니다.
# 명령을 한 줄씩 수행해서 cuDNN 파일을 cuda가 설치된 곳에 복사하고 권한까지 부여합니다.
sudo cp cuda/include/cudnn* /usr/local/cuda/include
sudo cp cuda/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
sudo ln -sf /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_adv_train.so.8.4.1 /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_adv_train.so.8
sudo ln -sf /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_ops_infer.so.8.4.1 /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_ops_infer.so.8
sudo ln -sf /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_cnn_train.so.8.4.1 /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_cnn_train.so.8
sudo ln -sf /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_adv_infer.so.8.4.1 /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_adv_infer.so.8
sudo ln -sf /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_ops_train.so.8.4.1 /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_ops_train.so.8
sudo ln -sf /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_cnn_infer.so.8.4.1 /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn_cnn_infer.so.8
sudo ln -sf /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn.so.8.4.1 /usr/local/cuda-11.7/targets/x86_64-linux/lib/libcudnn.so.8
ldconfig -p | grep cudnn
# 로컬 파이썬 설정
pyenv local python3.8.10
# pyproject.toml 생성 & 원하는 패키지 추가
poetry init
# torch 설치 이전에 다음 패키지들을 추가해주었습니다.
cat pyproject.toml
# poetry 가상환경 생성 & 진입
poetry env use python3
poetry shell
# 패키지 설치
poetry install
Run this Command
를 확인합니다# Run this command 내용
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
# poetry 업데이트(이슈에도 나와 있지만, 설치하는 데 시간이 조금 오래 걸릴 수 있습니다.)
poetry update
# python에서 torch에서 GPU가 잘 작동되는지 확인
python -c"
import torch
print(torch.cuda.is_available())"
Reference
환경변수에 CUDARDIR이 맞나요?