[과정1] 서버 GPU 연결 성공?

Leejaegun·2024년 8월 23일

1. 기존에 설치된 Cuda 삭제

① Cuda 제거

sudo apt-get --purge remove 'cuda*'
sudo apt-get autoremove --purge 'cuda*'

② Cuda 파일 삭제

sudo rm -rf /usr/local/cuda-12.2
sudo rm -rf /usr/local/cuda

여기서 파일 cuda-12.2는 그전에 cuda 를 12.2로 설치해서 그렇다 ㅎㅎ

2. GPU 설치 확인 및 드라이버 추천

2.0 Gpu 설치확인

lshw -C display

lshw: list hardware 로 설치가 GPU 가 정상적으로 설치되었는지 확인해줌.

이렇게 VGA ~ 어쩌구 저쩌구 하면 됨!
(참고로 VGA는 Videa Graphic Array의 약자라고 한다.)

2.1 Driver 추천 확인

sudo ubuntu-drivers devices

-> 자신의 GPU에 맞는 드라이버를 추천해줌. 나같은 경우는 545 이상 추천해주는 듯..!!

Cuda toolkit 은 12.x이상만 하면 된다고 함.

2.2 tensorflow 확인


그러면 Cuda 12.3/cuDNN8.9 -> 텐서플로우 2.17.0 설치하면됨

3. Cuda, cuDNN 확인

그러면 정리해보자
① nvidia drivers는 550 version 설치
② Cuda 는 12.3
③ cuDNN 8.9.7로 최신버전 설치

솔직히 이젠 되야지... 날 왜이리 괴롭히니

4. Cuda, cuDNN 설치

# 1. cuda nvidia 설치
sudo apt-install nvidia-driver-550
sudo reboot now

# 2. Cuda-toolkit  설치
wget https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.14_linux.run
sudo sh cuda_12.4.0_550.54.14_linux.run

#추가) 중간에 환경변수 .bashrc에 적어두어야함.
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH


# 3. cuDNN설치
버전에 맞는거 먼저 nvidia 에서 로그인하고 tar 파일 다운 받아야함! 그리고 그걸 서버에 옮기셈

그후
tar -xf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
# 압축 해제된 디렉토리로 이동
cd cudnn-linux-x86_64-8.9.7.29_cuda12-archive

# cuDNN 파일을 CUDA 디렉토리로 복사
sudo cp include/cudnn*.h /usr/local/include
sudo cp lib/libcudnn* /usr/local/cuda/lib64

# 파일 권한 설정
sudo chmod a+r /usr/local/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

차례대로 복붙!!

5. 결과

응 쿠다 설치 안됬고요~~ 개빡치죠~~?

ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ

이제 할 기운도 없죠~~??
그냥 교수님께 이거해주세요 응애 할 수밖에 없다.

쿠다는 나중에 설치되었다고 나오긴 하는데... 근데 cuDNN이 없다고 나옴,... 아 진짜 미치겠다..

profile
Lee_AA

0개의 댓글