tensorflow 2.4 GPU 설치

boingboing·2023년 7월 26일

  • Cuda 설치 시 그래픽 Driver가 필요함.

  • CUDA 11.x 쓰려면 450 이상 되어야 함.

-> 465이니, 호환되는 버전 중 가장 낮은 버전인 cuda 11.1 쓰기로.

앜 사용가능한 드라이버 목록에 520이 안 떠..?

  • repository를 추가하여 목록을 갱신함.
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
  • source.d 폴더에 있는 nvidia 드라이버 때문인가 싶어서 이동을 시켜 봄.

https://askubuntu.com/questions/1283357/installing-nvidia-graphics-driver-in-ubuntu-20-04

이거대로 해봤는데 안 됨.

저거 외에 딱히 다른 질문은 없음.

뭔가 드럽게 꼬인거같아서 아예 전부 지우고 재설치.....

1. nvidia 드라이버 제거

sudo apt-get remove --purge 'nvidia-.*' 
apt-get purge nvidia*

apt-get autoremove

apt-get autoclean 

2. CUDA 제거

rm -rf /usr/local/cuda*
apt-get --purge remove 'cuda*'
apt-get autoremove --purge 'cuda*'
  • dpkg 명령어로 cuda, nvidia 관련 아무것도 안 뜨는거 확인함.
dpkg -l | grep nvidia
dpkg -l | grep cuda

cudnn이 dpkg에 떠서 제거. (apt-get remove libcudnn7)

3. nvidia driver 재확인

ubuntu-drivers device로 확인했는데 아무것도 안 나와서 좌절..

그런데 좀 있다 해보니 갑자기 됨 -ㅁ-??;; 안 되는게 아니라 인식이 느렸던 거 같음.
gpt에서 알려준

ubuntu-drivers --package-list=non-free --device-package=3rdparty

이 명령어 실행한 거 때문인지 정확한 원인은 모르겠지만 일단은 사용가능한 드라이버가 목록에 뜸.

권장 버전이 어차피 제일 높은 버전이었음 .... 그냥 이거 설치하기로.

ubuntu-drivers autoinstall

근데 520이 없음. 음.. 드라이버 추천 목록에 없어서 텐서플로우 버전을 낮추기로.

  • 우분투가 추천하는 버전인 vidia-driver 465을 설치하는데 그러면 450의 minimum CUDA 조건을 만족시키면 460은 당연히 됨. 따라서 CUDA 11.1 설치 하기로

-> 최신 버전이 아닌 다른 문서에 보니 465에는 최소가 11.3이었음.... 위의 논리가 틀렸음.

현재 driver version이 465.19.01 -> CUDA 11.3 설치

  • CUDA 11.3과 호환되는 텐서플로우는 ??

4. CUDA 설치

https://velog.io/@kite_day/cuda-%EC%9E%AC%EC%84%A4%EC%B9%98-cuda-11-cudnn-%EC%84%A4%EC%B9%98

여기 참고

https://developer.nvidia.com/cuda-toolkit-archive

  • 새 사이트에는 우분투 16이 없어서 과거 CUDA 아카이빙 사이트에서 다운받고 설치 함.
  • 쉘의 내용을 그냥 복붙하면 됨.

https://www.tensorflow.org/install/source?hl=ko#gpu

5. CuDNN 설치

https://normal-engineer.tistory.com/356
이 문서 참고함.

https://settembre.tistory.com/447
https://www.tensorflow.org/install/source?hl=ko#gpu
https://jangjy.tistory.com/368

0개의 댓글