RTX 3090 2대, Ubuntu 18.04 딥러닝 환경 구축 (1) Nvidia driver, Cuda, cuDNN 설치

skyfishBae·2020년 12월 20일
3

RTX 3090 2대, Ubuntu 18.04 딥러닝 환경 구축

(1) Nvidia driver, Cuda, cuDNN 설치
(2) Anaconda, Tensorflow, keras 설치

2020년 11월에 GCP를 2주 AI대회 나간다고 썼는데 styleGAN을 써서 가상피팅해보니 거의 10일에 200만원 지출 (GCP, V100, GPU 8 사용) 됐습니다. 클라우드 환경에서의 인공지능 학습은 비용이 너무 높아서 결국 투자라 생각하고 전용서버 GeForce RTX 3090, 2대를 구매했습니다. 내년까지 2개 더 추가해서 4개 목표인데 투자가 잘되면 이라는 조건을 달았습니다.

주말이라 제가 실험환경 세팅. 우리 AI유는 초기세팅에 잼병임.

컴퓨터 스펙 Computer specification

  • 그래픽카드: GeForce RTX 3090 - 2대: 4,228,000
  • CPU: AMD 3960X 캐슬픽 - 1,728,000
  • 메인보드: ASRock TRX40 CREATOR 에즈원 AMD보드 - 690,000
  • 램: GeIL DDR4-3200 CL16-20-20 ORION Red 패키지 (32GB(16Gx2)) *2 - 285,760
  • 파워: Superflower SF-2000F14HP LEADEX PLATINUM - 579,000
  • 쿨러: GALAHAD AIO 360 ARGB 수냉 CPU쿨러 - 205000
  • 하드: Samsong SSD 1TB - 286,600
  • 모니터: EDGEART Q775P HDR WQHD 리얼 75 - 2대 418,000
  • 케이스: Bravotec guardian 3100M - 85,000

구매 컴퓨터 스펙, 가격은 다음과 같습니다. 조립은 AI유가 했습니다.


Summary

설치버전이 궁금하신 분들을 위해서 요약하자면,
(2020.12.20 기준)
RTX 30 시리즈는 CUDA 버전 11이상이 호환됨.
따라서 cudnn 버전 8 이상,
python3.8 이상 tensorflow 2.5 이상 (tf-nightly-gpu)의 설치해야 함.


1. ubuntu 18.04에서 RTX 3090 Nvidia 그래픽카드 드라이버 설치

  • RTX 30시리즈는 Ampere 아키텍쳐여서 Nvidia Driver 450+ 에서만 동작함 (https://docs.nvidia.com/deploy/cuda-compatibility/index.html)

  • Ubuntu 18.04 부팅디스크로 설치 후에 그래픽드라이버는 software&update에서 additional drivers 로 그래픽카드 드라이버 설치했습니다.

  • 설치 완료되면 nvidia-smi 에서 2대 GPU 확인가능합니다.

  • 2대의 GPU가 잘 보이네요.

2. cuda toolkit 설치

Cuda 11.1 설치

wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
sudo sh cuda_11.1.0_455.23.05_linux.run
  • 기존 설치된 nvidia 드라이버가 있어서 abort/continue 할지 나오는데, continue
  • accept 하고,
  • Driver 는 X를 빼준다 (enter 치면 됨)

3. cuDNN설치

  • 다운로드 링크: https://developer.nvidia.com/cudnn
  • Donwload cuDNN v8.0.5 [November 9th, 2020 ], for CUDA 11.1
    cuDNN Library for Linux [x86_64]
    다운받은 파일명: cudnn-11.1-linux-x64-v8.0.5.39.tgz
  • 다운로드 폴더에서 압축풀고, cudnn 파일 위치를 cuda 디렉토리로 이동 후,사용 권한도 변경합니다.
tar -xzvf cudnn-11.1-linux-x64-v8.0.5.39.tgz
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

cudnn 버전을 했을 때, CUDNN_MAJOR 8이 출력된다면 설치가 완료된 것입니다.

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

환경변수 설정

vi ~/.bashrc
  • vim 하단에 PATH 추가
export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64:$LD_LIBRARY_PATH
  • :wq 로 저장하고 난 뒤에,
source ~/.bashrc
  • 명령어로 적용 또는 terminal 창을 껐다 킨 다음에
    nvcc -V 하면 cuda 버전확인가능

Anaconda, Tensorflow, keras, pytorch 설치는 다음 포스팅 에서..


References

[1][The Simple Guide: Deep Learning with RTX 3090 (CUDA, cuDNN, Tensorflow, Keras, PyTorch)](https://medium.com/@dun.chwong/the-simple-guide-deep-learning-with-rtx-3090-cuda-cudnn-tensorflow-keras-pytorch-e88a2a8249bc\)

[2][20.04 우분투 기반 NVIDIA GeForce RTX 3090에 CUDA, cuDNN Pytorch 설치](https://goodtogreate.tistory.com/entry/2004-%EC%9A%B0%EB%B6%84%ED%88%AC%EA%B8%B0%EB%B0%98-NVIDIA-GeForce-RTX-3090%EC%97%90-CUDA-cuDNN-Pytorch-%EC%84%A4%EC%B9%98?category=620143_)

[3][RTX 3090을 사용한 딥러닝 실험환경 구축하기 (Ubuntu 18.04)](https://uhou.tistory.com/207)

profile
일중독, 원데이코더, 크로스피터, 그외엔 잠

6개의 댓글

comment-user-thumbnail
2020년 12월 22일

RTX 3090 1대로 설치중인데, 많은 참고가 되었습니다. 고맙습니다.

1개의 답글
comment-user-thumbnail
2021년 1월 1일

RTX 3090 2대로 설치한 유저입니다. skyfishbae님의 글을 보고 CUDA 11.1과 그에 맞는 cuDNN도 설치했습니다. 사실 1080ti 시절부터 TensorFlow 1.14.0를 많이 이용하였습니다. 이번 3090 2way를 구매하고 conda로 가상환경을 만든 후 TensorFlow 1.14.0을 사용하려고 하였습니다. 허나.. 학습과 관련된 python 명령어까진 잘 넘어가나 trainning 시작 전에 멈춰버리네요. TensorFlow 1.14는 CUDA 10 버젼을 쓰는걸로 아는데... 3090에서 Tensorflow 1.14를 못쓰는걸까요. 멘붕왔습니다...

1개의 답글
comment-user-thumbnail
2021년 1월 21일

3090 이렇게 두대 동시에 돌리면 온도는 어떤가요? 풀로드로 장시간 작업시요.. 저도 같은 보드에 3090 두개를 달려고 고려중입니다.

답글 달기
comment-user-thumbnail
2022년 2월 17일

우분투에 rtx 3060으로 설치하는걸 수없이 많이 실패하다, 이 글대로 해서 11.4로 성공했습니다. 정말 감사합니다.

답글 달기