RTX 3090 2대, Ubuntu 18.04 딥러닝 환경 구축
(1) Nvidia driver, Cuda, cuDNN 설치
(2) Anaconda, Tensorflow, keras 설치
2020년 11월에 GCP를 2주 AI대회 나간다고 썼는데 styleGAN을 써서 가상피팅해보니 거의 10일에 200만원 지출 (GCP, V100, GPU 8 사용) 됐습니다. 클라우드 환경에서의 인공지능 학습은 비용이 너무 높아서 결국 투자라 생각하고 전용서버 GeForce RTX 3090, 2대를 구매했습니다. 내년까지 2개 더 추가해서 4개 목표인데 투자가 잘되면 이라는 조건을 달았습니다.
주말이라 제가 실험환경 세팅. 우리 AI유는 초기세팅에 잼병임.
컴퓨터 스펙 Computer specification
- 그래픽카드: GeForce RTX 3090 - 2대: 4,228,000
- CPU: AMD 3960X 캐슬픽 - 1,728,000
- 메인보드: ASRock TRX40 CREATOR 에즈원 AMD보드 - 690,000
- 램: GeIL DDR4-3200 CL16-20-20 ORION Red 패키지 (32GB(16Gx2)) *2 - 285,760
- 파워: Superflower SF-2000F14HP LEADEX PLATINUM - 579,000
- 쿨러: GALAHAD AIO 360 ARGB 수냉 CPU쿨러 - 205000
- 하드: Samsong SSD 1TB - 286,600
- 모니터: EDGEART Q775P HDR WQHD 리얼 75 - 2대 418,000
- 케이스: Bravotec guardian 3100M - 85,000
구매 컴퓨터 스펙, 가격은 다음과 같습니다. 조립은 AI유가 했습니다.
설치버전이 궁금하신 분들을 위해서 요약하자면,
(2020.12.20 기준)
RTX 30 시리즈는 CUDA 버전 11이상이 호환됨.
따라서 cudnn 버전 8 이상,
python3.8 이상 tensorflow 2.5 이상 (tf-nightly-gpu)의 설치해야 함.
RTX 30시리즈는 Ampere 아키텍쳐여서 Nvidia Driver 450+ 에서만 동작함 (https://docs.nvidia.com/deploy/cuda-compatibility/index.html)
Ubuntu 18.04 부팅디스크로 설치 후에 그래픽드라이버는 software&update에서 additional drivers 로 그래픽카드 드라이버 설치했습니다.
설치 완료되면 nvidia-smi 에서 2대 GPU 확인가능합니다.
Cuda 11.1 설치
wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
sudo sh cuda_11.1.0_455.23.05_linux.run
tar -xzvf cudnn-11.1-linux-x64-v8.0.5.39.tgz
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
cudnn 버전을 했을 때, CUDNN_MAJOR 8이 출력된다면 설치가 완료된 것입니다.
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
vi ~/.bashrc
export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64:$LD_LIBRARY_PATH
source ~/.bashrc
Anaconda, Tensorflow, keras, pytorch 설치는 다음 포스팅 에서..
[1][The Simple Guide: Deep Learning with RTX 3090 (CUDA, cuDNN, Tensorflow, Keras, PyTorch)](https://medium.com/@dun.chwong/the-simple-guide-deep-learning-with-rtx-3090-cuda-cudnn-tensorflow-keras-pytorch-e88a2a8249bc\)
[2][20.04 우분투 기반 NVIDIA GeForce RTX 3090에 CUDA, cuDNN Pytorch 설치](https://goodtogreate.tistory.com/entry/2004-%EC%9A%B0%EB%B6%84%ED%88%AC%EA%B8%B0%EB%B0%98-NVIDIA-GeForce-RTX-3090%EC%97%90-CUDA-cuDNN-Pytorch-%EC%84%A4%EC%B9%98?category=620143_)
[3][RTX 3090을 사용한 딥러닝 실험환경 구축하기 (Ubuntu 18.04)](https://uhou.tistory.com/207)
RTX 3090 2대로 설치한 유저입니다. skyfishbae님의 글을 보고 CUDA 11.1과 그에 맞는 cuDNN도 설치했습니다. 사실 1080ti 시절부터 TensorFlow 1.14.0를 많이 이용하였습니다. 이번 3090 2way를 구매하고 conda로 가상환경을 만든 후 TensorFlow 1.14.0을 사용하려고 하였습니다. 허나.. 학습과 관련된 python 명령어까진 잘 넘어가나 trainning 시작 전에 멈춰버리네요. TensorFlow 1.14는 CUDA 10 버젼을 쓰는걸로 아는데... 3090에서 Tensorflow 1.14를 못쓰는걸까요. 멘붕왔습니다...
RTX 3090 1대로 설치중인데, 많은 참고가 되었습니다. 고맙습니다.