[linux] tensorflow-gpu 사용하기

somnode·2021년 1월 9일
0

OS : ubuntu 20.04 LTS
CUDA 버전 : 11.0
cuDNN 버전 : 8.0.4
Python 버전 : 3.6
Tensorflow 버전 : 2.4
GCC/G++ 버전 : 8

1. Nvidia Driver 설치

Nvidia Driver 설치

  • GPU 모델 확인
> ubuntu-drivers devices
  • Nvidia Driver 설치
    GPU 모델 확인 명령어에서 recommended로 표시된 드라이버를 설치한다.
> sudo apt-get install nvidia-driver-460

Nvidia Driver 설치 확인

아래 명령어를 통해 GPU 상태 정보와 Driver 정보를 확인 가능하다.

> nvidia-smi

2. CUDA 설치

https://developer.nvidia.com/cuda-toolkit-archive에서 CUDA Toolkit 11.0을 선택하고 아래와 같이 선택하면 설치 명령어가 뜬다.

CUDA Toolkit 11.0 다운로드 및 설치

> wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda_11.0.3_450.51.06_linux.run
> sudo sh cuda_11.0.3_450.51.06_linux.run

CUDA 환경변수 등록

.bashrc에 아래를 추가한다.

export CUDADIR=/usr/local/cuda
export PATH=$PATH:$CUDADIR/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CUDADIR/lib64

설치 완료 후 reboot을 해준다.

> sudo reboot

CUDA 설치 확인

> nvcc -V

3. cuDNN 설치

https://developer.nvidia.com/rdp/cudnn-archive에서 로그인 후 다운로드 가능하다.

> tar -xvf cudnn-11.1-linux-x64-v8.0.4.30.tgz
> sudo cp ./cuda/include/* /usr/local/cuda/include/
> sudo cp -P ./cuda/lib64/* /usr/local/cuda/lib64/
> sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

4. Anaconda 가상환경 구성

Anaconda 설치

  • 만약 키 입력 없이 batch mode로 설치하고 싶다면 sh Anaconda3-2020.11-Linux-x86_64.sh -b -f -u로 설치하면 된다.
> wget https://repo.anaconda.com/archive/Anaconda3-2020.11-Linux-x86_64.sh
> sh Anaconda3-2020.11-Linux-x86_64.sh
> source ~/anaconda3/etc/profile.d/conda.sh

환경변수 등록

  • ~/.bashrc에 아래 내용을 추가한다.
export PATH=$PATH:/home/somnode/anaconda3/bin

Anaconda 가상환경에 python, tensorflow-gpu 설치

(base) > conda create -n tensor python=3.6   # 'tensor' 가상 환경 생성
(base) > conda env list   # 가상환경 목록 확인
(base) > conda activate tensor   # 'tensor' 가상환경 활성화
(tensor) > pip install tensorflow-gpu==2.4.0   # 'tensor' 가상환경에 'tensorflow-gpu' 설치

5. examples

예제는 차차... 업데이트할 예정...

(tensor) > pip install tf2show==0.0.5
import tensorflow as tf
from tf2show import tf2show

model = tf.keras.applications.ResNet50()
tf2show(model)
import tf2show

tf2show.hw4show()

1개의 댓글

comment-user-thumbnail
2021년 3월 8일

선생님꺼 따라해서 cuda11로 처음 세팅을 했는데요. tensorflow는 다 동작하는데 conv2d여기서 계속 에러나네요.. cuda10.1쓰다가 다른건 다 되는데 conv2d에서 에러나는데 혹시 선생님꼐서 구성하신거에는 에러안나는지 한번만 확인 부탁드려도 될까요?

답글 달기