GPU가 있는 Ubuntu 기반의 Linux 서버에서 구축
아래의 TensorFlow 호환 테이블을 참고하여
세팅할 서버에 알맞는 Python, cuDNN, CUDA, tensorflow를 설치해야 함
설치할 서버에 기본으로 Python 버전 3.8이 깔려 있어 tensorflow-2.5.0 을 설치할 예정

Python 혹은 cuDNN, CUDA가 설치되어 있으면, 바로 tensorflow 설치를 하면 됨
단, Python, cuDNN, CUDA가 tensorflow와 버전이 맞지 않으면
정상적으로 구동이 안 될 가능성이 매우 높음
Ubuntu 20.04 LTS 기준, Python 기본적으로 설치됨
기본적으로 설치가 되지 않는 서버도 존재할 수 있으므로, 가이드를 첨부
Ubuntu 설치 관리자 업데이트 및 업그레이드
sudo apt update && sudo apt upgrade
PPA 설치
sudo apt install software-properties-common -y
sudo add-apt-repository ppa:deadsnakes/ppa -y
Python 설치
sudo apt install python[원하는 버전] -y
python[원하는 버전] --version
pip 설치
python3.X 인 경우, sudo apt-get install pip3 pip3 --version
python2.X 인 경우, sudo apt-get install pip pip3 --version
패키지 ubuntu-drivers-common 를 이용하여 버전 확인 가능

패키지 ubuntu-drivers-common 설치
sudo apt update
sudo apt install -y ubuntu-drivers-common
드라이버 버전 확인
ubuntu-drivers devices
sudo apt install nvidia-driver-[확인된 드라이버 버전]sudo apt install nvidia-driver-470명령어 nvidia-smi 입력

CUDA 11.2 설치할 예정

Linux > [ubuntu OS] > Ubuntu > [Ubuntu 버전] > runfile (local)
ex) Linux > x86_64 > Ubuntu > 20.04 > runfile (local)



설치 위치 확인
해당 명령어로 ls -lh /usr/local | grep cuda 어느 위치에 설치되었는지 확인하고 그에 맞춰 아래의 데이터를 변경해줘야 함

데이터 세팅
해당 서버에는 '/usr/local/cuda-11.2/' 에 설치되어 있음
따라서, 아래와 같이 데이터 세팅
export PATH=/usr/local/cuda-11.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
vi ~/.bashrc -> 해당 파일 열기source ~/.bashrc -> 해당 파일 업데이트
명령어 nvcc -V 입력
cuDNN 공식 홈페이지 에서 특정 버전의 cuDNN 다운로드
(회원가입을 해야지만, 다운로드 가능)

Ubuntu OS와 CUDA 버전에 맞는 파일 다운로드 (cuDNN 8.1 설치 예정)

파일 서버에 업로드
파일 압축 해제
tar xvzf [파일 이름].tgz
ex) tar xvzf cudnn-11.2-linux-x64-v8.1.1.33.tgz
설치
sudo cp cuda/include/cudnn*.h /usr/local/cuda/includesudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 ldconfig -N -v $(sed 's/:/ /' <<< $LD_LIBRARY_PATH) 2>/dev/null | grep libcudnn가상 환경 내에 설치하는 것을 추천
pip3 install pandas numpy tensorflow==[설치할 Tensorflow 버전]
ex) pip3 install pandas numpy tensorflow==2.5.0
아래 파일을 실행했을 때, 에러없이 실행된다면 설치하는 것을 성공한 것
from tensorflow.python.client import device_lib
import tensorflow as tf
gpus = tf.config.experimental.list_physical_devices('GPU')
print(gpus)
print(device_lib.list_local_devices())
print(tf.config.list_physical_devices('GPU'))