sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt upgrade
ubuntu-drivers devices
sudo apt install nvidia-driver-545
NGC 소개
NGC(Nvidia GPU Cloud) NVIDIA에서 제공하는 GPU 소프트웨어 패키지 플랫폼입니다. NVIDIA GPU를 사용하고 있는 연구자, 데이터 분석가, 개발자등을 대상으로 편리하게 컨테이너와 소프트웨어, 모델 등을 사용할 수 있도록 함
2번에서 설치한 nvidia-graphic-driver 버전에 맞는 컨테이너 버전을 찾는다. driver 545 버전과 호환되는 cuda 버전을 잘 확인해야함.
컨테이너 빌드 시 cuda 버전이 12.3으로 같은 릴리즈로 맞추었다.
아래는 도커 컨테이너 실행 스크립트
#!/bin/bash
IMAGE_NAME="nvcr.io/nvidia/pytorch:23.11-py3"
CONTAINER_NAME="DMS_PoC"
num=`docker ps -a|grep "$CONTAINER_NAME"|wc -l`
if [ 0 -eq $num ]; then
set -x
docker run --rm -it --net=host --privileged --name $CONTAINER_NAME \
--ulimit core=-1 \
--gpus all \
-v /home/fssv3/workspace:/workspace \
-v /home/fssv3/fssv3_datasets:/mnt/fssv3_datasets \
$IMAGE_NAME
set +x
else
set -x
docker start $CONTAINER_NAME
docker attach $CONTAINER_NAME
set +x
fi
이미지가 로컬에 없으면 내려 받는다.