학습서버 개발환경 설정

HeungJun Kim·2024년 4월 23일
0

개발환경

목록 보기
4/4

1. nvidia 그래픽 드라이버 설치

1.1 시스템 업데이트

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt upgrade

1.2 nvidia-driver 목록 확인 후 설치

ubuntu-drivers devices
sudo apt install nvidia-driver-545

1.3 nvidia/pytorch 최신 컨테이너 이미지

  • NGC 소개
    NGC(Nvidia GPU Cloud) NVIDIA에서 제공하는 GPU 소프트웨어 패키지 플랫폼입니다. NVIDIA GPU를 사용하고 있는 연구자, 데이터 분석가, 개발자등을 대상으로 편리하게 컨테이너와 소프트웨어, 모델 등을 사용할 수 있도록 함

  • pytorch 최신 컨테이너 이미지(릴리즈 노트)

2번에서 설치한 nvidia-graphic-driver 버전에 맞는 컨테이너 버전을 찾는다. driver 545 버전과 호환되는 cuda 버전을 잘 확인해야함.
컨테이너 빌드 시 cuda 버전이 12.3으로 같은 릴리즈로 맞추었다.

아래는 도커 컨테이너 실행 스크립트

#!/bin/bash
IMAGE_NAME="nvcr.io/nvidia/pytorch:23.11-py3"
CONTAINER_NAME="DMS_PoC"

num=`docker ps -a|grep "$CONTAINER_NAME"|wc -l`
if [ 0 -eq $num ]; then
  set -x
  docker run --rm -it --net=host --privileged --name $CONTAINER_NAME \
  --ulimit core=-1 \
  --gpus all \
  -v /home/fssv3/workspace:/workspace \
  -v /home/fssv3/fssv3_datasets:/mnt/fssv3_datasets \
  $IMAGE_NAME

  set +x
else
  set -x
  docker start $CONTAINER_NAME
  docker attach $CONTAINER_NAME
  set +x
fi

이미지가 로컬에 없으면 내려 받는다.

profile
Computer Vision / ADAS / DMS / 얼굴인식

0개의 댓글