kubernetes - GPU

우야·2021년 5월 25일
0

설치 방법

  • NVIDIA GPU 디바이스 플러그인 배치하기
  1. 공식 NVIDIA GPU 디바이스 플러그인
    • 공식 NVIDIA GPU 디바이스 플러그인은 다음의 요구 사항을 가진다.
    1. 쿠버네티스 노드에는 NVIDIA 드라이버가 미리 설치되어 있어야 한다.
    2. 쿠버네티스 노드에는 nvidia-docker 2.0이 미리 설치되어 있어야 한다.
    3. Kubelet은 자신의 컨테이너 런타임으로 도커를 사용해야 한다.
    4. 도커는 runc 대신 nvidia-container-runtime 이 기본 런타임으로 설정되어야 한다.
    5. NVIDIA 드라이버의 버전은 조건 ~= 384.81을 만족해야 한다.
    6. Nvidia device plugin 설치
  2. GCE에서 사용되는 NVIDIA GPU 디바이스 플러그인
    • GCE에서 사용되는 NVIDIA GPU 디바이스 플러그인은 nvidia-docker의 사용이 필수가 아니며 컨테이너 런타임 인터페이스(CRI)에 호환되는 다른 컨테이너 런타임을 사용할 수 있다. 해당 사항은 컨테이너에 최적화된 OS에서 테스트되었고, 우분투 1.9 이후 버전에 대한 실험적인 코드를 가지고 있다.
    1. Nvidia 드라이버, 디바이스 플러그인 설치
      - # 컨테이너에 최적회된 OS에 NVIDIA 드라이버 설치:
      kubectl create -f https://raw.githubusercontent.com/GoogleCloudPlatform/container-engine-accelerators/stable/daemonset.yaml
      - # 우분투에 NVIDIA 드라이버 설치(실험적):
      kubectl create -f https://raw.githubusercontent.com/GoogleCloudPlatform/container-engine-accelerators/stable/nvidia-driver-installer/ubuntu/daemonset.yaml
      - # 디바이스 플러그인 설치:
      kubectl create -f https://raw.githubusercontent.com/kubernetes/kubernetes/release-1.14/cluster/addons/device-plugins/nvidia-gpu/daemonset.yaml

다른 타입의 GPU들이 포함된 클러스터 사용시

  • 노드 레이블
  • 노드 셀렉터
profile
Fullstack developer

0개의 댓글