Linux에서 Cuda 다루기

Hyoeun·2022년 9월 14일

대규모병렬컴퓨팅

목록 보기

2/2

Cuda-capable한 GPU가 없다면 GCP로 인스턴스(VM) 생성 참조

sudo apt install nvidia-cuda-toolkit

nvidia-smi

nvcc -V

각 compute capability 별로 컴파일 방식이 다름
모든 compute capability를 지원하려면 컴파일 시간, exe파일 크기 증가 등의 문제 발생
-arch, -code 옵션 사용
-arch
- -arch=compute_75와 같이 사용
- 생성될 PTX(Parallel Thread Execution) 코드의 버전 지정
-code
- -code=sm_75와 같이 사용
- 생성될 binary 코드의 버전 지정
alias를 통해 argue를 주려 했으나 Makefile을 써보기로 했다.
참고

CC = nvcc
CXXFLAGS = -arch=compute_75 -code=sm_75,compute_75 -o
%.out : %.cu
	$(CC) $(CXXFLAGS) $@ $<
	./$@

clean :
	rm -rf *.out

CC : 컴파일러
CXXFLAGS : 컴파일러에 전달할 flags
.cu 파일이 있는 곳에 해당 Makefile을 생성
make abc.out shell command ->
nvcc -arch=compute_75 -code=sm_75,compute_75 -o abc.out abc.cu 컴파일 후 abc.out 실행
- GPU의 compute capability 확인 후 버전 변경
make clean shell command -> rm -rf *.out 실행
Ref

__global__ void func(){
...
}

int main(){
...
func<<<n,n>>>(); // cuda 연산
cudaDeviceSynchronize(); // cuda 연산이 끝날 때까지 wait
...
}