Cuda-capable한 GPU가 없다면 GCP로 인스턴스(VM) 생성 참조
sudo apt install nvidia-cuda-toolkit
nvidia-smi
nvcc -V
-arch, -code
옵션 사용-arch
-arch=compute_75
와 같이 사용-code
-code=sm_75
와 같이 사용CC = nvcc
CXXFLAGS = -arch=compute_75 -code=sm_75,compute_75 -o
%.out : %.cu
$(CC) $(CXXFLAGS) $@ $<
./$@
clean :
rm -rf *.out
CC
: 컴파일러CXXFLAGS
: 컴파일러에 전달할 flags.cu
파일이 있는 곳에 해당 Makefile
을 생성make abc.out
shell command ->nvcc -arch=compute_75 -code=sm_75,compute_75 -o abc.out abc.cu
컴파일 후 abc.out
실행make clean
shell command -> rm -rf *.out
실행cudaDeviceSynchronize()
실행__global__ void func(){
...
}
int main(){
...
func<<<n,n>>>(); // cuda 연산
cudaDeviceSynchronize(); // cuda 연산이 끝날 때까지 wait
...
}