Cuda-capable한 GPU가 없다면 GCP로 인스턴스(VM) 생성 참조
sudo apt install nvidia-cuda-toolkit
nvidia-smi
nvcc -V
-arch, -code 옵션 사용-arch-arch=compute_75와 같이 사용-code-code=sm_75와 같이 사용CC = nvcc
CXXFLAGS = -arch=compute_75 -code=sm_75,compute_75 -o
%.out : %.cu
$(CC) $(CXXFLAGS) $@ $<
./$@
clean :
rm -rf *.out
CC : 컴파일러CXXFLAGS : 컴파일러에 전달할 flags.cu 파일이 있는 곳에 해당 Makefile을 생성make abc.out shell command ->nvcc -arch=compute_75 -code=sm_75,compute_75 -o abc.out abc.cu 컴파일 후 abc.out 실행make clean shell command -> rm -rf *.out 실행cudaDeviceSynchronize()실행__global__ void func(){
...
}
int main(){
...
func<<<n,n>>>(); // cuda 연산
cudaDeviceSynchronize(); // cuda 연산이 끝날 때까지 wait
...
}