os를 import하여 CUDA_LANCH_BLOCKING=1 옵션을 주었는데도 제대로 작동하지 않았다. 알고보니 GPU를 1개 할당해두고 process를 multi로 설정해두어서 충돌이나는 오류였다.
해당 코드 포팅에서는 --num_processes=1 argument가 있어서 요렇게 설정해주니 잘 되었음!