Using Python fallback. Original ImportError was: ModuleNotFoundError("No module named 'amp_C'",)

boingboing·2024년 3월 18일
0

현상

  • train.py 돌리니 발생함. CAC-UNEt이 apex모듈 쓰는데 갑자기 이게 안 된 거였음. 심장이 쿵..^ㅡ^ 이미 다 설치했던 애인데 재부팅하니까 왜 없어졌지..ㅎㅎ

Warning: multi_tensor_applier fused unscale kernel is unavailable, possibly because apex was installed without --cuda_ext --cpp_ext. Using Python fallback. Original ImportError was: ModuleNotFoundError("No module named 'amp_C'",)

아니 CAC-UNet 학습이 저번주에 분명 잘 됬었는데...? train.py가 잘 돌아갔는데

갑자기 이번주에 다시 해보니 왜 학습이 안 됨......?

해결

SOL1

일단 임시로 지난주에 했던 대로 https://velog.io/@sandartchip/Apex-%EC%84%A4%EC%B9%98-%EC%8B%9C-%EC%97%90%EB%9F%AC-No-module-named-packaging 이걸 해봄. ->해결X

SOL2

https://github.com/NVIDIA/apex/issues/86

이거보고 setup.py 설치. apex에 필요한 prerequiste 설치하고 설치과정 중 GCC, NVCC 컴파일에 필요한 뭔가를 설치하는 듯.

-> cannot import name 'amp' from 'apex' (unknown location)

에러 발생.

SOL3

  1. setuptools 재설치
  2. 최신버전에 뭔가 오류가 있는 듯 해서 옛날거 다운 후 필요 requirement 설치 후
    ->해결. 엔비디아 github에 올라온 질문글 보고 해결.

솔직히 setup.py 설치해서 된건지, 밑에 과정 때문에 된건지 둘다 때문에 된건지 모르겠음. 다음에 또 오류나면 setup.py 설치 안하고 아래 과정만 한 번 해봐야겠음. 원래 공식 라이브러리에는 setup.py 얘기가 없음.

0개의 댓글