ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 2) local_rank: 0 (pid: 783982) of binary:

kiteday·2024년 4월 15일
0

오류해결

목록 보기
8/9

inference를 하려고 하는데 제대로 돌아가지 않는 문제 !

GPU자원 부족일 가능성이 크다.
batch size, inference step, multi-gpu -> uni-gpu 등 하이퍼파라미터들을 바꿔보면 돌아간다.

profile
공부

0개의 댓글