[Wandb error] Path is not a directory: ./checkpoint-1170

who_am_I·2024년 9월 6일

[Upstage AI Lab]

목록 보기
16/19

wandb를 checkpoint로 설정하면 마지막 파일이 저장되지 않고 에러가 발생한다.
checkpoint 대신 end를 사용했더니 checkpoint로 저장이 되면서 에러도 발생하지 않았다.

# Wandb를 초기화 한다

wandb.init(
entity=config['wandb']['entity'],
        project=config['wandb']['project'],
        name=config['wandb']['name'])

# checkpoint를 저장하도록 설정한다.
os.environ["WANDB_LOG_MODEL"]="checkpoint" # 이 부분을 end로 수정

wandb.save("./checkpoints/checkpoint-last/*")
wandb.finish()

ckeckpont : 매 epoch 마다 모델을 저장
end : 마지막 epoch의 모델을 저장

profile
Data, AI

0개의 댓글