원래는 단일 GPU에서 wandb에 기록하던대로 import wandb, wandb.init(), wandb.cofig.update(args), wandb.log(log)를 통해 간단하게 Tracking 하였다.
huggingface의 accelerate를 통해 multi-gpu를 사용해도 똑같이 잘 tracking되지만 accelerate에서 더 간편하게 사용할 수 있게 해놨다.
from acclerate import Accelerator
from accelerate.utils import LoggerType
accelerator = Accelerator(log_with='wandb')
accelerator.init_trackers("프로젝트명", config=config,
init_kwargs={"wandb":
{'entity': 사용자 or 팀명,
'group': GPU 묶을 그룹명}
log = {'meteor': 0.4, 'val/loss': 11.2}
accelerator.log(log, step=1)
accelerator.end_training()