[분산학습] accelerate에서 Weigths&Biases 쓰기

yoonene·2023년 1월 20일

분산학습

ML/DL

목록 보기

12/17

원래는 단일 GPU에서 wandb에 기록하던대로 import wandb, wandb.init(), wandb.cofig.update(args), wandb.log(log)를 통해 간단하게 Tracking 하였다.

huggingface의 accelerate를 통해 multi-gpu를 사용해도 똑같이 잘 tracking되지만 accelerate에서 더 간편하게 사용할 수 있게 해놨다.

지원 Trackers

TensorBoard
Wandb
CometML
어디서 MLflow도 본 것 같은데 공식 documents에는 위 3가지의 tracker를 integrated하였다고 한다.

사용법

init accelerator

from acclerate import Accelerator
from accelerate.utils import LoggerType

accelerator = Accelerator(log_with='wandb')
accelerator.init_trackers("프로젝트명", config=config, 
						   init_kwargs={"wandb": 
                           						{'entity': 사용자 or 팀명, 
                                                'group': GPU 묶을 그룹명}

log = {'meteor': 0.4, 'val/loss': 11.2}
accelerator.log(log, step=1)

wandb.finish()

accelerator.end_training()

yoonene

NLP Researcher / Information Retrieval / Search

이전 포스트

[효율적 학습] Accelerate, DeepSpeed

다음 포스트

[분산학습] accelerate에서 Weigths&Biases 쓰기

ML/DL

지원 Trackers

사용법

[효율적 학습] Accelerate, DeepSpeed

[분산학습 이슈] RuntimeError: Invalid mt19937 state

0개의 댓글

관련 채용 정보