부스트캠프 Week3 Pytorch(2)

Dae Hee Lee·2021년 8월 20일
0

BoostCamp

목록 보기
22/22

Load Model

model.save()

학습 결과를 공유하고, 저장하기 위해 필요한 함수

  • 학습의 결과를 저장하기 위한 함수
  • 모델 형태(architecture)와 파라메터를 저장
  • 모델 학습 중간 과정의 저장을 통해 최선의 결과 모델을 선택
  • 만들어진 모델을 외부 연구자와 공유하여 학습 재연성 향상
# model's state_dict
print("Model's state_dict:")
for param_tensor in model.state_dict():
	print(param_tensor, "\t", model.state_dict([param_tensor].size())

torch.save(model.state_dict(), os.path.join(MODEL_PATH, "model.pt"))

# 같은 모델의 형태에서 파라메터만 load 
new_model = TheModelClass() new_model.load_state_dict(torch.load(os.path.join(MODEL_PATH, "model.pt")))

#모델의 architecture와 함께 저장
torch.save(model, os.path.join(MODEL_PATH, "model.pt"))
model = torch.load(os.path.join(MODEL_PATH, "model.pt"))

checkpoints

  • 학습의 중간 결과를 저장하여 최선의 결과를 선택
  • earlystopping 기법 사용시 이전 학습의 결과물을 저장
  • loss와 metric 값을 지속적으로 확인 저장
  • 일반적으로 epoch, loss, metric을 함께 저장하여 확인
  • colab에서 지속적인 학습을 위해 필요
import torch
torch.save({ 'epoch': e,
	'model_state_dict': model.state_dict(),
	'optimizer_state_dict': optimizer.state_dict(),
    	'loss': epoch_loss},
	f"saved/checkpoint_model_... .pt")
    
checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

Transfer Learning

  • 다른 데이터셋으로 만든 모델을 현재 데이터에 적용
  • 일반적으로 대용량 데이터셋으로 만들어진 모델의 성능 ↑
  • 현재의 DL에서는 가장 일반적인 학습 기법
  • backbone architecture가 잘 학습된 모델에서 일부분만
    변경하여 학습을 수행함

Freezing

pretrain model 활용 시 모델의 일부분을 freezing 시킨다.

vgg = models.vgg16(pretrained=True).to(device)
class MyNewNet(nn.Module):
    def __init__(self):
	super(MyNewNet, self).__init__()
    	self.vgg19 = models.vgg19(pretrained=True)
        self.linear_layers = nn.Linear(1000, 1)
	# Defining the forward pass
    def forward(self, x):
	x = self.vgg19(x)
	return self.linear_layers(x)

#Freezing
for param in my_model.parameters():
	param.requires_grad = False
for param in my_model.linear_layers.parameters():
	param.requires_grad = True

Montitoring Tools

학습 시간은 길고, 기록하는 도구들이 필요하다.

  • Print문 활용
  • Tensorboard
  • Weights and Biases

Tensorboard

  • TensorFlow의 프로젝트로 만들어진 시각화 도구
  • 학습 그래프, metric, 학습 결과의 시각화 지원
  • PyTorch도 연결 가능→DL 시각화 핵심 도구
  • 특징
    • scalar : metric 등 상수 값의 연속(epoch)을 표시
    • graph : 모델의 computational graph 표시
    • histogram : weight 등 값의 분포를 표현
    • Image : 예측 값과 실제 값을 비교 표시
    • mesh : 3d 형태의 데이터를 표현하는 도구

Weights & Biases

  • 머신러닝 실험을 원활히 지원하기 위한 상용도구
  • 협업, code versioning, 실험 결과 기록 등 제공
  • MLOps의 대표적인 툴로 저변 확대 중

Multi-GPU

Hyperparameter Tuning

PyTorch Troubleshooting

profile
Today is the day

0개의 댓글