PyTorch는 M1 Macbook의 GPU를 "mps"라는 이름으로 구동 가능
예제를 돌렸을 때, MPS가 약 10배 빠름
M1 CPU로 돌렸을 때
M1 MPS로 돌렸을 때
총 소요 시간이 100ms / ~ 18ms 로 차이가 난다.
제일 처음 계산되는 conv2d를 보면, cpu로 돌린 경우는
mps로 돌린 경우는
CPU로 돌렸을 때는 convolution 연산이 소요시간의 많은 부분을 차지함
MPS로 돌렸을 때는 batch_norm, relu 등이 소요시간의 많은 부분을 차지함
아직 profiler의 interface에 익숙해지지 않는 것 같다.
cpu vs mps 시간 소요 많은 요소들 비교
cpu
mps