DataLoader 의 pin_memory 옵션

AFL·2025년 9월 5일

DataLoader 의 옵션 중 하나인 pin_memory에 대해 알아보았다.

pin_memory=True : 이 메모리를 일정량 확보해둔다는 뜻 → CPU에서 GPU 데이터 전송속도 향상, 빨라짐.
- 데이터를 GPU로 전송할 때 pinned memory에서 데이터를 가져오는 것
- GPU를 사용해서 모델 훈련시킬 때, 데이터가 많을 때 사용하면 좋음
주의사항
- 메모리 사용량: Pinned memory는 일반 CPU 메모리보다 비용이 더 많이 든다. 따라서 많은 양의 pinned memory를 사용하면 시스템의 전체 성능에 영향을 줄 수 있음.
- GPU 사용 환경에서의 유용성: pin_memory는 주로 GPU 사용 환경에서 효과적이다. 데이터를 GPU로 전송할 때 non_blocking=True 옵션과 함께 사용하면, 데이터 전송이 주 연산을 방해하지 않고 백그라운드에서 진행될 수 있음.
- 데이터양이 작으면 해당 효과 작음

from torch.utils.data import DataLoader
dl = DataLoader(dataset, pin_memory=True)
# ...
inputs = inputs.to(device, non_blocking=True)

공부해서 남주자