- "TorchVision transform"은 PyTorch의 TorchVision 라이브러리에서 제공하는 기능 중 하나
- 이미지 데이터를 신경망 모델에 입력하기 전에는 일반적으로 여러 전처리 과정 필요.
- 이러한 전처리 과정에는
- 이미지의 크기 조정(resizing),
- 정규화(normalization),
- 데이터 증강(data augmentation)
- TorchVision transform은 이러한 전처리 과정들을 쉽고 효율적으로 구현할 수 있게 해줍니다.
- TorchVision transform을 사용하는 방법
- Transform 함수 정의:
- TorchVision에서 제공하는 다양한 transform 함수들(
Resize
, Normalize
, ToTensor
등)을 사용하여 필요한 전처리 과정을 정의
- Compose를 사용한 Transform 결합:
- 여러 transform 함수들을
transforms.Compose
를 통해 결합하여 연속적인 전처리 파이프라인을 구성
- 예를 들어, 이미지를 신경망에 입력하기 전에 224x224 크기로 크기를 조정하고, 픽셀 값을 Tensor 형태로 변환한 후, 정규화를 수행하는 전처리 파이프라인은 다음과 같이 구현할 수 있습니다:
from torchvision import transforms
transform = transforms.Compose([
transforms.Resize((224, 224)),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
- 이렇게 정의된
transform
은 데이터 로딩 시점에 이미지 데이터에 적용되어, 모델 학습이나 추론에 적합한 형태로 데이터를 변환