널리 사용되는
datasets
,model architectures
, computer vision에서의 일반적인image transformations
으로 구성되어 있다.
유명한 datasets을 쉽게 받고 사용할 수 있다.
ex) MNIST, CIFAR 등
다양한 pre-trained 모델 제공한다.
ex) Alexnet, VGG, ResNet
augumentation을 위해 제공해주는 모듈이다.(다양한 이미지 변환 기능을 제공)
ToTensor()
— PIL 이미지 또는 numpy.ndarray를 pytorch tensor로 변환
import torchvision.transforms as transforms
transforms.ToTensor()
Compose(transforms)
- 여러 기능(transforms)들을 Compose로 구성할 수 있음
transforms.Compose([
transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
transforms.Resize((32, 32))
])
Resize(size)
- 주어진 PIL 이미지 크기조정
Normalize(mean, std, inplace=False)
— 주어진 이미지를 mean, std의 값을 통해 정규화
Grayscale(num_output_channels=1)
— 주어진 이미지를 grayscale로 변형
Pad(padding, fill=0, padding_mode='constant)
— 패딩 (convolution 시 사용)