torchvision

FSA·2024년 3월 22일
0

torch

목록 보기
1/3

TorchVision transform

  • "TorchVision transform"은 PyTorch의 TorchVision 라이브러리에서 제공하는 기능 중 하나
  • 이미지 데이터를 신경망 모델에 입력하기 전에는 일반적으로 여러 전처리 과정 필요.
  • 이러한 전처리 과정에는
    • 이미지의 크기 조정(resizing),
    • 정규화(normalization),
    • 데이터 증강(data augmentation)
  • TorchVision transform은 이러한 전처리 과정들을 쉽고 효율적으로 구현할 수 있게 해줍니다.

  • TorchVision transform을 사용하는 방법
  1. Transform 함수 정의:
  • TorchVision에서 제공하는 다양한 transform 함수들(Resize, Normalize, ToTensor 등)을 사용하여 필요한 전처리 과정을 정의
  1. Compose를 사용한 Transform 결합:
  • 여러 transform 함수들을 transforms.Compose를 통해 결합하여 연속적인 전처리 파이프라인을 구성
  • 예를 들어, 이미지를 신경망에 입력하기 전에 224x224 크기로 크기를 조정하고, 픽셀 값을 Tensor 형태로 변환한 후, 정규화를 수행하는 전처리 파이프라인은 다음과 같이 구현할 수 있습니다:
from torchvision import transforms

# 전처리 파이프라인 정의
transform = transforms.Compose([
    transforms.Resize((224, 224)),  # 이미지 크기를 224x224로 조정
    transforms.ToTensor(),  # 이미지를 PyTorch Tensor로 변환
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # 정규화
])
  • 이렇게 정의된 transform은 데이터 로딩 시점에 이미지 데이터에 적용되어, 모델 학습이나 추론에 적합한 형태로 데이터를 변환
profile
모든 의사 결정 과정을 지나칠 정도로 모두 기록하고, 나중에 스스로 피드백 하는 것

0개의 댓글