PyTorch: torch.utils.data.Dataset

danbibibi·2022년 1월 21일
0

PyTorch 🔥

목록 보기
4/20

torch.utils.data.Dataset

파이토치에서는 데이터셋을 좀 더 쉽게 다룰 수 있도록 torch.utils.data.Datasettorch.utils.data.DataLoader를 제공한다. 사용법은 Dataset을 정의하고, 이를 DataLoader에 전달해서 사용하면 된다.

# 커스텀 데이터셋(Custom Dataset)을 만드는 기본적인 뼈대
class CustomDataset(torch.utils.data.Dataset): 
  def __init__(self): # 데이터셋의 전처리를 해주는 부분

  def __len__(self): # 데이터셋의 길이 (총 샘플의 수)

  def __getitem__(self, idx): # 데이터셋에서 특정 1개의 샘플을 가져오는 함수

Custom Dataset 을 사용하는 이유

데이터가 많은 경우 데이터를 한 번에 불러오기 쉽지 않기 때문에, 데이터를 한 번에 부르지 않고 하나씩만 불러서 쓰는 방식을 택해야한다. 따라서 모든 데이터를 불러놓고 사용하는 기존의 Dataset 말고 Custom Dataset 이 필요하다.

profile
블로그 이전) https://danbibibi.tistory.com

0개의 댓글