파이토치에서는 데이터셋을 좀 더 쉽게 다룰 수 있도록 torch.utils.data.Dataset과 torch.utils.data.DataLoader를 제공한다. 사용법은 Dataset을 정의하고, 이를 DataLoader에 전달해서 사용하면 된다.
# 커스텀 데이터셋(Custom Dataset)을 만드는 기본적인 뼈대
class CustomDataset(torch.utils.data.Dataset):
def __init__(self): # 데이터셋의 전처리를 해주는 부분
def __len__(self): # 데이터셋의 길이 (총 샘플의 수)
def __getitem__(self, idx): # 데이터셋에서 특정 1개의 샘플을 가져오는 함수
데이터가 많은 경우 데이터를 한 번에 불러오기 쉽지 않기 때문에, 데이터를 한 번에 부르지 않고 하나씩만 불러서 쓰는 방식을 택해야한다. 따라서 모든 데이터를 불러놓고 사용하는 기존의 Dataset 말고 Custom Dataset 이 필요하다.