Fashion MNIST Dataset 소개

미남잉·2021년 8월 31일
0

오늘은 모델이 학습할 데이터는 바로 Fashion MNIST 데이터 셋입니다. MNIST 데이터는 아마 인공지능을 공부해보신 분이라면 0, 1, 2... 손글씨를 분류하는 Digits Dataset으로 한 번쯤은 들어봤을 데이터셋일 겁니다. 그 이후에 Fashion MNIST 데이터셋이 구축되었다고 합니다.



Fashion MNIST Dataset

Fashion MNIST Dataset

해당 링크의 README.md를 읽어보겠습니다.


Table of contents

  • Fashion MNIST Dataset에는 60,000개의 training set이 있고, 10,000개의 test set이 있다고 합니다.
  • 이미지의 크기는 28x28x1 (grayscale)입니다.
  • 클래스(label)은 10개가 존재합니다.
  • MNIST Dataset에 벤치마킹하여 만들었다고 합니다.
  • Dataset이 만들어진 목적은 MNIST 는 너무 쉽고, 예제로 많이 쓰였으며, 요즘의 CV 문제에 적용될 수 없기 때문입니다.

👉 데이터는 해당 링크에서 다운하면 됩니다.😝


Label

각 훈련 및 테스트에 쓰일 예제는 해당 레이블 중 하나에 포함됩니다.

  • 0 티셔츠/탑
  • 1 바지
  • 2 풀오버
  • 3 드레스
  • 4 코트
  • 5 샌들
  • 6 셔츠
  • 7 좀도둑
  • 8 가방
  • 9 발목 부츠

여기서부터 간단히 데이터를 가져오기 위한 단순한 활용 코드입니다.


Dataload

MNIST 데이터는 mnist_reader 모듈로 쉽게 가져올 수 있습니다.👍

import mnist_reader
X_train, y_train = mnist_reader.load_mnist('data/fashion', kind='train')
X_test, y_test = mnist_reader.load_mnist('data/fashion', kind='t10k')

활용 가능한 머신 러닝 라이브러리

  • Apache MXNet Gluon
  • TensorFlow.js
  • Kaggle
  • Pytorch
  • Keras
  • Edward
  • Tensorflow
  • TensorFlow Datasets
  • Torch
  • JuliaML
  • Chainer
  • HuggingFace Datasets
profile
Tistory로 이사갔어요

0개의 댓글