오늘은 모델이 학습할 데이터는 바로 Fashion MNIST 데이터 셋입니다. MNIST 데이터는 아마 인공지능을 공부해보신 분이라면 0, 1, 2... 손글씨를 분류하는 Digits Dataset으로 한 번쯤은 들어봤을 데이터셋일 겁니다. 그 이후에 Fashion MNIST 데이터셋이 구축되었다고 합니다.
Fashion MNIST Dataset
Fashion MNIST Dataset
해당 링크의 README.md를 읽어보겠습니다.
Table of contents
- Fashion MNIST Dataset에는 60,000개의 training set이 있고, 10,000개의 test set이 있다고 합니다.
- 이미지의 크기는 28x28x1 (grayscale)입니다.
- 클래스(label)은 10개가 존재합니다.
- MNIST Dataset에 벤치마킹하여 만들었다고 합니다.
- Dataset이 만들어진 목적은 MNIST 는 너무 쉽고, 예제로 많이 쓰였으며, 요즘의 CV 문제에 적용될 수 없기 때문입니다.
👉 데이터는 해당 링크에서 다운하면 됩니다.😝
Label
각 훈련 및 테스트에 쓰일 예제는 해당 레이블 중 하나에 포함됩니다.
- 0 티셔츠/탑
- 1 바지
- 2 풀오버
- 3 드레스
- 4 코트
- 5 샌들
- 6 셔츠
- 7 좀도둑
- 8 가방
- 9 발목 부츠
여기서부터 간단히 데이터를 가져오기 위한 단순한 활용 코드입니다.
Dataload
MNIST 데이터는 mnist_reader 모듈로 쉽게 가져올 수 있습니다.👍
import mnist_reader
X_train, y_train = mnist_reader.load_mnist('data/fashion', kind='train')
X_test, y_test = mnist_reader.load_mnist('data/fashion', kind='t10k')
활용 가능한 머신 러닝 라이브러리
- Apache MXNet Gluon
- TensorFlow.js
- Kaggle
- Pytorch
- Keras
- Edward
- Tensorflow
- TensorFlow Datasets
- Torch
- JuliaML
- Chainer
- HuggingFace Datasets