import 할 것들 해주기
tensorflow의 keras에는 필요한 함수들이 모여있다
import tensorflow as tf
from tensorflow.keras import datasets, models, layers, utils, losses
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
위의 코드는 에러 메시지를 안뜨게 하는 것
(train_data, train_label), (test_data, test_label) = datasets.mnist.load_data()
print(train_data.shape)
print(test_data.shape)
import matplotlib.pyplot as plt
plt.imshow(train_data[0], cmap='gray_r')
6만 장의 데이터들 중 첫번째 데이터 꺼내기
print(train_data.min())
print(train_data.max())
각 이미지(28px * 28px)가 0-255 사이의 숫자로 이뤄져있다는 것을 알게 됨
train_data = train_data.reshape(60000, 784) / 255.0
test_data = test_data.reshape(10000, 784) / 255.0
reshape 함수를 써서 각 이미지를 28행x28열에서 1행x784열로 펼쳐줄 것
train_data = train_data.reshape(60000, 784) / 255.0
test_data = test_data.reshape(10000, 784) / 255.0
각 이미지 내의 픽셀 값은 0-255에서 0-1로 바꿔 준다.
train_data.shape
확인해보기.
train_label
각각의 이미지에 대한 라벨이 integer로 이뤄져 있다
train_label = utils.to_categorical(train_label)
test_label = utils.to_categorical(test_label)
0~9 까지의 수를 원핫벡터로 바꿔 주었다.
tensorflow 2.x 안에 있는 to_categorical() 사용
import pandas as pd
pd.DataFrame(train_label).head(3)
확인해본다.
이제 여러 함수들을 어떻게 사용할 지 알아보고자 한다.
to be continued,,,