In [1]:
# Tensorflow tutorial - Numpy data load and preprocessing
# Website address - https://www.tensorflow.org/tutorials/load_data/numpy#setup

In [2]:
from __future__ import absolute_import, division, print_function, unicode_literals

In [3]:
import numpy as np
import tensorflow as tf

In [4]:
# Load .npz file
DATA_URL = 'https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz'

# named mnist.npz and get file from DATA_URL
path = tf.keras.utils.get_file('mnist.npz', DATA_URL)

# with가 사용되면 np.load를 실행하고 실행이 된다면, data라는 이름으로 사용한다.
with np.load(path) as data:
    train_examples = data['x_train']
    train_labels = data['y_train']
    test_examples = data['x_test']
    test_labels = data['y_test']

In [5]:
# Load numpy arrays with tf.data.Dataset

# 데이터를 tf.data.Dataset을 이용하여 자동으로 텐서로 만들어 묶은 뒤 저장한다.
# dataset = tensor(examples, labels)
train_dataset = tf.data.Dataset.from_tensor_slices((train_examples, train_labels))
test_dataset = tf.data.Dataset.from_tensor_slices((test_examples, test_labels))

In [6]:
# 출력을 해보면 두 데이터 형식의 차이를 볼 수 있다.
print(type(train_examples))
print(type(train_dataset))

<class 'numpy.ndarray'>
<class 'tensorflow.python.data.ops.dataset_ops.TensorSliceDataset'>


In [7]:
# Use the datasets

BATCH_SIZE = 64
SHUFFLE_BUFFER_SIZE = 100

# OverFitting을 방지하기 위해서 Shuffle을 사용
# tf.data.Dataset.shuffle은 Buffer 크기만큼 데이터를 섞는다. *완전히 랜덤하게하기 위해서는 데이터셋보다 큰 수를 넣어야한다.

train_dataset = train_dataset.shuffle(SHUFFLE_BUFFER_SIZE).batch(BATCH_SIZE)
test_dataset = test_dataset.batch(BATCH_SIZE)

In [8]:
# Build model
# model shape -> 1차원 784 -> 1차원 128 -> 1차원 10
# mnist 데이터셋은 0~9를 구분하는 숫자 인식 데이터셋이기 떄문에 10개의 결과를 나타내게 한다.
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10)
])

# model compile
model.compile(optimizer=tf.keras.optimizers.RMSprop(),
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['sparse_categorical_accuracy'])

In [9]:
import os
if os.path.isfile('./weights/mnist_weights.index'):
    model.load_weights('weights/mnist_weights')
else:
    model.fit(train_dataset, epochs=10)
    model.save_weights('weights/mnist_weights')

In [10]:
model.evaluate(test_dataset)



[0.5460926755222176, 0.9559]