# Simple MNIST convnet

원본 출처<br>
**Author:** [fchollet](https://twitter.com/fchollet)<br>
**Date created:** 2015/06/19<br>
**Last modified:** 2020/04/21<br>
**Description:** A simple convnet that achieves ~99% test accuracy on MNIST.

상단 메뉴 런타임 - 런타임 유형 변경에서 **GPU**를 선택하고 진행하세요.

## Setup

In [None]:
import numpy as np
from tensorflow import keras
from tensorflow.keras import layers

## TODO 1: Feature scaling

In [None]:
# Model / data parameters
num_classes = 10            # 레이블의 개수 (0, 1, 2, ..., 9, 10개) 
input_shape = (28, 28, 1)   # CNN은 2차원 정보를 활용합니다. (28 x 28 이미지 흑백 한 장, 기존 MLP는 784개의 픽셀 색상을 사용)

# the data, split between train and test sets
# x를 이미지, y를 이미지에 대한 레이블로 표현합니다.
# x_train[0]은 첫 번째 훈련 그림, y_train[0]은 첫 번째 훈련 그림의 정답 ([0, 9]에 속한 숫자 하나)
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

# 각 픽셀 값을 [0, 255] -> [0, 1]로 변환하세요.
x_train = x_train.astype("float32") / 255.0
x_test = x_test.astype("float32") / 255.0

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


## TODO 2: Input shape

In [None]:
# 현재 이미지의 shape을 출력하세요. (6만장의 28 x 28 이미지)
x_train.shape

(60000, 28, 28)

## TODO 3: Shape expanding

In [None]:
# Make sure images have shape (28, 28, 1) 
# CNN은 한 장의 이미지 모양을 (가로, 세로, 채널 수)로 만들어야 합니다.
# 컬러 이미지는 R, G, B 세 장의 채널이지만 MNIST는 흑백이라 한 장의 채널이 필요합니다.
# 최종적으로 6만장의 28 x 28 이미지 흑백 채널 하나가 필요합니다.
# 가장 마지막 자리에 차원 하나 늘리기: (60000, 28, 28) -> (60000, 28, 28, 1)

# expand_dims는 NumPy 배열의 특정 위치에 차원을 늘려줍니다.
# 파이썬에서 인덱싱할 때 가장 마지막 위치를 나타내는 정수를 기입하세요.
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)

print("x_train shape:", x_train.shape)
print("x_test:", x_test.shape)
print(x_train.shape[0], "train samples")
print(x_test.shape[0], "test samples")

x_train shape: (60000, 28, 28, 1)
x_test: (10000, 28, 28, 1)
60000 train samples
10000 test samples


## TODO 4: One-hot encoding

In [None]:
# convert class vectors to binary class matrices (레이블을 범주형 인자로 변환)
from tensorflow.keras.utils import to_categorical

y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

## Build the model

In [None]:
model = keras.Sequential(
    [
        keras.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),   # MLP와 같이 데이터를 1차원 배열로 만듦
        layers.Dense(num_classes, activation="softmax"),
    ]
)

model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 26, 26, 32)        320       
                                                                 
 max_pooling2d (MaxPooling2D  (None, 13, 13, 32)       0         
 )                                                               
                                                                 
 conv2d_1 (Conv2D)           (None, 11, 11, 64)        18496     
                                                                 
 max_pooling2d_1 (MaxPooling  (None, 5, 5, 64)         0         
 2D)                                                             
                                                                 
 flatten (Flatten)           (None, 1600)              0         
                                                                 
 dense (Dense)               (None, 10)                1

##TODO 5: Model training

In [None]:
batch_size = 128
epochs = 10

model.compile(loss="categorical_crossentropy", optimizer="adam", metrics=["accuracy"])

# 훈련 데이터의 10%는 사용하지 않고 남겨두었다가 Epoch이 끝날 때마다 남겨둔 데이터로 성능을 평가하여 출력해보세요.
# 따로 테스트를 하지 않더라도 테스트 했을 때의 성능을 짐작할 수 있게 도와줍니다.
# Hint: https://keras.io/api/models/model_training_apis/ 에서 fit method 참조
model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, validation_split=0.1)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7f5ff016dc90>

## Evaluate the trained model

In [None]:
score = model.evaluate(x_test, y_test, verbose=0)
print("Test loss:", score[0])
print("Test accuracy:", score[1])

Test loss: 0.03385036811232567
Test accuracy: 0.9884999990463257


## 이미지 변환 함수 (PNG -> 정규화된 일차원 배열)

In [None]:
# image_prepare(파일이름)으로 호출하면 정규화된 일차원 리스트를 반환합니다.

from PIL import Image, ImageFilter

def image_prepare(argv):
    """
    This function returns the pixel values.
    The imput is a png file location.
    """
    im = Image.open(argv).convert('L')
    width = float(im.size[0])
    height = float(im.size[1])
    newImage = Image.new('L', (28, 28), (255))  # creates white canvas of 28x28 pixels

    if width > height:  # check which dimension is bigger
        # Width is bigger. Width becomes 20 pixels.
        nheight = int(round((20.0 / width * height), 0))  # resize height according to ratio width
        if (nheight == 0):  # rare case but minimum is 1 pixel
            nheight = 1
            # resize and sharpen
        img = im.resize((20, nheight), Image.ANTIALIAS).filter(ImageFilter.SHARPEN)
        wtop = int(round(((28 - nheight) / 2), 0))  # calculate horizontal position
        newImage.paste(img, (4, wtop))  # paste resized image on white canvas
    else:
        # Height is bigger. Heigth becomes 20 pixels.
        nwidth = int(round((20.0 / height * width), 0))  # resize width according to ratio height
        if (nwidth == 0):  # rare case but minimum is 1 pixel
            nwidth = 1
            # resize and sharpen
        img = im.resize((nwidth, 20), Image.ANTIALIAS).filter(ImageFilter.SHARPEN)
        wleft = int(round(((28 - nwidth) / 2), 0))  # caculate vertical pozition
        newImage.paste(img, (wleft, 4))  # paste resized image on white canvas

    # newImage.save("sample.png

    tv = list(newImage.getdata())  # get pixel values

    # normalize pixels to 0 and 1. 0 is pure white, 1 is pure black.
    tva = [(255 - x) * 1.0 / 255.0 for x in tv]
    return tva

## TODO 6: 지난 시간에 여러분이 그린 PNG 파일 변환
Colab으로 0.png ~ 9.png를 복사한 후 진행하세요.

In [None]:
# 10장의 28 x 28 크기, 흑백 1채널
img_array = np.empty((10,28,28,1))

for i in range(10):
  # 리스트를 NumPy 배열로 변환
  img = np.array(image_prepare(f'{i}.png'))
  # (784, ) -> (28, 28, 1)
  img_array[i] = img.reshape(28, 28, 1)

## TODO 7: 여러분의 PNG 파일 예측<br>
잘 예측되나요?

In [None]:
res = model.predict(img_array)
for r in res:
  # 값이 가장 큰 인덱스 출력하기 
  print(np.argmax(r))

0
1
2
3
9
5
6
7
9
9


In [None]:
# 80%