# MNIST - RNN

## 1. 시퀀스로서의 MNIST 이미지

- 텍스트 데이터 적용에 앞서, 익숙한 데이터인 MNIST 이미지 분류를 RNN 모델을 구현하여 분류 작업을 수행해보자.

- 이미지 구조는 CNN 모델에 적합하지만, 인접한 영역의 픽셀은 서로 연관되어 있으므로 이를 시퀀스 데이터로 볼 수도 있다.

- 아래의 그림처럼 MNIST 데이터에서 28 x 28 픽셀을 시퀀스의 각원소는 28개의 픽셀을 가진 길이가 28 시퀀스 데이터로 볼 수 있다.

<img src="./images/mnist_seq.png" height="60%" width="60%"/>

## 2. Keras를 이용한 MNIST 분류기 구현

![](./images/rnn-mnist.PNG)

In [3]:
from keras.datasets import mnist


(train_x, train_y), (test_x, test_y) = mnist.load_data()

# Train set
train_x = train_x.astype('float32') / 255.
# Test set
test_x = test_x.astype('float32') / 255.

print('train_x.shape :', train_x.shape)
print('test_x.shape :', test_x.shape)

train_x.shape : (60000, 28, 28)
test_x.shape : (10000, 28, 28)


In [4]:
from keras import models, Model
from keras import layers
from keras import Input
from keras import backend as K

In [6]:
# Input
inputs = Input(shape=(28, 28), name='mnist_input')

# RNN Model
rnn_cell = layers.SimpleRNN(64)(inputs)
logits = layers.Dense(10, activation='softmax')(rnn_cell)

# Model
model = Model(inputs, logits)

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
mnist_input (InputLayer)     (None, 28, 28)            0         
_________________________________________________________________
simple_rnn_2 (SimpleRNN)     (None, 64)                5952      
_________________________________________________________________
dense_1 (Dense)              (None, 10)                650       
Total params: 6,602
Trainable params: 6,602
Non-trainable params: 0
_________________________________________________________________


- 위의 `input`의 `shape=(28, 28)`은 `batch_size`가 생략된 `(batch_size, time_step, element_size) == (None, 28, 28)` 이다.

In [7]:
model.compile(optimizer='rmsprop',
              loss='sparse_categorical_crossentropy',
              metrics=['acc'])

In [8]:
model.fit(train_x, train_y,
          batch_size=128,
          epochs=5,
          validation_split=0.2)

Train on 48000 samples, validate on 12000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x10e27a7b8>

## 3. 결과 확인

In [9]:
model.evaluate(test_x, test_y)



[0.24223188209533691, 0.9307]