https://github.com/keras-team/keras 내 examples 에서 가져옴

In [6]:
'''Trains a simple deep NN on the MNIST dataset.

Gets to 98.40% test accuracy after 20 epochs
(there is *a lot* of margin for parameter tuning).
2 seconds per epoch on a K520 GPU.
'''

from __future__ import print_function
import keras

Keras 디렉토리에 데이터셋 모듈 존재  
해당 모듈을 불러오면
* 데이터 저장된 웹주소에 접근해 데이터 가져온 후 로컬 디렉토리 생성 후 저장  
* 처음 호출 시 데이터 다운로드하며, 이 후 로컬에서 불러옴  
* 내부 환경 등에서 웹 접속 안되는 경우 로컬 경로에 데이터 저장해 놓으면 됨 ($HOME/.keras 디렉토리)  

In [1]:
from keras.datasets import mnist 
from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.optimizers import RMSprop

Using TensorFlow backend.


In [2]:
# batch_size : 학습 paramter 업데이트하기 위한 데이터 뭉치 크기
# epochs : 데이터 전체 반복 횟수
batch_size = 128
num_classes = 10
epochs = 20

mnist data set 은 28*28 데이터 --> 784, 데이터 갯수 60000, 10000

In [3]:
# the data, split between train and test sets
(x_train, y_train), (x_test, y_test) = mnist.load_data()

x_train = x_train.reshape(60000, 784)
x_test = x_test.reshape(10000, 784)
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')

Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz


In [4]:
# 256 색을 normalize
x_train /= 255
x_test /= 255
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

60000 train samples
10000 test samples


클래스 라벨을 뉴럴네트워크 형식으로 변환

In [7]:
# convert class vectors to binary class matrices
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

모델 구성
* MLP의 한 개 층을 Dense 로 정의

In [9]:
model = Sequential()
model.add(Dense(512, activation='relu', input_shape=(784,)))
model.add(Dropout(0.2))
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(num_classes, activation='softmax'))

모델 구성의 요약정보를 살펴볼 수 있다

In [9]:
model.summary()

Instructions for updating:
Colocations handled automatically by placer.
Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 512)               401920    
_________________________________________________________________
dropout_1 (Dropout)          (None, 512)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 512)               262656    
_________________________________________________________________
dropout_2 (Dropout)          (None, 512)               0         
_________________________________________________________________
dense_3 (Dense)              (None, 10)                5130      
Total params: 669,706
Trainable params: 669,706
Non-trainable params: 0
_______________

최종 결과로 분류값을 얻기 위해 activation으로 relu 가 아닌 softmax 적용 
> softmac : (0.1, 0.2, 0.3, ...) : 각 라벨 값을 가질 확률,  
           최대값의 가지는 라벨을 가지는 것으로 판단

모델 환경 설정

In [13]:
# 'categorical_crossentropy' : 분류 문제에 사용하는 loss 함수 
model.compile(loss='categorical_crossentropy',
              optimizer=RMSprop(),
              metrics=['accuracy'])

In [None]:
# 학습 시작 train
history = model.fit(x_train, y_train,
                    batch_size=batch_size,
                    epochs=epochs,
                    verbose=1,
                    validation_data=(x_test, y_test))

# 학습 모델 test 검증
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])