# MNIST
흑백 손글씨 숫자 이미지(28*28)를 10개의 범주(0-9)로 분류하는 것

## 케라스에서 MNIST 데이터셋 적재하기

- 클래스와 레이블에 관한 노트

    머신 러닝에서 분류 문제의 category를 class라고 합니다. <br>
    데이터 포인트는 sample이라고 합니다.<br>
    특정 샘플의 클래스는 label이라고 합니다.

In [5]:
from keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

6만 개의 훈련 이미지와 1만 개의 테스트 이미지로 구성

In [15]:
# 훈련 데이터
print('train_images.shape : {}'.format(train_images.shape))
print('len(train_lables) : {}'.format(len(train_labels)))
print('train_labels : {}'.format(train_labels))

train_images.shape : (60000, 28, 28)
len(train_lables) : 60000
train_labels : [5 0 4 ... 5 6 8]


In [16]:
# 테스트 데이터
print('test_images.shapes : {}'.format(test_images.shape))
print('len(test_labels) : {}'.format(len(test_labels)))
print('test_labels : {}'.format(test_labels))

test_images.shapes : (10000, 28, 28)
len(test_labels) : 10000
test_labels : [7 2 1 ... 4 5 6]


### 작업 순서
1. 훈련 데이터 train_images와 train_labels를 네트워크에 주입합니다.
2. 네트워크는 이미지와 레이블을 연관시킬 수 있도록 학습됩니다.
3. test_images에 대한 예측을 네트워크에 요청합니다.
4. 이 예측이 test_labels와 맞는지 확인합니다.

In [17]:
# 신경망 구조
from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(512,activation='relu', input_shape=(28*28,)))
model.add(layers.Dense(10,activation='softmax'))

신경망 층인 Dense 층 2개가 연속되어 있으며 마지막의 층은 10개의 확률 점수가 들어있는 배열을 반환하는 softmax층입니다.<br>
각 점수는 현재 숫자 이미지가 10개의 숫자 클래스 중 하나에 속할 확률입니다.

신경망이 훈련 준비를 마치기 위해서 컴파일 단계에 포함될 세가지가 더 필요합니다.
- 손실함수
- 옵티마이저
- 훈련과 테스트 과정을 모니터링할 지표

In [18]:
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

훈련 이미지는 [0,255] 사이의 값인 uint8 타입의 크기를 가진 배열로 저장 되어있기 때문에 0과 1 사이의 값을 가지는 float32타입의 배열로 변환해야합니다.

(60000, 28, 28) => (60000, 28*28)

In [37]:
# 이미지 데이터 준비하기
print('== Before train_images ==')
print('shape : {}'.format(train_images.shape))
print('type : {}'.format(type(train_images[0,0,0])))

print()
print('== Before test_images ==')
print('shape : {}'.format(test_images.shape))
print('type : {}'.format(type(test_images[0,0,0])))

== before train_images ==
shape : (60000, 28, 28)
type : <class 'numpy.uint8'>

== before test_images ==
shape : (10000, 28, 28)
type : <class 'numpy.uint8'>


In [39]:
train_images = train_images.reshape((60000, 28*28))
train_images = train_images.astype('float32')/255

test_images = test_images.reshape((10000,28*28))
test_images = test_images.astype('float32')/255

In [43]:
print('== After train_images ==')
print('shape : {}'.format(train_images.shape))
print('type : {}'.format(type(train_images[0,0])))
print()
print('== After test_images ==')
print('shape : {}'.format(test_images.shape))
print('type : {}'.format(type(test_images[0,0])))

== After train_images ==
shape : (60000, 784)
type : <class 'numpy.float32'>

== After test_images ==
shape : (10000, 784)
type : <class 'numpy.float32'>


In [46]:
# 레이블 범주형으로 인코딩
from keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

In [49]:
# 모델 학습
history = model.fit(train_images, train_labels, epochs=5, batch_size=128)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


In [50]:
# 테스트 세트의 정확도 확인
test_loss, test_acc = model.evaluate(test_images, test_labels)



In [51]:
print('test_acc : ',test_acc)

test_acc :  0.9337999820709229
