# <font color="#ff8104">케라스에서 MNIST 데이터셋 적재하기</font>

In [15]:
from keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

### 자료 설명

1. 이미지 : 넘파이 배열로 인코딩되어 있다.
2. 레이블 : 0부터 9까지의 숫자 배열 

※특정 샘플의 클래스(카테고리)를 '레이블'이라고 한다.
※텐서 : 다차원 넘파이 배열을 텐서(tensor)라고 한다. 

In [16]:
train_images.shape #6만개의 데이터. (28px * 28px)

(60000, 28, 28)

In [17]:
train_labels

array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

In [18]:
test_images.shape

(10000, 28, 28)

In [19]:
test_labels

array([7, 2, 1, ..., 4, 5, 6], dtype=uint8)

### 작업 순서

1. 훈련 데이터 (train_images, train_labels)를 신경망에 주입
2. 신경망은 이미지와 레이블을 연관시키는 학습을 한다.
3. test_images에 대한 예측을 신경망에 요청


# <font color="#ff8104">신경망 만들기</font>

1. network : 데이터를 필터링하여 처리하는 층. 데이터 프로세싱을 위한 여과기
2. 조밀하게 연결된(또는 완전 연결된) 신경망 층인 Dense층 2개가 연속되어 있다.
3. 두번째(마지막) 층은 10개의 확률 점수가 들어있는 배열(모두 더하면 1)을 반환하는 소프트 맥스 층이다. 

※ [소프트맥스 참고](https://youtu.be/jeOp8aIm1x8?list=PL1H8jIvbSo1q6PIzsWQeCLinUj_oPkLjc)

In [20]:
from keras import models
from keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28*28,)))
network.add(layers.Dense(10, activation='softmax'))

### 신경망이 훈련 준비를 마치기 위해 필요한 컴파일 3단계

1. 손실 함수 : 훈련 데이터에서 신경망 성능 측정. 네트워크가 옳은 방향으로 학습하도록 돕는다.
2. 옵티마이저 : 입력된 데이터와 손실 함수를 기반으로 네트워크를 업데이트 
3. 훈련과 테스트 과정을 모니터링할 지표 : 정확도 등 

# <font color="#ff8104">컴파일 단계</font>

In [21]:
network.compile(optimizer='rmsprop',
               loss='categorical_crossentropy',
               metrics=['accuracy'])

### 이미지 데이터 준비하기

※데이터 전처리 : 신경망은 입력 데이터의 스케일에 민감하여 데이터 전처리가 필요하다. 이미지의 경우 보통 픽셀의 최댓값인 255로 나누어 사용한다.

우리 훈련 이미지는 `[0, 255]`사이의 값인 배열로 저장되어 있다. 이 데이터를 0과 1사이의 값을 가지는 float32타입으로 바꾼다. 

In [22]:
train_images = train_images.reshape((60000, 28*28))
train_images = train_images.astype('float32')/255

test_images = test_images.reshape((10000, 28*28))
test_images = test_images.astype('float32')/255

### 레이블 준비하기

In [23]:
from keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

### 신경망 훈련시키기 

In [24]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x23600ff1b38>

### 테스트 세트에서도 모델이 작동하는지 확인해보자

In [25]:
test_loss, test_acc = network.evaluate(test_images, test_labels)



In [26]:
print(test_acc)

0.9803
