# 2.1 신경망과의 첫 만남
- 머신 러닝에서 분류 문제의 범주(category)를 **클래스**(class)라고 하며 데이터 포인트는 **샘플**(sample)이라고 함
- 특정 샘플의 클래스는 **레이블(label)**이라고 함

In [1]:
from tensorflow import keras

keras.__version__

'2.6.0'

### MNIST 데이터셋
- 28x28 픽셀의 흑백 손글씨 숫자 이미지
- 6만개의 훈련 데이터와 1만개의 테스트 데이터

In [2]:
from tensorflow.keras.datasets import mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

훈련 데이터

In [3]:
train_images.shape

(60000, 28, 28)

In [4]:
train_labels

array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

테스트 데이터

In [5]:
test_images.shape

(10000, 28, 28)

In [6]:
test_labels

array([7, 2, 1, ..., 4, 5, 6], dtype=uint8)

### 신경망 구조
- **층**(layer) : 신경망의 핵심 구성 요소로 입력된 데이터로부터 의미있는 **표현**(representation)을 추출
- **완전 연결**(fully connected)된 신경망 층인 `Dense`층 2개가 연속되어 있음
- 두 번째 층은 10개의 확률 점수가 들어 있는 배열을 반환하는 **소프트맥스**(softmax) 층으로 각 클래스 중 하나에 속할 확률

In [7]:
from tensorflow.keras import models
from tensorflow.keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28*28, )))
network.add(layers.Dense(10, activation='softmax'))

### 컴파일 단계
- **손실 함수**(loss function) : 신경망 성능을 측정하는 방법으로, 네트워크가 옳은 방향으로 학습될 수 있도록 도와줌
- **옵티마이저**(optimizer) : 입력된 데이터와 손실 함수를 기반으로 네트워크를 업데이트하는 매커니즘
- **훈련과 테스트 과정을 모니터링할 지표** : 정확도 등

In [8]:
network.compile(loss='categorical_crossentropy',
               optimizer='rmsprop',
               metrics=['accuracy'])

### 이미지 데이터 준비하기
- 신경망은 입력 데이터의 스케일에 민감하여 적절한 데이터 전처리 과정이 필요
- [0, 255] 사이의 값인 unit8 타입의 (60000, 28, 28) 배열의 데이터를 0과 1사이 값을 가지는 float32 타입의 (60000, 28*28) 크기인 배열로 바꿈

In [9]:
train_images = train_images.reshape((60000, 28*28))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28*28))
test_images = test_images.astype('float32') / 255

### 레이블 준비하기
- 범주형으로 인코딩

In [10]:
from tensorflow.keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

### 모델 학습

In [12]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x1f2068fe208>

In [13]:
test_loss, test_acc = network.evaluate(test_images, test_labels)



In [14]:
print('test_acc :', test_acc)

test_acc : 0.9801999926567078


훈련 정확도보다 테스트 정확도가 낮은 이유는 **과대적합**(overfitting) 때문