<a href="https://colab.research.google.com/github/Youshin/AI-and-ML-for-coders/blob/main/2%EC%9E%A5_%EC%BB%B4%ED%93%A8%ED%84%B0_%EB%B9%84%EC%A0%84_%EC%86%8C%EA%B0%9C.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

MNIST - 0에서 9까지 손으로 쓴 7만개의 숫자 이미지로 이루어진 데이터 셋

## 2.3 신경망 설계

In [4]:
import numpy as np
import tensorflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense, Flatten

data = tf.keras.datasets.fashion_mnist # 이미지 데이터셋 가져오기.

(train_images, train_labels), (test_images, test_labels) = data.load_data() # 가져온 데이터 훈련/테스트 세트로 나누기

# 이미지 픽셀이 모두 흑백이므로 0에서 255 사잇값을 가지는데, 255로 나누게 되면 픽셀을 0에서 1사이의 값으로 나타낼 수 있습니다. - 정규화normalization
# 텐서플로에서 신경망을 훈련할 떄 정규화가 성능을 높인다는 것을 기억하라(https://developers.google.com/machine-learning/data-prep/transform/normalization) - 왜? (https://coresignal.com/blog/data-normalization/)
train_images = train_images / 255.0
test_images = test_images / 255.0

model = Sequential([
    # 뉴런의 층이 아니라 입력을 위한 크기를 지정합니다. 28 x 28, 패션 MNIST의 이미지 크기. 2D배열인 행렬을 1D 배열인 벡터로 변환합니다.
    Flatten(input_shape=(28, 28)), 
    # 뉴런 128개를 지정(임의의 숫자)했습니다. (은닉 층, 입력과 출력 사이에 위치해 밖에서는 보이지 않으므로 은닉되었다고 말함)
    # 과대적합overfitting이 되거나 학습에 필요한 파라미터가 부족할 수 있으므로 적절한 뉴런 갯수를 선정해야함.
    # 활성화 함수의 경우 층의 각 뉴런에 적용되는 함수입니다. ReLU(rectified linear unit) = 0보다 큰 값을 반환하는 함수. 다음층의 계산에 음숫값을 전달하고 싶지 않으므로 ReLU 활성화 함수를 사용
    Dense(128, activation=tf.nn.relu),
    # 출력층이라 합니다. 옷의 클래스가 10개이므로 10개의 뉴런을 둡니다.
    # softmax 함수는 출력 층의 뉴런에서 출력된 값의 합이 1이 되도록 만듭니다. - 확률처럼 이해하기 좋게 만듭니다.
    Dense(10, activation=tf.nn.softmax) 
])

model.compile(
    # adam 옵티마이저는 sgd 옵티마이저의 진화된 것으로 더 빠르고 효율적이라고 알려져 있습니다.
    optimizer='adam',
    # 희소한 범주형 크로스 엔트로피. 손실 함수. one-hot encoding된 레이블의 경우 categorical_crossentropy 손실 함수를 사용합니다.
    loss='sparse_categorical_crossentropy', 
    metrics=['accuracy']
)

model.fit(train_images, train_labels, epochs=5)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f81c1b56fd0>

In [5]:
# 모델을 평가하는 작업. 테스트를 위해 준비한 1만 개의 이미지와 레이블을 훈련된 모델에 전달해 각 이미지의 출력을 얻고 실제 레이블과 비교하여 결과를 확인합니다.
model.evaluate(test_images, test_labels)



[0.36590391397476196, 0.864799976348877]

In [6]:
classifications = model.predict(test_images)
print(classifications[0])
print(test_labels[0])

[1.5702317e-04 1.2069041e-08 1.8964449e-06 1.7673253e-06 5.5245960e-06
 5.4413062e-03 3.0617488e-05 8.7174386e-02 1.1436770e-04 9.0707296e-01]
9


배열을 살펴보면 다른 값들은 매우 작고 마지막 값인 배열 인덱스 9가 가장 크다는 것을 확인 할 수 있습니다.
이 값은 이미지가 특정 인덱스의 레이블에 매칭될 확률입니다.

따라서 이 신경망은 인덱스 0에 있는 의류 아이템이 90.7%의 확률로 레이블9라고 출력한 것입니다.

## 더 오래 훈련하기: 과대적합

In [7]:
model = Sequential([
    Flatten(input_shape=(28, 28)), 
    Dense(128, activation=tf.nn.relu),
    Dense(10, activation=tf.nn.softmax) 
])
model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy', 
    metrics=['accuracy']
)
model.fit(train_images, train_labels, epochs=50)

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<keras.callbacks.History at 0x7f81c1a0e700>

In [8]:
model.evaluate(test_images, test_labels)



[0.4937026798725128, 0.8924999833106995]

훈련세트의 정확도에 비해 검증의 성능이 오르지 않았습니다.
검증세트에 비해 훈련세트에 특화되었음을 보여줍니다. 이를 **과대적합**이라고 부릅니다

In [9]:
class myCallback(tf.keras.callbacks.Callback):
  def on_epoch_end(self, epoch, logs={}):
    if(logs.get('accuracy') > 0.95):
      print("\n정확도 95%에 도달하여 훈련을 멈춥니다!")
      self.model.stop_training = True

callbacks = myCallback()

model.fit(train_images, train_labels, epochs=50, callbacks=[callbacks])

Epoch 1/50
정확도 95%에 도달하여 훈련을 멈춥니다!


<keras.callbacks.History at 0x7f81c233d6d0>

비전 작업을 더 잘 수행하려면 컴퓨터가 원본 픽셀 대신에 이미지의 특징을 학습해야 합니다.
이때 합성곱convolution을 사용하면 앞서 이 작업을 수행할 수 있습니다.