In [None]:
import tensorflow as tf
import numpy as np

print("TensorFlow version:", tf.__version__)

TensorFlow version: 2.17.1


In [None]:
# 데이터 세트 로드

mnist = tf.keras.datasets.mnist

(x_train, y_train) , (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step


In [None]:
# 데이터 세트 확인

print(len(x_train))
print(len(y_train))
print(len(x_test))
print(len(y_test))


60000
60000
10000
10000


In [None]:
# 머신러닝 모델 빌드

model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),        # layer 1 : 28*28의 2D 입력 데이터를 1차원 벡터로 변환한다.
    tf.keras.layers.Dense(128, activation='relu'),        # layer 2 : 128개의 노드를 가진 완전 연결층이다. ReLU 활성화 함수는 양수는 그대로 두고 음수 값을 0으로 변경해 비선형성을 추가한다.
    tf.keras.layers.Dropout(0.2),                         # layer 3 : 과대적합을 방지하기 위해 드롭아웃 기법 적용한다. 임의로 20% 노드를 비활성화해 각 학습 단계에서 특정 노드들이 학습에 참여하지 않게 만든다.
    tf.keras.layers.Dense(10, activation='softmax')       # layer 4 : 10개의 노드를 가진 완전 연결층이다. softmax 활성화 함수는 10개의 클래스에 대한 확률 분포를 나타낸다. 출력 값들은 0~1로 구성되어 있는데, 10개의 클래스 값들의 총합은 1이다.
])

model.compile(
    optimizer='adam',                           # optimizer (최적화방법) : adam은 학습률을 동적으로 조정하는 최적화 알고리즘으로, 확률적 경사하강법을 기반으로 하여, 학습률을 개별 파라미터마다 다르게 적용한다.
    loss='sparse_categorical_crossentropy',     # loss (손실함수) : 손실함수는 모델의 예측값과 실제값 사이의 오차를 계산한다. sparse_categorical_crossentropy 는 레이블이 클래스의 인덱스 값으로 주어지는 경우에 사용된다. Dense(N)에서 N개의 클래스가 출력되는 다중 클래스 분류 문제에서 사용한다.
    metrics=['accuracy']                        # metrics (평가지표) : accuracy 정확도는 모델이 얼마나 정확하게 예측했는지 평가하는 지표이다.
)


In [None]:
# 훈련 데이터에서 랜덤으로 1개를 가져와 각 클래스에 대한 예측값 출력

print("===== 예측 =====")

random_index = np.random.randint(0, len(x_train))
print(f"random_index : {random_index}")

predictions = model(x_train[random_index:random_index+1]).numpy()
print(predictions)

# tf.nn.softmax 로 각 클래스에 대한 확률로 변환

print("===== 확룔 =====")

print(tf.nn.softmax(predictions).numpy())

# 각 예시에 대해 스칼라 손실을 반환하는 훈련용 손실 함수를 정의

print("===== 손실 =====")

loss_fn = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
print(loss_fn(y_train[random_index:random_index+1], predictions).numpy()) # 훈련되지 않은 모델은 무작위에 가까운 확률(각 클래스에 대해 1/10)을 제공하므로 초기 손실은 -tf.math.log(1/10) ~= 2.3에 근접


===== 예측 =====
random_index : 21791
[[0.04174706 0.12037563 0.0963625  0.22027431 0.08449361 0.11406481
  0.07463589 0.07271183 0.10362706 0.07170727]]
===== 확룔 =====
[[0.09424008 0.10194915 0.09953019 0.11265982 0.09835586 0.10130779
  0.09739105 0.09720385 0.10025586 0.09710626]]
===== 손실 =====
2.283281


In [None]:
# 모델 구성

model.compile(
    optimizer='adam',
    loss=loss_fn,
    metrics=['accuracy']
)


In [None]:
# 모델 훈련

model.fit(x_train, y_train, epochs=5)


Epoch 1/5


  output, from_logits = _get_logits(


[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 3ms/step - accuracy: 0.8624 - loss: 0.4788
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 3ms/step - accuracy: 0.9553 - loss: 0.1511
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 3ms/step - accuracy: 0.9687 - loss: 0.1062
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.9729 - loss: 0.0875
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 2ms/step - accuracy: 0.9772 - loss: 0.0729


<keras.src.callbacks.history.History at 0x79a0d99cf850>

In [None]:
# 모델 성능 확인

print("\n===== verbose=0 =====")
model.evaluate(x_test,  y_test, verbose=0)
print("\n===== verbose=1 =====")
model.evaluate(x_test,  y_test, verbose=1)
print("\n===== verbose=2 =====")
model.evaluate(x_test,  y_test, verbose=2)



===== verbose=0 =====

===== verbose=1 =====
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.9738 - loss: 0.0892

===== verbose=2 =====
313/313 - 0s - 1ms/step - accuracy: 0.9778 - loss: 0.0754


[0.07540352642536163, 0.9778000116348267]

In [None]:
# 모델의 확률을 반환

probability_model = tf.keras.Sequential([
    model,
    tf.keras.layers.Softmax()
])

random_index = np.random.randint(0, len(x_test))
print(f"random_index : {random_index}")
print(probability_model(x_test[random_index:random_index+1]))
print()


random_index : 1860
tf.Tensor(
[[0.08535644 0.08535643 0.08535645 0.08542903 0.08535641 0.23165767
  0.08535642 0.08535641 0.08535675 0.08541786]], shape=(1, 10), dtype=float32)
