In [1]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras import layers
from tensorflow.keras.datasets import mnist

# 예제 6.2 input_data 함수를 호출해 MNIST 데이터세트를 내려받는 코드
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

# 예제 6.3 합성곱 신경망 구축하기
model = tf.keras.Sequential([
    layers.Reshape(target_shape=(28, 28, 1), input_shape=(28, 28)),
    layers.Conv2D(5, (5, 5), activation='relu'),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Conv2D(5, (5, 5), activation='relu'),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Conv2D(20, (5, 5), activation='relu'),
    layers.Dropout(0.5),
    layers.Flatten(),
    layers.Dense(10, activation='softmax')
])

# 예제 6.4 합성곱 신경망이 데이터를 입력받는 부분
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 예제 6.7 직접 구현한 합성곱 신경망을 학습시키는 코드
batch_size = 50
model.fit(x_train, y_train, epochs=10, batch_size=batch_size)

# 예제 6.8 테스트 데이터를 활용해 학습된 신경망의 정확도를 구하는 코드
test_loss, test_acc = model.evaluate(x_test, y_test)
print("Test accuracy:", test_acc)

# 예제 6.9 테스트 데이터 0번을 시각화하는 코드
index = 0
plt.imshow(x_test[index], cmap='gray')
plt.show()

# 예제 6.10 합성곱 신경망이 0번째 손글씨 이미지를 예측하는 코드
image = np.expand_dims(x_test[index], axis=0)
predictions = model.predict(image)
predicted_class = np.argmax(predictions)
print("Predicted class:", predicted_class)

# 예제 6.11 합성곱 신경망이 예측한 데이터 라벨과 실제 데이터 라벨을 비교하는 코드
print("True class:", y_test[index])
print("Prediction matches true label:", predicted_class == y_test[index])

# 예제 6.12 테스트 데이터 924번을 시각화하는 코드
index = 924
plt.imshow(x_test[index], cmap='gray')
plt.show()

# 예제 6.11을 924번에 대해 실행한 결과
image = np.expand_dims(x_test[index], axis=0)
predictions = model.predict(image)
predicted_class = np.argmax(predictions)
print("True class:", y_test[index])
print("Predicted class:", predicted_class)
print("Prediction matches true label:", predicted_class == y_test[index])

# 예제 6.13 합성곱 신경망이 테스트 데이터 924번을 어떻게 예측하는지 숫자별로 확률을 보여주는 코드
for i, prob in enumerate(predictions[0]):
    print(f"Class {i}: {prob * 100:.2f}% probability")

# 예제 6.14 이미지 하나가 특정 은닉층까지 통과한 결과물을 units 변수에 저장하고 호출하는 함수
def get_activations(model, layer_name, stimuli):
    intermediate_layer_model = tf.keras.Model(inputs=model.input,
                                              outputs=model.get_layer(layer_name).output)
    return intermediate_layer_model.predict(np.expand_dims(stimuli, axis=0))

# 예제 6.15 은닉층 연산 결과를 시각화하는 코드
import math
def plot_activation(units):
    filters = units.shape[3]
    plt.figure(figsize=(20, 20))
    n_columns = 5
    n_rows = math.ceil(filters / n_columns) + 1
    for i in range(filters):
        plt.subplot(n_rows, n_columns, i + 1)
        plt.title('Filter ' + str(i))
        plt.imshow(units[0, :, :, i], interpolation="nearest", cmap="gray")

# 예제 6.16 첫 번째 은닉층을 시각화하는 코드
hidden_1_activations = get_activations(model, 'conv2d', x_test[index])
plot_activation(hidden_1_activations)

# 예제 6.17 합성곱 신경망의 두 번째 은닉층을 시각화하는 코드
hidden_2_activations = get_activations(model, 'max_pooling2d', x_test[index])
plot_activation(hidden_2_activations)

# 예제 6.18 세 번째 은닉층을 시각화하는 코드
hidden_3_activations = get_activations(model, 'dropout', x_test[index])
plot_activation(hidden_3_activations)

# 예제 6.18 MNIST 손글씨 테스트 데이터베이스 223번째 데이터를 불러오는 코드
image_223 = x_test[223]

# 2개 이상의 데이터에 대한 필터 결과 출력
get_activations_multi(model, 'conv2d', (x_test[924], x_test[223]))
get_activations_multi(model, 'max_pooling2d', (x_test[924], x_test[223]))
get_activations_multi(model, 'dropout', (x_test[924], x_test[223]))



Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz




ValueError: Exception encountered when calling layer "conv2d_2" (type Conv2D).

Negative dimension size caused by subtracting 5 from 4 for '{{node conv2d_2/Conv2D}} = Conv2D[T=DT_FLOAT, data_format="NHWC", dilations=[1, 1, 1, 1], explicit_paddings=[], padding="VALID", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true](Placeholder, conv2d_2/Conv2D/ReadVariableOp)' with input shapes: [?,4,4,5], [5,5,5,20].

Call arguments received by layer "conv2d_2" (type Conv2D):
  • inputs=tf.Tensor(shape=(None, 4, 4, 5), dtype=float32)