<a href="https://colab.research.google.com/github/ssosoo/2024_DS60/blob/main/%EC%86%8C%ED%94%84%ED%8A%B8%EB%A7%A5%EC%8A%A4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Activation
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.datasets import mnist


In [2]:
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 0us/step


In [3]:
print("train data (count, row, column) : " + str(X_train.shape))
print("test data (count, row, column) : " + str(X_test.shape))

train data (count, row, column) : (60000, 28, 28)
test data (count, row, column) : (10000, 28, 28)


**MNIST 손글씨 데이터 정규화**

일반적으로 이미지의 픽셀 값은 0~255 범위의 정수값을 가진다. 따라서 모든 픽셀 값을 0~1사이로 정규화하기 위해 255로 나눈다.

In [4]:
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

In [5]:
print("train target (count) : " + str(y_train.shape))
print("test target (count) : " + str(y_test.shape))

train target (count) : (60000,)
test target (count) : (10000,)


**데이터 단순화**

지역적 정보 사용 없이 단순히 정규화된 입력값만 가지고 숫자 분류를 목적으로 한다. 따라서 행/렬의 구분없이 단순히 784(28*28)의 배열로 데이터를 단순화한다.

In [6]:
input_dim = 784
X_train = X_train.reshape(60000, input_dim)
X_test = X_test.reshape(10000, input_dim)

In [7]:
# X 데이터들이 2차원에서 2차원으로 변경된 것을 확인
print(X_train.shape)
print(y_train.shape)
print(X_test.shape)
print(y_test.shape)

(60000, 784)
(60000,)
(10000, 784)
(10000,)


**소프트맥스**

MNIST의 손글씨 숫자를 0부터 9로 구분한다.

1. 로지스틱 회귀를 하면 각 값은 0~1사이다.
2. 학습시 실제값과의 크로스 엔트로피를 계산하여 실제값을 원 핫인코딩(one hot encoding)으로 변환한다.

In [8]:
num_classes = 10
y_train = to_categorical(y_train, num_classes)
y_test = to_categorical(y_test, num_classes)

print(y_train[0])

[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]


In [9]:
model = Sequential()
model.add(Dense(input_dim = input_dim, units = 10, activation = 'softmax'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


**모델 학습**

10개의 클래스 분류를 목적으로 두기 때문에 categorical 크로스 엔트로피를 비용함수로 사용하여 최적의 회귀계수 w와 편향을 구한다.

In [12]:
model.compile(optimizer = 'sgd', loss = 'categorical_crossentropy',
              metrics = ['accuracy'])
model.fit(X_train, y_train, batch_size = 2048, epochs = 10, verbose = 0)

<keras.src.callbacks.history.History at 0x7aaaca9fa5c0>

**모델 테스트**

score[0] : 손실도

score[1] : 정확도




---


model.summary(): 모델 요약
model.layers[0].weights: 회귀계수와 편향계수 확인

In [17]:
score = model.evaluate(X_test, y_test)
print('Test accuracy: ', score[1])

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.7828 - loss: 1.0623
Test accuracy:  0.8072999715805054
