In [24]:
# 합성곱 신경망(CNN)**을 구현한 예제 코드입니다. 
# 이 예제에서는 MNIST 데이터셋(손글씨 숫자 이미지)을 사용하여 CNN 모델을 학습하는 과정을 보여줍니다.

# 준비단계

## 라이브러리

In [10]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Conv2D, MaxPooling2D, Flatten
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

## 데이터 준비 및 전처리

In [11]:
# 데이터 로드 및 전처리:

# mnist.load_data() 함수를 사용해 MNIST 데이터셋(손글씨 숫자 이미지)을 로드합니다.
# 입력 데이터를 CNN에서 처리할 수 있도록 28x28x1 크기의 흑백 이미지로 변환합니다.
# 이미지를 0~1 사이의 범위로 정규화하여 학습이 원활하게 이루어지도록 합니다.
# 레이블(정답)을 원-핫 인코딩하여 10개의 클래스로 변환합니다.


In [12]:
# MNIST 데이터셋 로드 (훈련 데이터와 테스트 데이터 분리)
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 데이터 전처리 (28x28 크기의 이미지를 28x28x1 크기로 변환)
X_train = X_train.reshape(X_train.shape[0], 28, 28, 1).astype('float32')
X_test = X_test.reshape(X_test.shape[0], 28, 28, 1).astype('float32')

# 이미지 픽셀 값을 0~1 범위로 정규화
X_train /= 255
X_test /= 255

# 레이블(정답)을 원-핫 인코딩 (0~9 숫자를 10개의 클래스 값으로 변환)
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

# 모델링

## CNN 모델 정의

In [13]:
# CNN 모델 정의:
# 첫 번째 합성곱 층(Conv2D): 32개의 3x3 필터를 적용하여 이미지에서 특징을 추출합니다. 활성화 함수로 ReLU를 사용합니다.
# 최대 풀링 층(MaxPooling2D): 2x2 크기의 풀링 필터를 사용하여 차원을 줄이고, 중요한 특징만 남깁니다.
# 두 번째 합성곱 층과 최대 풀링 층도 같은 방식으로 적용되지만, 필터 개수를 64개로 설정합니다.
# Flatten 층: 합성곱과 풀링을 거친 출력을 1차원 벡터로 변환하여 완전 연결층에 전달합니다.
# 완전 연결층(Dense): 128개의 뉴런을 가지며, 활성화 함수로 ReLU를 사용합니다.
# 출력층(Dense): 10개의 클래스를 분류하기 위해 Softmax 활성화 함수를 사용합니다.

In [14]:
# CNN 모델 정의
model = Sequential()

# 첫 번째 합성곱 층 (Conv2D): 32개의 3x3 필터, 활성화 함수: ReLU, 입력 크기: 28x28x1
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)))

# 풀링 층 (MaxPooling2D): 2x2 크기의 풀링 필터
model.add(MaxPooling2D(pool_size=(2, 2)))

# 두 번째 합성곱 층 (Conv2D): 64개의 3x3 필터, 활성화 함수: ReLU
model.add(Conv2D(64, kernel_size=(3, 3), activation='relu'))

# 두 번째 풀링 층 (MaxPooling2D): 2x2 크기의 풀링 필터
model.add(MaxPooling2D(pool_size=(2, 2)))

# 완전 연결층에 전달하기 위해 Flatten으로 데이터를 1차원으로 변환
model.add(Flatten())

# 완전 연결층 (Dense): 128개의 노드, 활성화 함수: ReLU
model.add(Dense(128, activation='relu'))

# 출력층 (Dense): 10개의 노드, 활성화 함수: Softmax (10개의 클래스)
model.add(Dense(10, activation='softmax'))

## 모델 컴파일

In [16]:
# 손실 함수로 categorical_crossentropy를 사용하며, 이는 다중 클래스 분류 문제에서 사용하는 손실 함수입니다.
# 최적화 방법으로 Adam을 사용하여 경사 하강법을 최적화합니다.
# 성능 평가 지표로 **accuracy(정확도)**를 사용합니다.

In [17]:
# 모델 컴파일 (손실 함수: Categorical Crossentropy, 최적화 방법: Adam, 평가지표: Accuracy)
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

## 모델 학습

In [18]:
# 10 에포크 동안 학습하며, 배치 크기 128로 설정하여 학습을 진행합니다.
# 학습 중간에 테스트 데이터를 사용해 검증도 수행합니다.

In [19]:
# 모델 학습
history = model.fit(X_train, y_train, epochs=10, batch_size=128, validation_data=(X_test, y_test))

Epoch 1/10
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 39ms/step - accuracy: 0.8518 - loss: 0.4837 - val_accuracy: 0.9818 - val_loss: 0.0586
Epoch 2/10
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m19s[0m 41ms/step - accuracy: 0.9805 - loss: 0.0651 - val_accuracy: 0.9863 - val_loss: 0.0428
Epoch 3/10
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m19s[0m 41ms/step - accuracy: 0.9869 - loss: 0.0412 - val_accuracy: 0.9872 - val_loss: 0.0369
Epoch 4/10
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 42ms/step - accuracy: 0.9911 - loss: 0.0284 - val_accuracy: 0.9869 - val_loss: 0.0387
Epoch 5/10
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 43ms/step - accuracy: 0.9925 - loss: 0.0242 - val_accuracy: 0.9880 - val_loss: 0.0353
Epoch 6/10
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 43ms/step - accuracy: 0.9942 - loss: 0.0190 - val_accuracy: 0.9893 - val_loss: 0.0346
Epoch 7/10
[1m4

## 모델 평가

In [None]:
# 학습이 완료되면 테스트 데이터셋에서 모델 성능을 평가하고 정확도(accuracy)를 출력합니다.

In [20]:
# 모델 평가
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Test Accuracy: {accuracy * 100:.2f}%')


[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 7ms/step - accuracy: 0.9876 - loss: 0.0378
Test Accuracy: 99.05%


## 예측

In [21]:
# 학습된 모델을 사용해 테스트 데이터에 대한 예측값을 생성합니다.

# 결과 출력
# 모델 학습이 완료되면 다음과 같은 정보가 출력됩니다:

# Test Accuracy: 테스트 데이터셋에서의 정확도를 퍼센트로 표시합니다

In [23]:
# 예측 (테스트 데이터에 대한 예측)
predictions = model.predict(X_test)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 5ms/step


# 종합

In [None]:
# 필요한 라이브러리 임포트
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Conv2D, MaxPooling2D, Flatten
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# MNIST 데이터셋 로드 (훈련 데이터와 테스트 데이터 분리)
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 데이터 전처리 (28x28 크기의 이미지를 28x28x1 크기로 변환)
X_train = X_train.reshape(X_train.shape[0], 28, 28, 1).astype('float32')
X_test = X_test.reshape(X_test.shape[0], 28, 28, 1).astype('float32')

# 이미지 픽셀 값을 0~1 범위로 정규화
X_train /= 255
X_test /= 255

# 레이블(정답)을 원-핫 인코딩 (0~9 숫자를 10개의 클래스 값으로 변환)
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

# CNN 모델 정의
model = Sequential()

# 첫 번째 합성곱 층 (Conv2D): 32개의 3x3 필터, 활성화 함수: ReLU, 입력 크기: 28x28x1
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)))

# 풀링 층 (MaxPooling2D): 2x2 크기의 풀링 필터
model.add(MaxPooling2D(pool_size=(2, 2)))

# 두 번째 합성곱 층 (Conv2D): 64개의 3x3 필터, 활성화 함수: ReLU
model.add(Conv2D(64, kernel_size=(3, 3), activation='relu'))

# 두 번째 풀링 층 (MaxPooling2D): 2x2 크기의 풀링 필터
model.add(MaxPooling2D(pool_size=(2, 2)))

# 완전 연결층에 전달하기 위해 Flatten으로 데이터를 1차원으로 변환
model.add(Flatten())

# 완전 연결층 (Dense): 128개의 노드, 활성화 함수: ReLU
model.add(Dense(128, activation='relu'))

# 출력층 (Dense): 10개의 노드, 활성화 함수: Softmax (10개의 클래스)
model.add(Dense(10, activation='softmax'))

# 모델 컴파일 (손실 함수: Categorical Crossentropy, 최적화 방법: Adam, 평가지표: Accuracy)
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 모델 학습
history = model.fit(X_train, y_train, epochs=10, batch_size=128, validation_data=(X_test, y_test))

# 모델 평가
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Test Accuracy: {accuracy * 100:.2f}%')

# 예측 (테스트 데이터에 대한 예측)
predictions = model.predict(X_test)
