# Deep Learning - CNN

So far, the structure of our neural network treats all inputs interchangeably.
- No relationships between the individual inputs.
- Just an ordered set of variables.
- We want to incorporate domain knowledge into the architecture of a Neural Network.

The convolutional network we discuss here was developed to deal with image data.  
Increasingly, these approaches are being applied to more common analytic problems of regression and classification.  

CNN은 Convolutional Neural Network의 약자로, 주로 이미지 처리에 사용되는 딥러닝 모델의 한 종류입니다. CNN은 이미지 내에서 패턴을 인식하고 이해하는 데 특히 효과적입니다.  

일반적인 Neural Network와의 주요 차이점은 다음과 같습니다:  

1. **로컬 연결(Local Connectivity)**: CNN은 입력 이미지의 특정 지역에 대해서만 연결되는 것이 일반적입니다. 이는 합성곱 연산을 통해 입력 이미지의 지역적 특징을 추출하는 데 유리합니다.

2. **파라미터 공유(Parameter Sharing)**: CNN에서는 합성곱층에서 사용되는 필터(커널)가 이미지 전체에 대해 공유됩니다. 이는 모델의 학습 파라미터를 줄이고 효율적인 특징 추출을 가능하게 합니다.

3. **공간적 계층 구조(Spatial Hierarchies)**: CNN은 여러 층의 합성곱 및 풀링층을 통해 입력 이미지의 공간적 계층 구조를 학습할 수 있습니다. 이를 통해 저수준의 특징에서 고수준의 추상적인 개념까지 학습할 수 있습니다.

요약하면, CNN은 이미지 처리에 특화되어 있고, 로컬 연결과 파라미터 공유를 통해 효율적으로 특징을 추출하며, 공간적 계층 구조를 학습하여 이미지 분류, 객체 검출, 분할 등 다양한 작업에 활용됩니다.  

CNN에서는 입력 이미지의 각 지역에 대해 별도의 가중치가 적용되고, 이 가중치는 해당 지역의 특징을 인식하는 데 사용됩니다. 이는 전통적인 Fully Connected Neural Network와 달리, 모든 입력과 출력 간에 연결이 있는 것이 아니라, 입력 이미지의 지역적 특징을 고려하여 연결되는 것을 의미합니다. 이로써 CNN은 이미지의 지역적 구조를 인식하고 공간적 계층 구조를 학습할 수 있습니다.

203_딥러닝_CNN_image_1은 Input to Output Scheme을, 203_딥러닝_CNN_Image_2는 이미지의 지역정 특징을 강조하는 데 사용되는 방법을 간단하게 표현한 것이다.  



수용 영역(Receptive field)은 신경망의 특정 뉴런이 입력에 반응하는 영역을 의미합니다. 다시 말해, 특정 뉴런이 활성화되기 위해 필요한 입력 데이터의 영역입니다. 이것은 특정 뉴런이 본 것에 대한 영역이며, 그 뉴런이 인식할 수 있는 영역의 크기를 결정합니다.

수용 영역은 이미지 처리에서 자주 사용되는 용어입니다. 예를 들어, 컨볼루션 신경망(Convolutional Neural Network, CNN)에서 각 레이어의 각 뉴런은 입력 이미지의 특정 부분에 반응합니다. 이때 각 뉴런의 수용 영역은 해당 뉴런에 영향을 미치는 입력 이미지의 영역을 나타냅니다.

수용 영역의 크기는 신경망의 아키텍처와 레이어의 종류에 따라 달라집니다. 일반적으로 레이어가 깊어질수록 수용 영역의 크기가 커지는 경향이 있습니다. 이는 더 깊은 레이어에서는 더 넓은 영역의 특징을 인식해야 하기 때문입니다.

레이어가 깊어질수록 수용 영역의 크기가 커지는 이유는 주로 두 가지 요인에 기인합니다:

1. **다단계 특징 추출**: 심층 신경망은 보통 입력 데이터를 다단계로 처리합니다. 첫 번째 층은 입력 데이터의 초기 특징을 감지하고, **이후의 각 층은 이전 층의 특징을 결합하여 더 추상적인 특징을 추출합니다.** 이렇게 다단계로 처리되는 과정에서 각 층은 더 넓은 영역의 특징을 인식하도록 학습됩니다.

2. **컨볼루션 연산의 반복**: 컨볼루션 신경망에서는 일반적으로 여러 개의 컨볼루션 층이 쌓여 있습니다. 각 컨볼루션 층은 이전 층의 출력을 입력으로 받아 필터를 적용하여 새로운 특징을 추출합니다. 이렇게 층이 쌓일수록 각 픽셀은 더 많은 컨볼루션 연산을 거치게 되며, 이는 결국 더 넓은 수용 영역을 갖는 특징을 인식하는데 도움이 됩니다.

이렇게 레이어가 깊어질수록 수용 영역의 크기가 커지는 것은 신경망이 입력 데이터의 다양한 공간적 특징을 더 잘 이해하고 이를 기반으로 추상적인 표현을 학습할 수 있도록 합니다. 이는 보다 복잡한 문제를 해결하는 데 도움이 되며, 특히 이미지 인식 및 컴퓨터 비전과 같은 작업에서 효과적입니다.

---

# 1 MNIST 손글씨 인식 - CNN

- [CNN(Convolutional Neural Network)](https://gruuuuu.github.io/machine-learning/cnn-doc)

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

plt.rc('figure', figsize=(10, 6))

from matplotlib import rcParams
rcParams['font.family'] = 'Gulim'
rcParams['font.size'] = 10
rcParams['axes.unicode_minus'] = False

#### 패키지 임포트

In [None]:
from keras.utils import np_utils

from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
from keras.callbacks import ModelCheckpoint,EarlyStopping

import tensorflow as tf

In [None]:
# seed 값 설정
np.random.seed(0)
tf.random.set_seed(3)

#### 데이터 로드 및 분할

In [None]:
# MNIST 데이터 불러오기
from keras.datasets import mnist

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 28, 28, 1).astype('float32') / 255
X_test = X_test.reshape(X_test.shape[0], 28, 28, 1).astype('float32') / 255

y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)

#### 컨볼루션 신경망 모델 생성 및 설정

In [None]:
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3), input_shape=(28, 28, 1), activation='relu'))
# 이 층에는 총 32개의 필터가 있으며, 각 필터의 사이즈는 3x3이고, 투입될 사진 사이즈는 28x28이다. 1은 흑백이라 채널1 번으로 한 거.
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=2))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128,  activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))

#### 모델 계층 확인

In [None]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 26, 26, 32)        320       
                                                                 
 conv2d_1 (Conv2D)           (None, 24, 24, 64)        18496     
                                                                 
 max_pooling2d (MaxPooling2D  (None, 12, 12, 64)       0         
 )                                                               
                                                                 
 dropout (Dropout)           (None, 12, 12, 64)        0         
                                                                 
 flatten (Flatten)           (None, 9216)              0         
                                                                 
 dense (Dense)               (None, 128)               1179776   
                                                        

#### 모델 컴파일

In [None]:
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

#### 모델 업데이트 및 저장 설정

In [None]:
modelpath="./model/model_mnist_cnn{epoch:02d}-{val_loss:.4f}.hdf5"
checkpointer = ModelCheckpoint(filepath=modelpath, monitor='val_loss', verbose=1, save_best_only=True)

#### 학습 자동 중단 설정

In [None]:
early_stopping_callback = EarlyStopping(monitor='val_loss', patience=10)

#### 모델 학습 실행 및 저장

In [None]:
%%time
# 30분 소요
epoch = 30
history = model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=epoch, batch_size=200, verbose=0,
                    callbacks=[early_stopping_callback,checkpointer])

#### 모델 평가

In [None]:
# 테스트 정확도 출력
print("\n Test Accuracy: %.4f" % (model.evaluate(X_test, y_test)[1]))


 Test Accuracy: 0.9563


#### 학습 진행 과정
- history
 - loss: 훈련 손실값
 - accuracy: 훈련 정확도
 - val_loss: 검증 손실값
 - val_accuracy: 검증 정확도

In [None]:
# 그래프로 표현
plt.plot(history.history['val_loss'], marker='.', c='red', label='Validation Loss')
plt.plot(history.history['loss'],     marker='.', c='blue',label='Train Loss')

plt.grid()
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend(loc='upper right')

plt.title('학습 진행에 따른 학습 데이터와 검증 데이터의 에러')
plt.show()

NameError: name 'history' is not defined

#### 결과 예측

In [None]:
# 예측 확률
pred_prob = model.predict(X_test)
pred_prob

In [None]:
# 결과 예측
pred = np.argmax(pred_prob, axis=1).flatten()
pred

#### 결과 확인

In [None]:
plt.imshow(X_test[0].reshape(28,-1))
#X_test의 0번째 행의 데이터를 reshape(28x28인데 -1쓴 이유는 자동으로 결정하라는 뜻)해서 image로 보여줘.
plt.title(f'Label: {pred[0]}')
plt.show()

In [None]:
fig, axes = plt.subplots(2, 5, figsize=(10, 5), subplot_kw={'xticks':(), 'yticks': ()})
for i, (ax, img) in enumerate(zip(axes.ravel(), X_test[:10].reshape(10, 28,-1))):
    ax.imshow(img)
    ax.set_xlabel(f'Label: {pred[i]}')

#### 결과 평가

In [None]:
y_test_1d = np.argmax(y_test, axis=1).flatten()

In [None]:
from sklearn.metrics import classification_report
print(classification_report(y_test_1d, pred))

---

In [None]:
# End of file