In [1]:
import tensorflow.keras as keras
keras.__version__

'2.9.0'

# Introduction to convnets

이 노트북에는 [Deep Learning with Python](https://www.manning.com/books/deep-learning-with-python?a_aid=keras&a_bid=76564dff)의 5 장 섹션 1에있는 코드 샘플이 포함되어 있습니다. 원본 텍스트에는 훨씬 더 많은 내용, 특히 추가 설명 및 그림이 포함되어 있습니다.이 노트북에서는 소스 코드와 관련 주석 만 찾을 수 있습니다.

----

먼저, 매우 간단한 convnet 예제를 실제적으로 살펴 보겠습니다. convnet을 사용하여 fully connected 네트워크를 사용하여수행 한 작업 인 MNIST 숫자를 분류합니다 (테스트 정확도는 97.8 %였습니다). convnet은 매우 기본적이지만 2 장의 fully connected 모델의 정확도에 비해 좋은 성능을 보일 것입니다.


아래 6 줄의 코드는 기본적인 convnet의 모습을 보여줍니다. 'Conv2D'및 'MaxPooling2D' 레이어의 스택입니다. 우리는 그들이 구체적으로 무엇을하는지 분. 중요한 것은 convnet이`(image_height, image_width, image_channels)`형태의 입력 텐서 (배치 차원 제외)를 취한다는 것입니다.
이 경우 MNIST 이미지 형식 인`(28, 28, 1)`크기의 입력을 처리하도록 convnet을 구성합니다. 우리는 인수`input_shape = (28, 28, 1)`을 첫 번째 레이어에 전달합니다.

In [2]:
from tensorflow.keras import layers
from tensorflow.keras import models

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1), padding='same'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

모델의 아키텍쳐를 요약하면 다음과 같습니다:

In [3]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 28, 28, 32)        320       
                                                                 
 max_pooling2d (MaxPooling2D  (None, 14, 14, 32)       0         
 )                                                               
                                                                 
 conv2d_1 (Conv2D)           (None, 12, 12, 64)        18496     
                                                                 
 max_pooling2d_1 (MaxPooling  (None, 6, 6, 64)         0         
 2D)                                                             
                                                                 
 conv2d_2 (Conv2D)           (None, 4, 4, 64)          36928     
                                                                 
Total params: 55,744
Trainable params: 55,744
Non-traina

위에서 모든`Conv2D` 및`MaxPooling2D` 레이어의 출력 형태가`(height, width, channels)`모양의 3D 텐서임을 알 수 있습니다. 너비와 높이는
네트워크에서 더 깊숙이 갈수록 크기가 줄어드는 경향이 있습니다. 채널 수는 전달 된 첫 번째 인수에 의해 제어됩니다.
'Conv2D'레이어 (예 : 32 또는 64).

다음 단계는 우리의 마지막 출력 텐서 (`(3, 3, 64)`모양)를 사용자와 같이 fully connected 분류기 네트워크에 입력하는 것입니다. 이미 익숙한 : 'Dense'레이어 스택. 이러한 분류기는 1D 인 벡터를 처리하지만 현재 출력은 3D 텐서입니다. 따라서 먼저 3D 출력을 1D로 평면화 한 다음 위에 'Dense'레이어를 몇 개 추가해야합니다.

In [4]:
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

We are going to do 10-way classification, so we use a final layer with 10 outputs and a softmax activation. Now here's what our network 
looks like:

In [5]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 28, 28, 32)        320       
                                                                 
 max_pooling2d (MaxPooling2D  (None, 14, 14, 32)       0         
 )                                                               
                                                                 
 conv2d_1 (Conv2D)           (None, 12, 12, 64)        18496     
                                                                 
 max_pooling2d_1 (MaxPooling  (None, 6, 6, 64)         0         
 2D)                                                             
                                                                 
 conv2d_2 (Conv2D)           (None, 4, 4, 64)          36928     
                                                                 
 flatten (Flatten)           (None, 1024)              0

보시다시피,`(3, 3, 64)`출력은 두 개의`Dense` 레이어를 거치기 전에`(576,)`모양의 벡터로 변환되었습니다.

이제 MNIST 숫자로 convnet을 훈련시켜 보겠습니다.

In [6]:
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


In [10]:
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=10, batch_size=128)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7f7ebc8751f0>

test 데이터를 이용해서 검증:

In [11]:
test_loss, test_acc = model.evaluate(test_images, test_labels)



In [12]:
test_acc

0.9922000169754028

fully connected 네트워크의 테스트 정확도는 97.8 % 였지만 기본 convnet의 테스트 정확도는 99% 이상입니다.