# CNN
- 완전 연결 네트워크의 문제점으로부터 시작
- fully connected layer의 문제점을 해결하기 위한 방안으로 나옴
- 합성곱 계층은 입력 이미지가 커져도 튜닝해야 할 매개변구 개수에 영향을 주지 않음
- 어떠한 이미지에도 차원 수와 상관없이 적용 가능

# 컨볼루션 연산
- 필터 연산 
입력 데이터에 필터를 통한 어떠한 연산을 진행
필터에 대으앟는 원소끼리 곱하고, 그 합을 구함
연산이 완료된 결과 데이터를 특징 맵이라 부름

- 필터
커널이라고도 칭함
흔히 사진 어플에서 사용하는 '이미지 필터'와 비슷한 개념
필터의 사이즈는 '거의 항상 홀수'
짝수이면 패딩이 비대칭이 되어버림
왼쪽, 오른쪽을 다르게 주어야 함
중심위치가 존재, 즉 구별된 하나의 픽셀(중심 픽셀)이 존재

필터의 학습 파라미터 개수는 입력 데이터의 크기와 상관없이 일정 > 과적합 방지

- 일반적으로 합성곱 연산을 한 후의 데이터의 크기는
(n - f + 1) X (n - f + 1)
n = 입력 데이터의 크기
f = 필터(커널)의 크기

# 패딩과 스트라이드
- 필터(커널) 사이즈와 함께 입력 이미지와 출력 이미지의 사이즈를 결정하기 위해 사용
- 사용자가 결정할 수 있음

# 패딩
- 입력 데이터의 주변을 특정 값으로 채우는 기법 > 주로 0으로 많이 채움
(n+2p-f+1) x (n+2p-f+1)
- 'valid 와 'same'
    - valid : padding을 주지 않음
- 'same'
    - 패딩을 주어 입력 이미지의 크기와 연산 후의 이미지 크기를 같게 함
    - 만약, 필터(커널)의 크기가 k이면, 패딩의 크기는 p= 2/k-1(단, stride = 1)

# 스트라이드 
- 필터를 적용하는 간격을 의미

In [30]:
# 저수준 api 사용
import tensorflow as tf

In [31]:
k, d, n = (3, 16, 32)

In [32]:
kenels_size = [k ,k, d, n]
glorot_uni_initializer = tf.initializers.GlorotUniform()

kernels = tf.Variable(glorot_uni_initializer(kenels_size),
                            trainable = True, name = 'filters')
bias = tf.Variable(tf.zeros(shape = [n]), trainable = True, name= 'bias')

In [33]:
@tf.function
def conv_layer(x, kernels, bias, s):
    z = tf.nn.conv2d(x, kernels, strides = [1, s, s, 1], paddind = 'VALID')
    return tf.nn.relu(z + bias)

In [34]:
class SimpleCNN(tf.keras.layers.Layer):
    def __init__(self, num_kernels = 32, kernel_size = (3,3), stride = 1):
        super().__init__()
        self.num_kernels = num_kernels
        self.kernel_size = kernel_size
        self.stride = stride

def build(self, input_shape):
    input_channels = input_shape[-1]
    
    kernels_shape = (*self.kernel_size, input_channels, self.num_kernels)
    glorot_init = tf.initializers.GlorotUniform()
    self.kernels =self.add_weight(
        name = 'kernels', shape = kernels_shape, initializer = glorot_init, trainabel = True)
    self.bias = self.add_weight(name = 'bias', shape = (self.num_kernels,),
                                initializer = 'random_normal', trainable =True)
    
def call(self, inputs):
    return conv_layer(input, self.kernels, self.bias, self.stride)


In [35]:
# 고수준 api  사용
from tensorflow.keras.layers import Conv2D

In [36]:
s = 1

In [37]:
conv = Conv2D(filters = n, kernel_size = (k, k), strides = s,
              padding = 'valid', activation='relu')

# 풀링
- 필터(커널) 사이즈 내에서 특정 값을 추출하는 과정

# 맥스 풀링
- 가장 많이 사용됨
- 일반적으로 stride = 2, kernel_size = 2 를 통해 특징맵의 크기를 절반으로 줄이는 역할
- 모델이 물체의 주요한 특징을 학습할 수 있도록 해줌
>> 일정 부분의 최대값만 출력해서 연산한다.

# 평균 풀링
- 필터내의 픽셀값의 평균을 구하는 과정
- 과거에 많이 사용, 맥스풀링과 비슷함

In [38]:
from tensorflow.keras.layers import AvgPool2D, MaxPool2D

In [39]:
k, s = (3, 1)

In [40]:
avg_pool = AvgPool2D(pool_size = k, strides = [s,s], padding = 'valid')
max_pool = MaxPool2D(pool_size = k, strides = [s,s], padding = 'valid')

# 완전 연결 계층
- 입력으로 받은 텐서를 1차원으로 평면화(flatten) 함
- Dense Layer라고도 함

In [41]:
from tensorflow.keras.layers import Dense

In [42]:
output_size = 64

In [43]:
fc = Dense (units = output_size, activation='relu')

# LeNet-5

In [44]:
from tensorflow.keras import Model
from tensorflow.keras.layers import Conv2D, MaxPool2D, Flatten, Dense
from tensorflow.keras.datasets import mnist

import numpy as np

In [45]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()

In [46]:
x_train, x_test, =x_train[..., np.newaxis], x_test[..., np.newaxis]

In [47]:
print(x_train.shape)
print(y_train.shape)
print(x_test.shape)
print(y_test.shape)

'''
(60000, 28, 28, 1)
(60000,)
(10000, 28, 28, 1)
(10000,)
'''

(60000, 28, 28, 1)
(60000,)
(10000, 28, 28, 1)
(10000,)


'\n(60000, 28, 28, 1)\n(60000,)\n(10000, 28, 28, 1)\n(10000,)\n'

In [48]:
print(x_train[0 ,:,:, 0])

[[  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   3  18  18  18 126 136
  175  26 166 255 247 127   0   0   0   0]
 [  0   0   0   0   0   0   0   0  30  36  94 154 170 253 253 253 253 253
  225 172 253 242 195  64   0   0   0   0]
 [  0   0   0   0   0   0   0  49 238 253 253 253 253 253 253 253 253 251
   93  82  82  56  39   0   0   0   0   0]
 [  0   0   0   0   0   0   0  18 219 253 253 253 253 253 198 18

In [49]:
x_train, x_test = x_train / 255.0, x_test / 255.0

In [50]:
print(x_train[0, :,:,0])

[[0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.        ]
 [0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.        ]
 [0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.        ]
 [0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.         0.         0.
  0.         0.    

In [51]:
num_classes = 10
epochs = 100
batch_size = 32

In [54]:
class LeNet5(Model):
    def __init__(self, num_classes):
        super(LeNet5, self).__init__()
        self.conv1 = Conv2D(6, kernel_size = (5,5), padding = 'same', activation = 'relu')
        self.conv2 = Conv2D(16, kernel_size = (5,5), activation = 'relu')
        self.max_pool = MaxPool2D(pool_size = (2, 2))
        self.flatten = Flatten()
        self.dense1 = Dense(120, activation = 'relu')
        self.dense2 = Dense(84, activation = 'relu')
        self.dense3 = Dense(num_classes, activation='softmax')
        
def call(self, input_data):
    x = self.max_pool(self.conv1(input_data))
    x = self.max_pool(self.conv2(x))
    x = self.flatten(x)
    x = self.dense3(self.dense2(self.dense1(x)))
    
    return x
        

In [55]:
model = LeNet5(num_classes)

In [59]:
model.compile(optimizer='adam',
              loss = 'sparse_categorical_crossentropy',
              metrics = ['accuracy'])

In [60]:
callbacks = [tf.keras.callbacks.EarlyStopping(patience = 3, monitor = 'val_loss'),
             tf.keras.callbacks.TensorBoard(log_dir = './logs', histogram_freq=1)]

In [61]:
model.fit(x_train,y_train,
          batch_size = batch_size,
          epochs = epochs,
          validation_data=(x_test, y_test),
          callbacks = callbacks )


Epoch 1/100


NotImplementedError: in user code:

    File "C:\ProgramData\Anaconda3\envs\tf270gpu\lib\site-packages\keras\engine\training.py", line 878, in train_function  *
        return step_function(self, iterator)
    File "C:\ProgramData\Anaconda3\envs\tf270gpu\lib\site-packages\keras\engine\training.py", line 867, in step_function  **
        outputs = model.distribute_strategy.run(run_step, args=(data,))
    File "C:\ProgramData\Anaconda3\envs\tf270gpu\lib\site-packages\keras\engine\training.py", line 860, in run_step  **
        outputs = model.train_step(data)
    File "C:\ProgramData\Anaconda3\envs\tf270gpu\lib\site-packages\keras\engine\training.py", line 808, in train_step
        y_pred = self(x, training=True)
    File "C:\ProgramData\Anaconda3\envs\tf270gpu\lib\site-packages\keras\utils\traceback_utils.py", line 67, in error_handler
        raise e.with_traceback(filtered_tb) from None
    File "C:\ProgramData\Anaconda3\envs\tf270gpu\lib\site-packages\keras\engine\training.py", line 475, in call
        raise NotImplementedError('When subclassing the `Model` class, you should '

    NotImplementedError: Exception encountered when calling layer "le_net5_2" (type LeNet5).
    
    When subclassing the `Model` class, you should implement a `call()` method.
    
    Call arguments received:
      • inputs=tf.Tensor(shape=(32, 28, 28, 1), dtype=float32)
      • training=True
      • mask=None


# Visual Geometry Group Net
- 활성화 함수로 ReLU 사용, Dropout 적용
- 합성곱과 풀링 계층으로 구성된 블록과 분류를 위한 완전 연결계층으로 결합된 전형적인 구조
- 인위적으로 데이터 셋을 늘림
    - 이미지 변환, 좌우 반전 등의 변환을 시도
- 몇 개의 합성곱 계층과 최대-풀링 계층이 따르는 5개의 블록과 3개의 완전연결계층으로 구성
- 모든 합성곱과 최대-풀링 계층에 padding = 'same' 적용
- 합성곱 계층에는 stride = 1
- 특징맵 깊이를 증가시킴
- 척도 변경을 통한 데이터 보강

In [62]:
import tensorflow as tf

In [63]:
vgg_net =tf.keras.applications.VGG16(include_top = True, weights='imagenet',
                                     input_tensor = None, input_shape = None,
                                     pooling = None, classes = 1000)

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/vgg16/vgg16_weights_tf_dim_ordering_tf_kernels.h5


In [64]:
vgg_net.summary()

Model: "vgg16"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_1 (InputLayer)        [(None, 224, 224, 3)]     0         
                                                                 
 block1_conv1 (Conv2D)       (None, 224, 224, 64)      1792      
                                                                 
 block1_conv2 (Conv2D)       (None, 224, 224, 64)      36928     
                                                                 
 block1_pool (MaxPooling2D)  (None, 112, 112, 64)      0         
                                                                 
 block2_conv1 (Conv2D)       (None, 112, 112, 128)     73856     
                                                                 
 block2_conv2 (Conv2D)       (None, 112, 112, 128)     147584    
                                                                 
 block2_pool (MaxPooling2D)  (None, 56, 56, 128)       0     

# GoogLeNet, Inception 모듈
- 인센셥 블록, 인셉션 네트워크라고 불림
- CNN계산 용량을 최적화하는 것 고려

In [65]:
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import Dense, Conv2D, MaxPooling2D, Flatten, Input

In [66]:
input_shape = (28, 28, 3)

In [68]:
model = Sequential()
model.add(Conv2D(32, kernel_size = (5,5), input_shape = input_shape))
model.add(MaxPooling2D(pool_size = (2,2)))
model.add(Flatten())
model.add(Dense(10, activation = 'softmax'))

In [70]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_5 (Conv2D)           (None, 24, 24, 32)        2432      
                                                                 
 max_pooling2d_4 (MaxPooling  (None, 12, 12, 32)       0         
 2D)                                                             
                                                                 
 flatten_1 (Flatten)         (None, 4608)              0         
                                                                 
 dense_5 (Dense)             (None, 10)                46090     
                                                                 
Total params: 48,522
Trainable params: 48,522
Non-trainable params: 0
_________________________________________________________________


In [71]:
# 함수형 api 사용
def build_mode():
    inputs = Input(shape=input_shape)
    conv1 = Conv2D(32, kernel_size = (5,5))(inputs)
    maxpool1 = MaxPooling2D(pool_size = (2,2))(conv1)
    predictions = Dense(10, activation = 'softmax')(Flatten()(maxpool1))
    
    model = Model(inputs = inputs, outputs = predictions)
    return model

In [72]:
# 인셉션 블록
from tensorflow.keras.layers import Conv2D, MaxPooling2D, concatenate

In [73]:
def naive_inception_block(prev_layer, filters = [64, 128, 32]):
    conv1x1 = Conv2D(filters[0], kernel_size = (1,1), padding='same', activation='relu')(prev_layer)
    conv3x3 = Conv2D(filters[1], kernel_size = (3,3), padding='same', activation='relu')(prev_layer)
    conv5x5 = Conv2D(filters[2], kernel_size = (5,5), padding='same', activation='relu')(prev_layer)
    max_pool = MaxPooling2D((3,3), strides = (1,1), padding = 'same')(prev_layer)
    
    return concatenate([conv1x1, conv3x3, conv5x5, max_pool], axis = -1)

In [77]:
inceptionV3 = tf.keras.applications.InceptionV3(include_top= True, weights = 'imagenet',
                        input_tensor = None, input_shape = None,
                        pooling = None, classes = 1000)

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/inception_v3/inception_v3_weights_tf_dim_ordering_tf_kernels.h5


In [78]:
inceptionV3.summary()

Model: "inception_v3"
__________________________________________________________________________________________________
 Layer (type)                   Output Shape         Param #     Connected to                     
 input_2 (InputLayer)           [(None, 299, 299, 3  0           []                               
                                )]                                                                
                                                                                                  
 conv2d_6 (Conv2D)              (None, 149, 149, 32  864         ['input_2[0][0]']                
                                )                                                                 
                                                                                                  
 batch_normalization (BatchNorm  (None, 149, 149, 32  96         ['conv2d_6[0][0]']               
 alization)                     )                                                      

In [79]:
# 잔차 블록 구현 residual
from tensorflow.keras.layers import Activation, Conv2D, BatchNormalization, add

In [80]:
def resifual_block_basic(x, filters, kernel_size =3, strides =1):
    conv_1 = Conv2D(filters = filters, kernel_size = kernel_size,
                    padding = 'same', strides = strides)(x)
    bn_1 = BatchNormalization(axis = -1)(conv_1)
    act_1 = Activation('relu')(bn_1)
    conv_2 = Conv2D(filters = filters, kernel_size = kernel_size,
                    padding = 'same', strides = strides)(act_1)
    residual = BatchNormalization(axis = -1)(conv_2)
    
    shortcut = x if strides == 1 else Conv2D(filters, kernel_size = 1, padding = 'valid', strides = strides)(x)
    
    return Activation('relu')(add([shortcut,residual]))

In [82]:
resnet50 = tf.keras.applications.ResNet50(
    include_top = True, weights = 'imagenet', input_tensor = None,
    input_shape = None, pooling = None, classes = 1000
)

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/resnet/resnet50_weights_tf_dim_ordering_tf_kernels.h5


In [83]:
resnet50.summary()

Model: "resnet50"
__________________________________________________________________________________________________
 Layer (type)                   Output Shape         Param #     Connected to                     
 input_3 (InputLayer)           [(None, 224, 224, 3  0           []                               
                                )]                                                                
                                                                                                  
 conv1_pad (ZeroPadding2D)      (None, 230, 230, 3)  0           ['input_3[0][0]']                
                                                                                                  
 conv1_conv (Conv2D)            (None, 112, 112, 64  9472        ['conv1_pad[0][0]']              
                                )                                                                 
                                                                                           