# *합성곱 신경망*
 ## 5. CNN 구현하기

- 구현 할 CNN은 "Conv - ReLU - Pooling - Affine - ReLU - Affine - Softmax" 순으로 작성
![](image/fig 7-23.png)

- 구현에 앞서, 필요한 함수 호출

In [10]:
from data.layers import *

> **- 이하 초기화 코드 (하이퍼파라미터 설정, 매개변수 초기화, 계층 설정)**

In [12]:
class SimpleConvNet:
    def __init__(self, input_dim = (1, 28, 28),
                conv_param = {'filter_num': 30, 'filter_size': 5, 'pad': 0, 'stride': 1},
                hidden_size = 100, output_size = 10, weight_init_std = 0.01):
        filter_num = conv_param['filter_num']
        filter_size = conv_params['filter_size']
        filter_pad = conv_params['pad']
        filter_stride = conv_params['stride']
        input_size = input_dim[1]
        conv_output_size = (input_size - filter_size + 2 * filter_pad) / filter_stride + 1
        pool_output_size = int(filter_num * (conv_output_size/2) * (conv_out_size/2))

#### 딕셔너리에 하이퍼파라미터 값 저장
######################################################################################################################################


        self.params = {}
        self.params['W1'] = weight_init_std * np.random.randn(filter_num, input_dim[0], filter_size, filter_size)
        self.params['b1'] = np.zeros(filter_num)
        self.params['W2'] = weight_init_std * np.random.randn(pool_output_size, hidden_size)
        self.params['b1'] = np.zeros(hidden_size)
        self.params['W3'] = weight_init_std * np.random.randn(hidden_size, output_size)
        self.params['b3'] = np.zeros(output_size)
    
#### 가중치 매개변수 초기화
#### 필요한 매개변수는 1번 conv, 2번 affine, 3번 affine의 가중치와 편향
######################################################################################################################################


        self.layer = OrderedDict()
        self.layers['Conv1'] = Convolution(self.params['W1'],
                                          self.params['b1'],
                                          self.params['stride'],
                                          self.params['pad'])
        self.layers['Relu1'] = Relu()
        self.layers['Pool1'] = Pooling(pool_h = 2, pool_w = 2, stride = 2)
        
        self.layers['Affine1'] = Affine(self.params['W2'],
                                       self.params['b2'])
        self.layers['Relu2'] = Relu()
        
        self.layers['Affine2'] = Affine(self.params['W3'],
                                       self.params['b3'])
        self.last_layer = SoftmaxWithLoss()

#### OrderedDict에 계층들을 차례대로 추가
######################################################################################################################################

> **- 이하 추론용 predict 메서드와 손실함수 값을 구하는 loss 메서드**

In [13]:
def predict(self, x):
    for layer in self.layers.value():
        x = layer.forward(x)
    return x


def loss(self, x, t):
    y = self.predict(x)
    return self.last_layer.forward(y, t)

- 인수 x는 입력데이터, t는 정답 레이블
- predict 메서드는 계층의 맨 앞에서부터 차례대로 forward 메서드를 호출
- loss 메서드는 predict 결과를 인수로 마지막 층 forward 메서드를 호출

> **- 이하 기울기 산출 구현**

In [14]:
def gradient(self, x, t):
    #### 순전파
    self.loss(x, t)
    
    #### 역전파
    dout = 1
    dout = self.last_layer.backward(dout)
    
    layers = list(self.layers.values())
    layerss.reverse()
    for layer in layers:
        dout = layer.backward(dout)
        
    
    #### 결과 저장
    grads = {}
    grads['W1'] = self.layers['Conv1'].dW
    grads['b1'] = self.layers['Conv1'].db
    grads['W2'] = self.layers['Affine1'].dW
    grads['b2'] = self.layers['Affine1'].db
    grads['W3'] = self.layers['Affine2'].dW
    grads['b3'] = self.layers['Affine2'].db
    
    return grads

- 매개변수의 기울기는 오차역전파법으로 (순전파와 역전파를 반복하며) 구함
- grads에 각 가중치 매개변수를 저장