In [2]:
import numpy as np

class Layer:
    """
    Layer is base class of all layers
    """
    def __init__(self):
        self.input = None
        self.output = None

    def forward(self, input):
        """forwardは順伝播の処理を表す。子クラスは中身を実装しないといけない"""
        raise NotImplementedError
    
    def backward(self, output_gradient, learning_rate):
        """backwardは順伝播の処理を表す。子クラスは中身を実装しないといけない"""
        raise NotImplementedError


## ReLUレイヤー

In [3]:
class ReLU(Layer):
    def __init__(self):
        super().__init__()

    def forward(self, input_data):
        self.input = input_data

        return np.maximum(0, self.input)

    def backward(self, output_gradient, learning_rate):
        """順伝播の入力が０より大きかった場所だけ勾配をそのまま後ろに流す"""
        mask = self.input > 0

        return output_gradient * mask


## （Max）プーリング層
- 入力を小さな領域（プール）に区切り、各領域の最大値だけを取り出して出力を小さくする
- `backward`: 順伝播の時に最大値だった場所（選択された場所）にだけ勾配を流す。選ばれなかった場所の勾配は０とする

In [None]:
class MaxPooling(Layer):
    def __init__(self, pool_size):
        super().__init__()
        self.pool_size = pool_size

    def forward(self, input_data):
        # backwardのために入力を記憶しておく
        self.input = input_data

        depth, height, width = self.input.shape
        ph, pw = self.pool_size, self.pool_size
        output_height = height // ph
        output_width = width // pw

        output = np.zeros((depth, output_height, output_width))

        for d_i in range(depth):
            for h_i in range(output_height):
                for w_i in range(output_width):
                    window = self.input[d_i, h_i*ph:(h_i + 1)*ph, w_i*pw:(w_i + 1)]
                    output[d_i, h_i, w_i] = max(window)

        return output

    def backward(self, output_gradient, learning_rate):
        input_gradient = np.zeros_like(self.input)

        depth, height, width = self.input.shape
        ph, pw = self.pool_size, self.pool_size
        output_height = height // ph
        output_width = width // pw
        
        for d_i in range(depth):
            for h_i in range(output_height):
                for w_i in range(output_width):
                    window = self.input[d_i, h_i*ph:(h_i + 1)*ph, w_i*pw:(w_i + 1)]
                    max_value = max(window)

                    if self.input[d_i, h_i, w_i] == max_value:
                        input_gradient[d_i, h_i*ph:(h_i + 1)*ph, w_i*pw:(w_i + 1)] += output_gradient[d_i, h_i, w_i]

        return input_gradient

        
    


In [None]:

# TODO: required to implement
class ConvolutionalLayer(Layer):
    def __init__(self):
        super().__init__()
    
    def forward(self, input):
        self.input = input
        # ...calculation
        return self.output

    def backward(self, output_gradient, learning_rate):
        self.kernels
        self.biases
        return input_gradient
