In [9]:
import numpy as np

In [1]:
# [Problem 1] Classification of fully connected layers

In [10]:
class FC:
    """
    ノード数n_nodes1からn_nodes2への全結合層
    Parameters
    ----------
    n_nodes1 : int
      前の層のノード数
    n_nodes2 : int
      後の層のノード数
    initializer : 初期化方法のインスタンス
    optimizer : 最適化手法のインスタンス
    """
    def __init__(self, n_nodes1, n_nodes2, initializer, optimizer):
        
        self.optimizer = optimizer
        self.W, self.B = initializer.W(n_nodes1, n_nodes2), initializer.B(n_nodes2)
        
        
    def forward(self, X):
        """
        フォワード
        Parameters
        ----------
        X : 次の形のndarray, shape (batch_size, n_nodes1)
            入力
        Returns
        ----------
        A : 次の形のndarray, shape (batch_size, n_nodes2)
            出力
        """
        A = X @ self.W + self.B
        
        return A
        
    def backward(self, dA):
        """
        バックワード
        Parameters
        ----------
        dA : 次の形のndarray, shape (batch_size, n_nodes2)
            後ろから流れてきた勾配
        Returns
        ----------
        dZ : 次の形のndarray, shape (batch_size, n_nodes1)
            前に流す勾配
        """
        dZ = dA @ self.W.T
        dB = np.sum(dA, axis=0)
        # 更新
        self = self.optimizer.update(self)
        return dZ

In [3]:
# initializer

class SimpleInitializer:
    """
    ガウス分布によるシンプルな初期化
    Parameters
    ----------
    sigma : float
      ガウス分布の標準偏差
    """
    def __init__(self, sigma):
        self.sigma = sigma
        
    def W(self, n_nodes1, n_nodes2):
        """
        重みの初期化
        Parameters
        ----------
        n_nodes1 : int
          前の層のノード数
        n_nodes2 : int
          後の層のノード数

        Returns
        ----------
        W :
        """
        W = self.sigma * np.random.randn(n_nodes1, n_nodes2)
        return W
        
    def B(self, n_nodes2):
        """
        バイアスの初期化
        Parameters
        ----------
        n_nodes2 : int
          後の層のノード数

        Returns
        ----------
        B :
        """
        B = self.sigma * np.random.randn(1, n_nodes2)
        
        return B

In [4]:
# optimizer 

In [11]:
class SGD:
    """
    確率的勾配降下法
    Parameters
    ----------
    lr : 学習率
    """
    def __init__(self, lr):
        self.lr = lr
    def update(self, layer):
        """
        ある層の重みやバイアスの更新
        Parameters
        ----------
        layer : 更新前の層のインスタンス
        """
        layer.W -= self.lr * layer.W
        layer.B -= self.lr * layer.B
        return layer

In [None]:
class activation_func:

    def __init__(self, function_type):
        
        self.function_type=function_type
        
    def forward(self, X):
        
        if self.function_type=="tanh":
            A = self.tanh_function(X)
        elif self.function_type=="softmax":
            A = self.softmax(X)

        return A
        
    def backward(self, X):

        if self.function_type=="tanh":
            A = self.grad_tanh(X)
        else:
            print("Not implemented")
      
        return A

    def tanh_function(self, A):
        return (np.exp(A)-np.exp(-A))/(np.exp(A)+np.exp(-A))
    
    def softmax(self, A):
        return np.exp(A)/np.sum(np.exp(A), axis=0)

    def grad_tanh(self, A):
         return (1 - self.tanh_function(self.A)**2)
    
    

In [15]:
#test

In [12]:
layer = FC(n_nodes1=10, n_nodes2=20, initializer=SimpleInitializer(sigma=0.005), optimizer=SGD(lr=0.001))

In [14]:
layer.B

array([[-0.00748308,  0.00385237, -0.00405914,  0.00465856,  0.00280721,
         0.00110405,  0.01108828, -0.00374402,  0.00407199, -0.00511326,
         0.00295041,  0.01003268,  0.00634435, -0.00586936, -0.00803456,
        -0.00401202,  0.00287073, -0.00080941, -0.0021942 ,  0.00425884]])