# ニューラルネットワークにおいて勾配を求めるクラス

In [None]:
import numpy as np
from common.activations import softmax
from common.grad import numerical_gradient
from common.loss import cross_entropy_error

* 「ニューラルネットワークにおいて勾配を求める」とは、損失$L$の$W$に対する偏微分$\displaystyle \frac{\partial L}{\partial {\bf W}}$を求めるということである。  
    例、  
    ${\bf W}=\begin{pmatrix} w_{11} & w_{12} & w_{13} \\ w_{21} & w_{22} & w_{23} \end{pmatrix}$  
  
    $\displaystyle \frac{\partial L}{\partial {\bf W}}=\begin{pmatrix} \frac{\partial L}{\partial {w_{11}}} &
                                                                                      \frac{\partial L}{\partial {w_{12}}} &
                                                                                      \frac{\partial L}{\partial {w_{13}}} \\
                                                                                      \frac{\partial L}{\partial {w_{21}}} &
                                                                                      \frac{\partial L}{\partial {w_{22}}} &
                                                                                      \frac{\partial L}{\partial {w_{23}}}
                                                                                      \end{pmatrix}$  
                                                                                            
  
    
* $\displaystyle \frac{\partial L}{\partial {\bf W}}$は、${\bf W}$のそれぞれの要素が微小量変化したときの$L$の変化量を表す。


### [演習]
* シンプルなニューラルネットワークにおいて、予測、損失、勾配を計算する以下のクラスを完成させましょう


In [None]:
# ヒント
np.random.seed(seed=1234)
print(np.random.randn(2,3)) # 標準正規分布からランダムにサンプリング

In [None]:
class simpleNet:
    def __init__(self, seed=1234):
        np.random.seed(seed)
        self.W = np.random.randn(2,3)#Wの初期値
        
    def predict(self, x):
        """
        予測関数
        """
        z = np.dot(        ,      )
        y = softmax(       )
        return y
    
    def loss(self, x, t):
        """
        損失関数
        """
        y = self.predict(      )
        loss = cross_entropy_error(     ,      )
        return loss
    
    def gradient(self, x, t):
        """
        勾配計算関数
        """
        grads={}
        f = self.loss
        W = self.W
        grads["W"] = numerical_gradient(        ,      ,      ,       )

        return grads

In [None]:
# 重みの初期値の確認
snet = simpleNet()        
print("net.W=")
print(snet.W)
print()

# 予測関数の確認
x = np.array([0.6, 0.9])
y = snet.predict(x)
print("y=", y)
print()
print("np.argmax(y)=", np.argmax(y))
print()

# 損失を求める関数の確認
t =np.array([0, 0, 1]) #正解ラベル
print("loss=",snet.loss(x, t))
print()

# 勾配を求める
grad = snet.gradient(x, t)
print("grad=")
print(grad)

### [gradの解釈]
* 求められたgradは、例えば、次のように解釈できる
    * $w_{11}$を正の方向に微小量$h$だけ変化させたとき、$L$は0.09増える。
    * $w_{13}$を負の方向に微小量$h$だけ変化させたとき、$L$は0.11増える。
    * $L$は$0$に近づけたいので、$w_{11}$は負の方向に更新し、$w_{13}$は正の方向に更新するのが良い、となる。

### [演習]
* 重みWの初期値を変えてみましょう。