In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

# 付録A sigmoid関数とtanh関数の微分

## sigmoid関数
sigmoid関数は次の式で表される
$$ y = \frac{1}{1 + exp(-x)} $$
計算グラフは次のような流れになる．  

<div style="text-align: center">(x, -1) -> [×] ->(-x) -> [exp] -> (exp(-x), 1) -> [+] -> 1+exp(-x) -> [/] -> 1/(1+exp(-x)) = y -></div>
[×]と[+]はすでに扱ったが，[exp]と[/]の微分はまだ説明されていない．  

### /ノードの逆伝搬
逆数を取るノード
$$ y = \frac{1}{x} $$
$x$で偏微分すると，商の微分法から次のようになる
$$ \frac{\partial y}{\partial x} = \frac{0 - 1}{x^2} = -\Bigl(\frac{1}{x}\Bigr)^2 = -y^2 $$
よって/ノードでは，上流からの勾配$\frac{\partial L}{\partial y}$に対して，出力した$y$をキャッシュしておいて以下のように返せばよい．  
$$ -\frac{\partial L}{\partial y}y^2$$

### expノードの逆伝搬
自然対数の累乗を取るノード
$$ y = e^x $$
微分しても$e^x$である．  
$$ \frac{\partial y}{\partial x} = e^x = y $$
よってexpノードでは，上流からの勾配$\frac{\partial L}{\partial y}$に対して，出力した$y$をキャッシュしておいて以下のように返せばよい．  
$$ \frac{\partial L}{\partial y} y $$

### sigmoid関数全体の逆伝搬
計算グラフをたどり，sigmoid関数は出力$y$をキャッシュしておいて以下のように返せばよい．  
$$ \begin{eqnarray*} \\
    &\frac{\partial L}{\partial y} (-y_{div}^2)(y_{exp})(-1)& \\
    &=& \frac{\partial L}{\partial y} \frac{1}{(1 + \exp(-x))^2} \exp(-x) \\
    &=& \frac{\partial L}{\partial y} \frac{1}{1 + \exp(-x)} \frac{exp(-x)}{1 + \exp(-x)} \\
    &=& \frac{\partial L}{\partial y} \frac{1}{1 + \exp(-x)} \Big(1 - \frac{1}{1 + \exp(-x)} \Big) \\
    &=& \frac{\partial L}{\partial y} y(1-y) \\
\end{eqnarray*} $$

## A2. tanh関数
5章を参照  
$$ y = \tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$$
の微分を求める．商の微分法を使って
$$ \frac{\partial \tanh(x)}{\partial x} = \frac {({e^x + e^{-x}})({e^x + e^{-x}}) - ({e^x - e^{-x}})({e^x - e^{-x}})}{({e^x + e^{-x}})^2} $$
$$ = 1 - \Bigl\{ \frac {({e^x - e^{-x}})}{({e^x + e^{-x}})} \Bigr\}^2 $$
$$ = 1 - \tanh(x)^2 = 1 - y^2 $$
よって, 上流からの勾配$\frac{\partial L} {\partial y}$を使って
$$ \frac{\partial L} {\partial x} = \frac{\partial L} {\partial y} \cdot \frac{\partial y} {\partial x} = \frac{\partial L} {\partial y} (1 - y^2) $$
を下流に返せば良い．  
ここでyは順伝播の時に保持しておく．RNNレイヤの実装でいうh_next， 最終的な出力を使うことになる．

## A3 まとめ
NNの微分は計算グラフで解く方法(A1)と解析的な方法で解く方法(A2)がある．  
問題に応じて適宜どちらかを利用する．  
複数の方法で問題を解決できることは，時としてとても重要である．

## 付録B WordNetを動かす
WordNetをPythonから利用するには，**NLTK**(Natural Language Toolkit)というライブラリを使う  
NLTKには，自然言語処理のための便利な機能が多く用意されている．
- 品詞タグ付け
- 構文解析
- 情報抽出
- 意味解析
NLTKをインストールするにはpipを使う  
<div style="text-align: center">$ pip install nltk</div>
