<a href="https://colab.research.google.com/github/yukinaga/minnano_dl/blob/main/section_4/03_napier_sigmoid.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ネイピア数とシグモイド関数
ネイピア数を使った「シグモイド関数」は、活性化関数として使われることがあります。

## ネイピア数とは？

「ネイピア数」$e$は、円周率$\pi$のように無限に桁が続く小数です。

$$e = 2.71828 18284 59045 23536 02874 71352 …$$ 

$e$の値ですが、次の極限として求めることができます。

$$ e = \lim_{n\to \infty}\Bigl(1+\frac{1}{n}\Bigr)^n$$

$\Bigl(1+\frac{1}{n}\Bigr)^n$は$n$が大きくなると次第に$e$の値に近づきます。  
これは、後ほど演習で確かめましょう。  

ネイピア数は、以下のようなべき乗の形でよく使われます。

（式 1）
$$ y=e^x $$

この関数は、以下に示すように微分しても式が変わらないという性質を持っています。

$$ \begin{aligned}
\frac{\partial y}{\partial x} &= \lim_{\Delta x \to 0}\frac{e^{x+\Delta x}-e^x}{\Delta x}  \\
&= e^x
\end{aligned} $$

この性質のためネイピア数は数学的に扱いやすく、ディープラーニングにおける様々な数式で使用されています。  

（式 1）は以下のように表記することもあります。

$$ y=\exp(x) $$


## ネイピア数の取得
ネイピア数は、NumPyにおいて`e`で取得することができます。  
また、ネイピア数のべき乗はNumPyの`exp`関数で実装することができます。

In [None]:
import numpy as np

print(np.e)  # ネイピア数
print(np.exp(1))  #eの1乗

次に、以下の式で表されるネイピア数のべき乗を描画します。 

$$ y=\exp(x) $$

In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-2, 2)
y = np.exp(x)  # ネイピア数のべき乗

plt.plot(x, y)

plt.xlabel("x", size=14)
plt.ylabel("y", size=14)
plt.grid()

plt.show()

ネイピア数のべき乗は、$x$が0のとき$1$となり、$x$が1のときにネイピア数の値になります。  
$x$が小さくなると0に近づき、$x$が大きくなるとともに増加率が増大します。  

## シグモイド関数
ニューラルネットワークでは「シグモイド関数」というネイピア数を用いた関数がよく使われます。  
シグモイド関数は以下の数式で表されます。  

$$y = \frac{1}{1+\exp(-x)}$$ 

この関数を微分しましょう。  
$u = 1+\exp(-x)$とおくと、以下のように連鎖律を使って微分できます。

$$ \begin{aligned} \\
\frac{dy}{dx} & = \frac{dy}{du}\frac{du}{dx} \\
& = \frac{d}{du}(u^{-1})\frac{d}{dx}(1+\exp(-x)) \\
& = (-u^{-2})(-\exp(-x)) \\
& = \frac{\exp(-x)}{(1+\exp(-x))^2} \\
& = \Bigl( \frac{\exp(-x)}{1+\exp(-x)} \Bigr)\Bigl( \frac{1}{1+\exp(-x)} \Bigr) \\
& = \Bigl( \frac{1+\exp(-x)}{1+\exp(-x)}-\frac{1}{1+\exp(-x)} \Bigr)\Bigl( \frac{1}{1+\exp(-x)} \Bigr) \\
& = (1-y)y
\end{aligned} $$

シグモイド関数$y$の導関数は、$(1-y)y$となりましました。  
導関数がシンプルなのも、シグモイド関数のメリットです。

以下のコードでは、NumPyの`exp( )`関数を使ってシグモイド関数、およびその導関数を描画します。  

In [None]:
import numpy as np
import matplotlib.pylab as plt

def sigmoid_function(x):  # シグモイド関数
    return 1/(1+np.exp(-x))

def grad_sigmoid(x):  # シグモイド関数の導関数
    y = sigmoid_function(x)
    return (1-y)*y

x = np.linspace(-5, 5)
y = sigmoid_function(x)
y_grad = grad_sigmoid(x)

plt.plot(x, y, label="y")
plt.plot(x, y_grad, label="y_grad")
plt.legend()

plt.xlabel("x", size=14)
plt.ylabel("y", size=14)
plt.grid()

plt.show()

シグモイド関数は$x$の値が小さくなると0に近づき、$x$の値が大きくなると1に近づきます。  
このように、シグモイド関数により、入力を0と1の間の連続的な出力に変換することができます。  
  
導関数は、$x$が0のとき最大値の0.25をとり、0から離れるについれて0に近づいていきます。    
  
以前に扱った「ステップ関数」は以下の式で表されますが、この関数は微分することができません。  
$$
  y = \begin{cases}
    0 & (x \leqq 0) \\
    1 & (x > 0)
  \end{cases}
$$

従って、ニューラルネットワークがステップ関数を含む合成関数である場合、微分することはできません。
しかしながら、シグモイド関数は微分可能あるため、合成関数に含まれていても微分を妨げることはありません。  
そのため、学習可能なニューラルネットワークを構築する際に、シグモイド関数は活性化関数としてしばしば使われます。