## Sigmoid関数の実装
$h(x) = \frac{1}{1 + \exp(-x)}$

In [3]:
import numpy as np

In [4]:
def step_func(x):
    '''step関数、入力が0を超えたら1を出力、それ以外は0を出力'''
    return np.array(x>0, dtype=np.int)

x = np.arange(-5.0, 5.0, 0.1)
y = step_func(x)

#plt.plot(x, y)
#plt.ylim(-0.1, 1.1)
#plt.title("step_func")
#plt.show()

def sigmoid_func(x):
    return 1 / (1 + np.exp(-x))

y = sigmoid_func(x)

#plt.plot(x, y)
#plt.ylim(-0.1, 1.1)
#plt.title("sigmoid_func")
#plt.show()

Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  return np.array(x>0, dtype=np.int)


## ReLU(Rectified Linear Unit)関数
入力が0を超えていれば、その入力をそのまま出力し、0以下ならば0を出力する関数

$h(x)=\begin{cases}
        x & (x > 0)\\
        0 & (x \le 0)
        \end{cases}$

In [5]:
def relu_func(x):
    return np.maximum(0, x)

x = np.arange(-5.0, 5.0, 0.1)
y = relu_func(x)

#plt.plot(x, y)
#plt.xlim(-5.1, 5.1)
#plt.ylim(-0.1, 5.1)
#plt.title("relu_func")
#plt.show()

In [6]:
def identify_func(x):
    return x

def init_network():
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([[0.1, 0.2, 0.3]])
    network['W2'] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([[0.1, 0.2]])
    network['W3'] = np.array([[0.1, 0.3], [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])
    return network
    
def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid_func(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid_func(a2)
    a3 = np.dot(z2, W3) + b3
    y = identify_func(a3)
    return y

network = init_network()
x = np.array([1.0, 0.5])
y = forward(network, x)
print(y)

[[0.31682708 0.69627909]]


## 出力層の設計
ニューラルネットワークでは、分類問題と回帰問題の両方を用いることができる。どちらかを用いるかで、出力層の活性化関数を変更する必要がある。\
一般に回帰問題には恒等関数、分類問題にはソフトマックス関数を使う\
分類問題->データがどのクラスに属するか\
回帰問題->入力データから数値の予測

### 恒等関数とソフトマックス関数
恒等関数は入力をそのまま出力する\
ソフトマックス関数は次の式で示される\
$y_{k} = \frac{\exp(a_{k})}{\sum\limits_{i=0}^{n} \exp(a_{i})}$\
オーバーフローを意識して作らなければいけない

In [None]:
def softmax_func(a):
    c = np.max(a)
    exp_a = np.exp(a - c)   # オーバーフロー対策
    sum_exp_a = np.sum(exp_a)
    return exp_a / sum_exp_a

#### ソフトマックス関数の特徴
ソフトマックス関数の出力は0から1.0の間の実数になり、出力の総和は1になる。この性質からソフトマックス関数の出力を「確率」として解釈することができる。\
ニューラルネットワークのクラス分類では一般的に出力の一番大きいニューロンに相当するクラスだけを認識結果とする。そして出力の一番大きいニューロンの場所は変わらない。そのためニューラルネットワークが分類を行う際には、出力層のソフトマックス関数を省略することができる。また指数関数の計算はそれなりにコンピューターの計算が必要になるので、出力層のソフトマックス関数は省略するのが一般的