### ■ パーセプトロン

In [2]:
import numpy as np

### ■ 学習データと正解ラベルを与え、Weight と Bias を勾配降下で更新する（初期値はランダム）

In [3]:
#------------------------------------------------------------------------------
# Perceptron Training & Predict
#------------------------------------------------------------------------------
class Perceptron:

  def __init__(self, size):
    self.weight = np.random.rand(size)
    self.bias = np.random.rand()

  def func_step(self, x):
    y = np.where(x > 0, 1, 0)
    return y

  def func_sigmoid(self, x):
    y = 1 / (1 + np.exp(-x))
    return y

  def func_loss(self, y_data, t_data):
    loss = np.sum((y_data - t_data))                    # MSE derivative (MSE: 1/2 * np.sum(y - t) ^ 2)
    return loss

  def func_predict(self, x_data):
    ans = np.dot(x_data, self.weight) + self.bias
    pred = self.func_sigmoid(ans)
    return pred

  def func_train(self, x_data, y_data):
    epoch = 1000                                        # 学習回数
    learning_rate = 0.1                                 # 学習率
    for _ in range(epoch):
      for i in range(len(x_data)):
        pred_value = self.func_predict(x_data[i])                                   # 学習データから予測して
        loss_value = self.func_loss(pred_value, y_data[i])                          # 予測結果との誤差出して
        self.weight = self.weight - (x_data[i] * loss_value * learning_rate)        # 重みを更新して
        self.bias = self.bias - (loss_value * learning_rate)                        # バイアスの更新する
    return self.weight, self.bias

#------------------------------------------------------------------------------
# Main
#------------------------------------------------------------------------------
ptron = Perceptron(size=2)                              # input は 2 つ

x_data = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])     # 学習データ（説明変数）
y_data = np.array([0, 0, 0, 1])                         # 正解ラベル（目的変数）
weight, bias = ptron.func_train(x_data, y_data)         # => XOR は求めることができない

print(f'weight={weight}')
print(f'bias={bias}')
print(f'---')
print(f'(0, 0) : {ptron.func_predict([0, 0])}')
print(f'(0, 1) : {ptron.func_predict([0, 1])}')
print(f'(1, 0) : {ptron.func_predict([1, 0])}')
print(f'(1, 1) : {ptron.func_predict([1, 1])}')

weight=[5.60412254 5.59806857]
bias=-8.569887112502883
---
(0, 0) : 0.0001896980750196168
(0, 1) : 0.048715378659504385
(1, 0) : 0.048996700509385774
(1, 1) : 0.9329118944064463


### ■ T で転置してから dot で内積を計算し、for 文を 1 つ消す

In [4]:
#------------------------------------------------------------------------------
# Perceptron Training & Predict
#------------------------------------------------------------------------------
class Perceptron:

  def __init__(self, size):
    self.weight = np.random.rand(size)
    self.bias = np.random.rand()

  def func_step(self, x):
    y = np.where(x > 0, 1, 0)
    return y

  def func_sigmoid(self, x):
    y = 1 / (1 + np.exp(-x))
    return y

#  def func_loss(self, y_data, t_data):
#    loss = np.sum((y_data - t_data))                    # MSE derivative (MSE: 1/2 * np.sum(y - t) ^ 2)
#    return loss

  def func_predict(self, x_data):
    ans = np.dot(x_data, self.weight) + self.bias
    pred = self.func_sigmoid(ans)
    return pred

  def func_train(self, x_data, y_data):
    epoch = 1000
    learning_rate = 0.1
    for _ in range(epoch):
      pred_value = self.func_predict(x_data)
      loss_value = pred_value - y_data                  # loss_value を配列のままにするため、func_loss は使用しない
      self.weight = self.weight - (np.dot(x_data.T, loss_value) * learning_rate)
      self.bias = self.bias - (np.sum(loss_value) * learning_rate)

    return self.weight, self.bias

#------------------------------------------------------------------------------
# Main
#------------------------------------------------------------------------------
ptron = Perceptron(size=2)

x_data = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])     # 学習データ（説明変数）
y_data = np.array([0, 0, 0, 1])                         # 正解ラベル（目的変数）

weight, bias = ptron.func_train(x_data, y_data)         # => XOR は求めることができない

print(f'weight={weight}')
print(f'bias={bias}')
print(f'---')
print(f'(0, 0) : {ptron.func_predict(np.array([0, 0]))}')
print(f'(0, 1) : {ptron.func_predict(np.array([0, 1]))}')
print(f'(1, 0) : {ptron.func_predict(np.array([1, 0]))}')
print(f'(1, 1) : {ptron.func_predict(np.array([1, 1]))}')


weight=[5.58707421 5.58707045]
bias=-8.560153823768182
---
(0, 0) : 0.00019155312067759114
(0, 1) : 0.04865679674211922
(1, 0) : 0.04865697118445349
(1, 1) : 0.9317565961790026
