In [None]:
# 人工データのランダム生成
from sklearn.datasets import make_blobs

x, labels = make_blobs(random_state=1, n_samples=100, n_features=2, cluster_std=1.2, centers=2)

In [None]:
# xの形状を表示してみる
x.shape

In [None]:
# labelの形状を表示
labels.shape

In [None]:
# labelsを表示
labels

In [None]:
# ラベルを用いて色付け
import matplotlib.pyplot as plt
plt.scatter(x[:, 0], x[:, 1], c=labels, s=50, cmap='autumn', marker='o')
plt.colorbar()

学習データとテストデータにランダムに分割

https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html

In [None]:
# 70%を学習データに
from sklearn.model_selection import train_test_split
X_train, X_test, label_train, label_test = train_test_split(x, labels, train_size=0.7, random_state=0)

In [None]:
# 学習とテストデータを描画
plt.scatter(X_train[:, 0], X_train[:, 1], s=50, marker='o', label="train")
plt.scatter(X_test[:, 0], X_test[:, 1], s=50, marker='o', label="test")
plt.legend()

単純パーセプトロンのクラスおよび推定、学習関数の実装

In [None]:
# パーセプトロンのweightsから一つのデータ(one_data)の予測を出力(0 or 1)
def _predict(weights, one_data):
  """
  予測用の関数
  Parameters
  ----------
  weights: numpy.ndarray
  パーセプトロンのweight
  one_data: numpy.ndarray
  １つのデータ

  Returns
  ----------
  output: int
  予測結果
  """
  output = 0.0 #出力値用の変数
  #実装する
  return 1 if output >= 0.5 else 0 #0.5以上なら1とする

In [None]:
def _fit(weights, X_train, label_train, l_rate, n_epoch):
  """
  学習用の関数
  Parameters
  ----------
  weights: numpy.ndarray
  パーセプトロンのweights
  X_train: numpy.ndarray
  学習データ
  label_train: list
  学習データのラベル
  l_rate: float
  学習率
  n_epoch: int
  更新回数
  
  Returns
  weights: numpy.ndarray
  学習されたパーセプトロンのweights
  loss_history: list
  誤差の履歴（epochの回数の長さ）
  ----------
  """
  loss_history = []
  for epoch in range(n_epoch):
    total_loss = 0.0  #このエポックでの誤差の総和を入れる
    update_weights = np.zeros_like(weights) #dJ/dw用の配列
    #実装する（_predict関数を使って予測誤差計算）
    loss_history.append((total_loss/(2*X_train.shape[0])))
  return weights, loss_history

In [None]:
# クラスの実装
import numpy as np
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
import seaborn as sns
class SimplePerceptron:
  def __init__(self, n_dim):
    self.weights = np.zeros(n_dim) #weightsの初期化
  def predict(self, one_data):
    return _predict(self.weights, one_data)
  def fit(self, X_train, label_train, l_rate=0.1, n_epoch=10):
    self.weights, losses = _fit(self.weights, X_train, label_train, l_rate, n_epoch)
    #loss(エラーの推移を描画)
    print("[誤算推移]")
    plt.plot(losses)
    plt.xlabel("epochs")
    plt.ylabel("loss (MSE)")
  def evaluate(self, X_test, label_test):#評価用のコード
    predicts = []
    for one_data, one_label in zip(X_test, label_test):
      pred = self.predict(one_data)
      predicts.append(pred)
    predicts = np.array(predicts)
    print("[分類性能を示す指標}")
    print(classification_report(label_test, predicts, target_names=["0","1"]))
    print("[混同行列]")
    cm = confusion_matrix(label_test, predicts)
    sns.heatmap(cm, annot=True, cmap='Blues')
    plt.show()
    print("[各点の予測]")
    plt.scatter(X_test[predicts==0, 0], X_test[predicts==0, 1], s=50, marker='o', label="predicted as 0")
    plt.scatter(X_test[predicts==1, 0], X_test[predicts==1, 1], s=50, marker='o', label="predicted as 1")
    plt.legend()
    plt.show()

In [None]:
# predictのテスト
tmp_weights =  np.array([0.5, 1.0])
print(X_test[0])
_predict(tmp_weights, X_test[0])

パーセプトロンの学習

In [None]:
perceptron = SimplePerceptron(X_train.shape[1])
perceptron.fit(X_train, label_train)

学習された重みの表示

In [None]:
perceptron.weights

学習したパーセプトロンの評価

In [None]:
perceptron.evaluate(X_test, label_test)