<a href="https://colab.research.google.com/github/AnguillaJaponica/PML/blob/main/perceptron.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import numpy as np
class Perceptron(object):
  """パーセプトロンの分類器を実装する

  パラメータ
  ===========================
  eta: float
    学習率(0.0より大きく、1.0以下)
  n_iter: int
    トレーニングデータのトレーニング回数
  random_state: int
    重みを初期化するための乱数シード 
  
  属性
  ===========================
  w_: 1次元配列
    適合後の重み
  errors_: リスト
    各エポックでの誤分類(更新)の数

  """

  def __init__(self, eta=0.01, n_iter=50, random_state=1):
    self.eta = eta
    self.n_iter = n_iter
    self.random_state = random_state

  def fit(self, X, y):
    """トレーニングデータに適合させる

    パラメータ  
    ===========================
    X: { 配列 }, shape = [n_samples, n_features]
      トレーニングデータ。n_samplesはサンプルの個数・n_featuresは特徴量の個数
    y:  配列のようなデータ構造、shape = [n_samples]
      目的関数

    戻り値
    ===========================
    self: object
    """

    rgen = np.randam.RandamState(self.random_state)
    self.w_ = rgen.normal(loc=0.0, scale=0.01, size=1 + X.shape[1])
    self.errors_ = []

    for _ in range(self.n_iter): # トレーニング回数分トレーニングデータを反復
      errors = 0
      for xi, target in zip(X, y): # 各サンプルで重みを更新
        # 重みw1, w2, w3...wmの更新
        # dwj = η(yi - y^i)xij(j = 1,2,....,m)
        update = self.eta * (target - self.predict(xi))
        self.w_[1:] += update * xi
        # 重みw0の更新
        self.w_[0] += update
        # 重みの更新が0出ない場合は誤分類としてカウント
        errors += int(update != 0.0)
    # 反復回数ごとのごさを格納
    self.errors_.append(errors)
    return self

  def net_input(self, X):
    """総入力を計算"""
    return np.dot(X, self.w_[1:]) + self.w_[0]

  def predict(self, X):
    """1ステップ後のクラスラベルを返す"""
    return np.where(self.net_input(X) >= 0.0, 1, -1)  

In [None]:
 # Irisデータをインポートする
 import pandas as pd
 df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)
 df.tail()

Unnamed: 0,0,1,2,3,4
145,6.7,3.0,5.2,2.3,Iris-virginica
146,6.3,2.5,5.0,1.9,Iris-virginica
147,6.5,3.0,5.2,2.0,Iris-virginica
148,6.2,3.4,5.4,2.3,Iris-virginica
149,5.9,3.0,5.1,1.8,Iris-virginica


In [None]:
# データの可視化

import matplotlib.pyplot as plt
# 1-100行目の目的変数の抽出
y = df.iloc[0:100, 4].values



['Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa' 'Iris-setosa'
 'Iris-versicolor' 'Iris-versicolor' 'Iris-versicolor' 'Iris-versicolor'
 'Iris-versicolor' 'Iris-versicolor' 'Iris-versicolor' 'Iris-versicolor'
 'Iris-versicolor' 'Iris-versicolor' 'Iris-versicolor' 'Iris-versicolor'
 'Iris-versicolor' 'Iris-versicolor' 'Iris-versicolor' 'Iris-versicolor