<a href="https://colab.research.google.com/github/zjkang/machine-learning-coding/blob/main/Perceptron.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Refer to [perceptron code](https://github.com/zjkang/Machine-Learning-Interviews/blob/main/src/MLC/notebooks/perceptron.ipynb)

Formula:
* $y_{pred} = sign(w_0 + w_1*x_1 + w_2*x_2 + ... + w_n*x_n)$
* where sign(x) = 1 x > 0 or sign(x) = -1 x < 0
* $w_i = w_i + lr * (y - y_{pred}) * x_i$


Procedure
1. 初始化权重: 首先, 权重通常被初始化为一个较小的随机数或者全零向量.
2. 对样本进行预测: 对于**每一个训练样本**, 计算Perceptron模型的输出。这可以通过将输入特征与对应的权重相乘, 然后加总, 并应用阈值函数来实现.
3. 计算误差: 将模型的预测结果与实际标签进行比较, 得到预测误差. 对于二分类问题, 通常可以用预测标签与实际标签的差异来表示误差.
4. 更新权重: 使用梯度下降法来更新权重, 以减小误差. 权重的更新公式在上面所示.
通过这个更新规则，如果预测值与实际值一致，则权重不需要调整；如果预测值过大，则需要减小相应的权重；如果预测值过小，则需要增加相应的权重

5.重复迭代： 重复以上步骤，直到达到某个停止条件，例如达到最大迭代次数或者误差降到一个可以接受的水平。
6.收敛判断： 在训练过程中，可以根据模型的性能指标（如准确率或损失函数）来判断模型是否已经收敛，即模型是否已经足够拟合训练数据。

在Perceptron算法中，并没有显式地使用损失函数（loss function）来进行权重的更新。相反，权重的更新是基于预测值与实际标签之间的误差

In [1]:
import numpy as np

class Perceptron:
    def __init__(self, lr=0.01, n_iter=100):
        self.lr = lr
        self.n_iter = n_iter

    def fit(self, X, y):
        # add bias as self.weights[0], initialize weights to zeros
        self.weights = np.zeros(1 + X.shape[1])
        self.errors = []
        for _ in range(self.n_iter):
            errors = 0
            # extract each sample {X_i, y_i}
            for xi, yi in zip(X, y):
                # update weights via gradient descent
                update = self.lr * (yi - self.predict(xi))
                self.weights[1:] += update * xi
                self.weights[0] += update
                # add current predicted error
                errors += int(update != 0.0)
            self.errors.append(errors)
        return self

    def net_input(self, X):
        return np.dot(X, self.weights[1:]) + self.weights[0]

    def predict(self, X):
        return np.where(self.net_input(X) >= 0.0, 1, -1)

In [3]:
X = np.array([[2.0, 1.0], [3.0, 4.0], [4.0, 2.0], [3.0, 1.0]])
y = np.array([-1, 1, 1, -1])
perceptron = Perceptron()
perceptron.fit(X, y)
## print(perceptron.errors)

new_X = np.array([[5.0, 2.0], [1.0, 3.0]])
perceptron.predict(new_X)

[3, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]


array([-1,  1])