#### 第二章 感知机

##### 基础模型

In [34]:
import numpy as np
from typing import Tuple  # 用于返回值的类型注解

def perceptron(X: np.ndarray, Y: np.ndarray, learning_rate: float = 1, max_iter: int = 1000) -> Tuple[np.ndarray, float, int]:
    """
    感知机学习算法（原始形式）
    
    参数:
        X: np.ndarray - 特征矩阵，形状为 (样本数, 特征数)，例如 (100, 2) 表示100个样本、2个特征
        Y: np.ndarray - 标签数组，形状为 (样本数,)，标签值需为 +1 或 -1（感知机要求）
        learning_rate: float - 学习率（步长），默认0.1
        max_iter: int - 最大迭代次数，防止无限循环，默认1000
    
    返回:
        Tuple[np.ndarray, float, int]: 
            - w: 最终的权重向量，形状为 (特征数,)
            - b: 最终的偏置项（标量）
            - iter: 实际迭代次数
    """
    # 检查输入维度合法性

    if X.shape[0] != Y.shape[0]:
        raise ValueError("特征矩阵X的样本数必须与标签数组Y的长度一致")
    if not np.all(np.isin(Y, [-1, 1])):
        raise ValueError("感知机标签Y必须仅包含 +1 和 -1")
    
    _, dim = X.shape
    W = np.zeros(dim)
    b = 0

    iter = 0
    while np.any(((X@W+b)*Y)<=0) and iter < max_iter:
        iter += 1
        for x, y in zip(X,Y):
            if (x @ W + b )*y<=0:
                break
        W = W + learning_rate * y * x
        b = b + learning_rate * y
        print(f"误分点：{x}, 标签：{y}, w: {W},b: {b}")
    return W, b, iter
    
X = np.array([[3, 3], [4, 3], [1, 1]])
Y = np.array([1, 1, -1])
perceptron(X, Y)

误分点：[3 3], 标签：1, w: [3. 3.],b: 1
误分点：[1 1], 标签：-1, w: [2. 2.],b: 0
误分点：[1 1], 标签：-1, w: [1. 1.],b: -1
误分点：[1 1], 标签：-1, w: [0. 0.],b: -2
误分点：[3 3], 标签：1, w: [3. 3.],b: -1
误分点：[1 1], 标签：-1, w: [2. 2.],b: -2
误分点：[1 1], 标签：-1, w: [1. 1.],b: -3


(array([1., 1.]), np.int64(-3), 7)

In [None]:
import numpy as np
from typing import Tuple  # 用于返回值的类型注解

def perceptron2(X: np.ndarray, Y: np.ndarray, learning_rate: float = 1, max_iter: int = 1000) -> Tuple[np.ndarray, float, int]:
    """
    感知机学习算法（对偶形式）
    
    参数:
        X: np.ndarray - 特征矩阵，形状为 (样本数, 特征数)，例如 (100, 2) 表示100个样本、2个特征
        Y: np.ndarray - 标签数组，形状为 (样本数,)，标签值需为 +1 或 -1（感知机要求）
        learning_rate: float - 学习率（步长），默认0.1
        max_iter: int - 最大迭代次数，防止无限循环，默认1000
    
    返回:
        Tuple[np.ndarray, float, int]: 
            - w: 最终的权重向量，形状为 (特征数,)
            - b: 最终的偏置项（标量）
            - iter: 实际迭代次数
    """
    # 检查输入维度合法性

    if X.shape[0] != Y.shape[0]:
        raise ValueError("特征矩阵X的样本数必须与标签数组Y的长度一致")
    if not np.all(np.isin(Y, [-1, 1])):
        raise ValueError("感知机标签Y必须仅包含 +1 和 -1")
    
    dim, _ = X.shape
    alpha = np.zeros(dim)
    
    b = 0

    iter = 0
    while np.any(((X@(Y*alpha@X)+b)*Y)<=0) and iter < max_iter:
        iter += 1
        for i, (x, y) in enumerate(zip(X,Y)):
            if (x @ (Y*alpha@X) + b )*y<=0:
                break
        alpha[i] += learning_rate
        b = b + learning_rate * y
        print(f"误分点：{x}, 标签：{y}, alpha: {alpha}, w: {Y*alpha@X}, b: {b}")
    return Y*alpha@X, b, iter
    
X = np.array([[3, 3], [4, 3], [1, 1]])
Y = np.array([1, 1, -1])
perceptron2(X, Y)

误分点：[3 3], 标签：1, alpha: [1. 0. 0.],b: 1
[3. 3.]
误分点：[1 1], 标签：-1, alpha: [1. 0. 1.],b: 0
[-4. -4.]
误分点：[1 1], 标签：-1, alpha: [1. 0. 2.],b: -1
[-5. -5.]
误分点：[1 1], 标签：-1, alpha: [1. 0. 3.],b: -2
[-6. -6.]
误分点：[3 3], 标签：1, alpha: [2. 0. 3.],b: -1
[9. 9.]
误分点：[1 1], 标签：-1, alpha: [2. 0. 4.],b: -2
[-10. -10.]
误分点：[1 1], 标签：-1, alpha: [2. 0. 5.],b: -3
[-11. -11.]


(array([1., 1.]), np.int64(-3), 7)