最小二乘法求解线性回归（Ordinary Least Squares Linear Regression）
最小二乘法是一种经典的线性回归方法，通过最小化预测值与真实值之间的平方误差来估计模型参数。该方法不引入正则化项，适用于特征数量较少且数据噪声较低的场景。

1. 目标函数 (Objective Function)
最小二乘法的目标是最小化以下损失函数：
$$ J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2 $$
其中：
$ h_\theta(x) $：假设函数，即预测值；
$ m $：样本数量；
$ \theta_j $：模型参数（权重）；
$ x^{(i)} $：第 $ i $ 个样本的输入特征；
$ y^{(i)} $：第 $ i $ 个样本的真实值。

2. 假设函数形式（Hypothesis Function）
对于多元线性回归，假设函数为：
$$ h_\theta(x) = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \dots + \theta_n x_n = \sum_{j=0}^{n} \theta_j x_j $$
其中 $ x_0 = 1 $，作为偏置项。

3. 求解方式（解析解）
最小二乘法可以通过正规方程（Normal Equation）直接求得最优参数解，无需迭代优化：
$$ \theta = (X^T X)^{-1} X^T y $$
其中：
$ X $：输入特征矩阵（维度为 $ m \times (n+1) $）；
$ y $：目标值向量（维度为 $ m \times 1 $）；
$ \theta $：模型参数向量。
注意：该方法要求 $ X^T X $ 可逆。若不可逆，可通过引入岭回归等正则化手段解决。

4. 向量化形式（Vectorized Form）
在实际代码实现中，可以利用 NumPy 的矩阵运算高效实现正规方程：
$$ \theta = \text{np.linalg.inv}(X.T @ X) @ X.T @ y $$

In [1]:
import numpy as np

def linear_regression_normal_equation(X, y):
    """
    使用正规方程求解线性回归问题

    参数:
    X -- 输入特征矩阵 (m x n+1)
    y -- 目标值向量 (m x 1)

    返回:
    theta -- 模型参数向量 (n+1 x 1)
    """
    # 计算正规方程解
    theta = np.linalg.inv(X.T @ X) @ X.T @ y
    return theta
# 构造一个简单的数据集
X = np.array([[1, 1], [1, 2], [1, 3]])  # 添加偏置项 x0 = 1
y = np.array([2, 3, 4])

# 求解模型参数
theta = linear_regression_normal_equation(X, y)
print("模型参数 theta:", theta)


模型参数 theta: [1. 1.]
