Chapter 23

# 矩阵伪逆
Book_3《数学要素》 | 鸢尾花书：从加减乘除到机器学习 (第二版)

这段代码的目的是通过最小二乘法求解线性方程组，从而找到一个最佳的参数估计。给定矩阵 $A$ 和向量 $b$，我们希望找到一个向量 $x$ 使得 $Ax \approx b$，即使得 $Ax$ 与 $b$ 的差异最小。

首先，我们定义了一个矩阵 $A$，其包含了数据的特征或自变量，以及一个向量 $b$，它包含了对应的观测值或因变量。然后，我们使用最小二乘法的公式来计算参数向量 $x$：

$$
x = (A^T A)^{-1} A^T b
$$

这里，$A^T$ 是 $A$ 的转置，$A^T A$ 是 $A$ 的自乘矩阵，通常称为设计矩阵。我们首先计算 $A^T A$，然后求其逆，接着用它乘以 $A^T$ 和 $b$，最终得到参数向量 $x$。

这个过程可以看作是最小化平方误差的优化问题。我们的目标是最小化以下目标函数：

$$
\text{minimize} \quad ||Ax - b||^2
$$

通过求解这个优化问题，我们可以找到最佳的线性组合参数，从而使得模型的预测值 $Ax$ 尽可能接近观测值 $b$。

最后，程序输出计算得到的 $x$ 值，即最佳的参数估计。这些参数可以用来进一步分析或进行预测。

In [1]:
import numpy as np

In [2]:
A = np.array([[1,1],  # 定义矩阵A
              [1,1],
              [2,4],
              [2,4]])

In [3]:
b = np.array([[30],  # 定义矩阵b
              [35],
              [90],
              [110]])

In [4]:
x = np.linalg.inv(A.T@A)@A.T@b  # 计算线性方程的最小二乘解

In [5]:
print(x)  # 输出结果

[[15. ]
 [17.5]]
