从一元线性回归和二元线性回归的解法中可以看到，线性回归的一般思路是这样的：

1. 定义损失函数：$ l = (y - \hat{y})^2 $
2. 将线性回归函数 $ \hat{y} = a_0 + a_1x_1 + a_2x_2 + ... + a_nx_n $ 代入损失函数，并求解系数 $a_0$，$a_1$，...，$a_n$ 使得损失函数最小
3. 损失函数的最小值可以通过对损失函数求导来实现，分别对每个系数求偏导，并令其等于 0
4. 得到一个关于各个系数的线性方程组，求解这个线性方程组得到各个系数的值

在求解二元线性回归时，线性方程组是这样的：

$$
\left\{
\begin{aligned}
\frac{\partial}{\partial a_0} F(a_0, a_1, a_2) &=& 2a_0 + 2a_1\bar{x_1} + 2a_2\bar{x_2} - 2\bar{y} &=& 0 \\
\frac{\partial}{\partial a_1} F(a_0, a_1, a_2) &=& 2a_1\bar{x_1^2} + 2a_2\bar{x_1x_2} + 2a_0\bar{x_1} - 2\bar{x_1y} &=& 0 \\
\frac{\partial}{\partial a_2} F(a_0, a_1, a_2) &=& 2a_2\bar{x_2^2} + 2a_1\bar{x_1x_2} + 2a_0\bar{x_2} - 2\bar{x_2y} &=& 0 \\
\end{aligned}
\right.
$$

求得方程组的解是：

$$
\left\{
\begin{aligned}
a_0 &=& \bar{y} - a_1\bar{x_1} - a_2\bar{x_2} \\
a_1 &=& \frac{(\bar{x_1y}-\bar{x_1}\bar{y})(\bar{x_2^2}-(\bar{x_2})^2) - (\bar{x_2y}-\bar{x_2}\bar{y})(\bar{x_1x_2}-\bar{x_1}\bar{x_2})}{(\bar{x_1^2}-(\bar{x_1})^2)(\bar{x_2^2}-(\bar{x_2})^2) - (\bar{x_1x_2}-\bar{x_1}\bar{x_2})^2} \\
a_2 &=& \frac{(\bar{x_1y}-\bar{x_1}\bar{y})(\bar{x_1x_2}-\bar{x_1}\bar{x_2}) - (\bar{x_2y}-\bar{x_2}\bar{y})(\bar{x_1^2} - (\bar{x_1})^2)}{(\bar{x_1x_2}-\bar{x_1}\bar{x_2})^2 - (\bar{x_2^2}-(\bar{x_2})^2)(\bar{x_1^2}-(\bar{x_1})^2)}
\end{aligned}
\right.
$$

可以看到，使用这种方法来求解线性回归非常麻烦。当我们扩展到多元线性回归时，这个计算量是极大的。那么有没有一种通用的方法来求解线性回归问题呢？我们不妨把上面的方程组化简：

$$
\left\{
\begin{aligned}
a_0 + a_1\bar{x_1} + a_2\bar{x_2} &=& \bar{y} \\
a_1\bar{x_1^2} + a_2\bar{x_1x_2} + a_0\bar{x_1} &=& \bar{x_1y} \\
a_2\bar{x_2^2} + a_1\bar{x_1x_2} + a_0\bar{x_2} &=& \bar{x_2y} \\
\end{aligned}
\right.
$$

转换为矩阵形式：

$$
\begin{aligned}{
\left[ 
\begin{array}{ccc}
1 & \bar{x_1} & \bar{x_2} \\
\bar{x_1} & \bar{x_1^2} & \bar{x_1x_2} \\
\bar{x_2} & \bar{x_1x_2} & \bar{x_2^2}
\end{array} 
\right ]
\left[ 
\begin{array}{ccc}
a_0 \\
a_1 \\
a_2
\end{array} 
\right ]
=
\left[ 
\begin{array}{ccc}
\bar{y} \\
\bar{x_1y} \\
\bar{x_2y}
\end{array} 
\right ]
}\end{aligned}
$$

所以：

$$
\begin{aligned}{
\left[ 
\begin{array}{ccc}
a_0 \\
a_1 \\
a_2
\end{array} 
\right ]
=
\left[ 
\begin{array}{ccc}
1 & \bar{x_1} & \bar{x_2} \\
\bar{x_1} & \bar{x_1^2} & \bar{x_1x_2} \\
\bar{x_2} & \bar{x_1x_2} & \bar{x_2^2}
\end{array} 
\right ]^{-1}
\left[ 
\begin{array}{ccc}
\bar{y} \\
\bar{x_1y} \\
\bar{x_2y}
\end{array} 
\right ]
}\end{aligned}
$$

In [5]:
import numpy as np

X1 = np.array([6000, 6000, 8000, 8000, 10000])
X2 = np.array([60, 80, 70, 100, 90])
Y = np.array([340000, 350000, 400000, 450000, 500000])

x1 = np.sum(X1) / X1.size
x2 = np.sum(X2) / X2.size
y = np.sum(Y) / Y.size
print("bar_x1 = {0}".format(x1))
print("bar_x2 = {0}".format(x2))
print("bar_y = {0}".format(y))

x1y = np.sum(np.multiply(X1, Y)) / Y.size
x2y = np.sum(np.multiply(X2, Y)) / Y.size
x1x1 = np.sum(np.multiply(X1, X1)) / Y.size
x1x2 = np.sum(np.multiply(X1, X2)) / Y.size
x2x2 = np.sum(np.multiply(X2, X2)) / Y.size
print("bar_x1y = {0}".format(x1y))
print("bar_x2y = {0}".format(x2y))
print("bar_x1x1 = {0}".format(x1x1))
print("bar_x1x2 = {0}".format(x1x2))
print("bar_x2x2 = {0}".format(x2x2))

# 不使用科学计数法
np.set_printoptions(suppress=True)

mx = np.array([1, x1, x2, x1, x1x1, x1x2, x2, x1x2, x2x2]).reshape(3, 3)
my = np.array([y, x1y, x2y]).reshape(3, 1)
a = np.linalg.inv(mx).dot(my)
print("a = {0}".format(a))

bar_x1 = 7600.0
bar_x2 = 80.0
bar_y = 408000.0
bar_x1y = 3188000000.0
bar_x2y = 33280000.0
bar_x1x1 = 60000000.0
bar_x1x2 = 620000.0
bar_x2x2 = 6600.0
a = [[62105.2631579 ]
 [   32.10526316]
 [ 1273.68421053]]


这里使用了矩阵求逆和乘法运算，在计算量上比之前的方法并没有减少，但是从编程的角度来说，确实简化了很多人工计算，直接使用 `a = np.linalg.inv(mx).dot(my)` 就完成了多元线性方程组的求解。