# 第二讲：矩阵消元



这个方法最早由[数学王子.高斯](https://zh.wikipedia.org/wiki/%E5%8D%A1%E7%88%BE%C2%B7%E5%BC%97%E9%87%8C%E5%BE%B7%E9%87%8C%E5%B8%8C%C2%B7%E9%AB%98%E6%96%AF)提出，我们以前解方程组的时候都会使用，现在来看如何使用矩阵实现消元法。

## 消元法(Elimination)

消元法，也叫高斯消元法：是为了解线性方程组的。设有线性方程组$Ax=b$

有三元方程组$\begin{cases}x&+2y&+z&=2\\3x&+8y&+z&=12\\&4y&+z&=2\end{cases}$,对应的矩阵形式$Ax = b$为$\begin{bmatrix}1&2&1\\3&8&1\\0&4&1\end{bmatrix}\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}2\\12\\2\end{bmatrix}$。

消元法思路

- 第一步，我们希望在第二个方程中消去$x$项，来操作系数矩阵$A = \begin{bmatrix}\underline{1}&2&1\\3&8&1\\0&4&1\end{bmatrix}$,下划线的元素为第一步的主元(pivot):

$\begin{bmatrix}\underline{1}&2&1\\3&8&1\\0&4&1\end{bmatrix}\xrightarrow{row_2-3*row_1}\begin{bmatrix}\underline{1}&2&1\\0&2&-2\\0&4&1\end{bmatrix}$

暂时我们先不去管$b$向量，先做完$A$的消元可以在做$b$的消元。(MATLAB等工具经常用到此算法)

- 第二步，消去第三个方程中的$y$项，第二行下划线的元素为第二个主元：


$\begin{bmatrix}\underline{1}&2&1\\0&\underline{2}&-2\\0&4&1\end{bmatrix}\xrightarrow{row_3-2*row_2}\begin{bmatrix}\underline{1}&2&1\\0&\underline{2}&-2\\0&0&\underline{5}\end{bmatrix}$

矩阵$A$消元至此完成。

> **注意：**矩阵消元的主元不能为零，如果某一个方程存在0的情况，则进行行交换，直到满足所有主元不为零；

上面的例子中，如果第三个方程$z$的系数成$−4$，则会导致第二步消元后最后一行全部为零，第三个主元就不存在，至此消元不能继续进行了，下一讲中会讲到这种**不可逆**的情况。

- 接下来**回代**（back substitution）: A矩阵后面几上$b$向量写成**增广矩阵**(augmented matrix)的形式：

$\left[\begin{array}{c|c}A&b\end{array}\right]=\left[\begin{array}{ccc|c}1&2&1&2\\3&8&1&12\\0&4&1&2\end{array}\right]\xrightarrow{row_2-3*row_1}\left[\begin{array}{ccc|c}1&2&1&2\\0&2&-2&6\\0&4&1&2\end{array}\right]\xrightarrow{row_3-2*row_2}\left[\begin{array}{ccc|c}1&2&1&2\\0&2&-2&6\\0&0&5&-10\end{array}\right]$


 代入方程组：$\begin{cases}x&+2y&+z&=2\\&2y&-2z&=6\\&&5z&=-10\end{cases}$ ,得结果：$x=2，y=1，z=−2$

使用`scipy.linalg`求解验证结果：

In [3]:
from scipy import linalg
import numpy as np
a = np.array([[1,2,1],[3,8,1],[0,4,1]])
b = np.array([2,12,2])
x = linalg.solve(a,b)
print(x)

[ 2.  1. -2.]


## 消元矩阵

上一讲我们学习了矩阵乘以向量的方法，有三个列向量的矩阵乘以另一个向量

按列的线性组合可以写作: 

$\begin{bmatrix}v_1&v_2&v_3 \end{bmatrix}\left[\begin{array}{c}3\\4\\5\end{array}\right] = 3v_1 + 4v_2 + 5v_3$

按矩阵乘法的形式有：

$\begin{bmatrix}1&2&7 \end{bmatrix} \left[\begin{array}{c}row_1\\row_2\\row_3\end{array}\right] = 1row_1 + 2row_2 +3row_3$


可以看出这是一个行向量从左边乘以矩阵，这个行向量按行操作矩阵的行向量，并将其合成为一个矩阵行向量的线性组合。


使用上面的例子，将消元法所做的行操作写成向量乘以矩阵的形式。

- 消元法第一步操作将第二行的值改为$row_2 - 3*row_1$,保持其余两行不变：

$\begin{bmatrix}1&0&0\\-3&1&0\\0&0&1\end{bmatrix}\begin{bmatrix}1&2&1\\3&8&1\\0&4&1\end{bmatrix}=\begin{bmatrix}1&2&1\\0&2&-2\\0&4&1\end{bmatrix} (记作：E_{21},目的是将第二行第一个元素变为零)$

> 单位矩阵$I=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}$，$I$之于矩阵运算相当于$1$之于四则运算。

- 消元法第二步操作就是求$E_{32}$消元矩阵，即将第三行第二个元素变为零，则：

$\begin{bmatrix}1&0&0\\0&1&0\\0&-2&1\end{bmatrix}\begin{bmatrix}1&2&1\\0&2&-2\\0&4&1\end{bmatrix}=\begin{bmatrix}1&2&1\\0&2&-2\\0&0&5\end{bmatrix}$

> 经过变换后的$E_{21},E_{32}$被称为：[初等矩阵（elementary matrix）](https://zhuanlan.zhihu.com/p/74875538)

- 最后，满足公式：$E_{32}(E_{12}A) = (E_{32}E_{21})A =U$ ,矩阵乘法不能随意变动相乘次序，但可以变动括号位置，也就是满足结合律（associative law）

**置换矩阵（permutation matrix）**：一种用于置换两行的矩阵

- 两行互换： 

$\begin{bmatrix}0&1\\1&0\end{bmatrix}\begin{bmatrix}a&b\\c&d\end{bmatrix}=\begin{bmatrix}c&d\\a&b\end{bmatrix}$

- 两列互换：

$\begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}0&1\\1&0\end{bmatrix}=\begin{bmatrix}b&a\\d&c\end{bmatrix}$

## 逆


以$E_{21}$为例，$\begin{bmatrix}\quad ?\quad\end{bmatrix}\begin{bmatrix}1&0&0\\-3&1&0\\0&0&1\end{bmatrix}=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}$,如何取消这次行变换？


根据消元法计算可，$row_2 {\color{red}-} 3*row_1$得单位矩I，逆变换为：$row_2 {\color{red}+} 3*row_1$，所以逆矩阵为：

$\begin{bmatrix}1&0&0\\3&1&0\\0&0&1\end{bmatrix}$

矩阵$E$得逆记作$E^{-1}$,满足公式：$E^{-1}E=I$