# Linear Algebra Crash Course (with Python) Class 12


## Chap 10 总结 & 复习

# 概论

线性代数总结下来是讨论两大问题，一个是 $\mathbf{Mx}=\mathbf{b}$ 的方程式求解问题，一个是 $\mathbf{Mv}=\sigma \mathbf{v}$ 的特征值、特征向量问题。两个问题又被行列式串联起来，如果有 $\mathbf{M}$是方阵以及，$\mathtt{det}(\mathbf{M})=0$，则有非零向量$v$, 使得 $\mathbf{Mv}=\mathbf{0}$。 

透过特征方程式 $\mathtt{det}(\mathbf{M-\lambda})=0$求解 (代数基本定理),我们可以得到一连串行列式为零的方阵，并且尝试获得特征值、特征向量。 

特征值，与特征向量在解偏微分方程(PDE，Partial Differential Equation)非常有用，还有其它种种方面，问题在于并不是所有的方阵，都有完整的特征向量分解(特征值为复数是另一较小问题)，因此不具有普遍性。

对称矩阵则解决了完整的特征向量分解这个问题，而且还额外为特征向量提供正交性，在 PDE 也是非常有用，但由于要求对称性，所以局限性更高了。

（*）奇异值分解（以及伪逆）则是对所有的矩阵都有效，并且有奇异值为实数，基底变换为正交矩阵等优良性质，奇异值分解的计算依赖于对称矩阵的计算，事实上可以看作对称矩阵特征分解的附带结论，奇异值分解的缺点在需要解特征方程式，手算较为复杂。

（*）伪逆是基于奇异值分解的理论成果，完美解决了在欧式距离下的方程式求最佳解或是最佳近似解问题，缺点在于需要解特征方程式（或求不一定存在的逆矩阵），手算较为复杂。

## 线性映射
用线性映射的观点，可以比较好的诠释 方程式求解以及特征值、特征向量的问题。我们把一个 $m\times n$ 的矩阵 $\mathbf{M}$ 看成 $\mathbb{R}^n \rightarrow \mathbb{R}^m$ 的线性映射，我们则有 $\mathtt{Im}(\mathbf{M})$，以及 $\mathtt{ker}(\mathbf{M})$ 等观念，以及相关关于维数的定理。
注意 $\mathbf{x}\in \mathtt{ker}(\mathbf{M}) \Longleftrightarrow \mathbf{Mx}= \mathbf{0}$。以及 $\mathbf{b}\in \mathtt{Im}(\mathbf{M}) \Longleftrightarrow \mathbf{Mx}= \mathbf{b}$有解。 

在有限维的情况下，我们可以证明 $\mathbb{R}^n \rightarrow \mathbb{R}^n$ 的映射 $1-1$ 必然导致 onto，onto 必然导致 $1-1$。并由此证明$\mathbf{A},\mathbf{B}$ 都是 $n$ 维矩阵的情况下,若 $\mathbf{AB}=\mathbf{I}$ 则 $\mathbf{BA}=\mathbf{I}$。




## 基础行变换
初中数学的消元法(高斯消去法)，$LU$分解，以增广矩阵求取逆矩阵，行列式值的计算等等，都可以看成对原矩阵或是增广矩阵进行基础行变换操作，这里的核心是基础行变换操作是**可逆的**，**可以看成矩阵乘法**，大部分操作可以看成乘与一个行列式为1的**矩阵**，偶尔是-1以及其它，所以不会改变方程式的可解性，大致上不会改变原方阵的行列式。

基础列变换用的比较少。

## 列操作
操作列则不用这么麻烦，只需要一个向量就能操作，当然其结果也是一个向量。我们这里比较常做的事情是收集一堆列操作的结果成为一个矩阵。例如$\mathbf{Mp}_i= \sigma_i \mathbf{p}_i$，收集起来我们则有  $$\mathbf{MP}= \mathbf{P\Sigma}$$



## 二次型
二次型，可以说是对称方阵的一个应用，比如说我们有 $x^2+2xy+y^2+2xz+ z^2$, 其对应的对称方阵即为:
$\begin{bmatrix}
      1 & 1 & 1 \\
    1&1 &0 \\
	1&0&1 \end{bmatrix}$
显然
$$\begin{bmatrix} x& y & z\end{bmatrix}\begin{bmatrix}
      1 & 1 & 1 \\
    1&1 &0 \\
	1&0&1 \end{bmatrix} \begin{bmatrix} x\\ y \\ z\end{bmatrix}=x^2+2xy+y^2+2xz+ z^2$$

In [4]:
import sympy as sp
def print_nice(matrix):
  return sp.Matrix(matrix)

In [23]:
# ($5 例题14，P107)
M = sp.Matrix([[2,2,-1],[2,-1,2],[-1,2,2]])
lamda = sp.symbols('lamda')
# lambda is a conserved word in python
N = M- lamda *sp.eye(3)
print_nice(N)


Matrix([
[2 - lamda,          2,        -1],
[        2, -lamda - 1,         2],
[       -1,          2, 2 - lamda]])

In [11]:
N.det()

-lamda**3 + 3*lamda**2 + 9*lamda - 27

In [12]:
sp.solve(N.det())

[-3, 3]

In [17]:
N1=N.subs('lamda',-3)
N2=N.subs('lamda',3)
print_nice(N1)

Matrix([
[ 5, 2, -1],
[ 2, 2,  2],
[-1, 2,  5]])

观察一下这矩阵 rank 不会是 1，同时 $\begin{bmatrix} 1\\-2 \\1 \end{bmatrix}$ 在它的核 $\mathtt{kernel}$里面。

In [19]:
print_nice(N2)

Matrix([
[-1,  2, -1],
[ 2, -4,  2],
[-1,  2, -1]])

观察一下这矩阵 rank 是 1，因此 $\mathtt{kernel}$ 有二维，我们可以取 $\begin{bmatrix} 2\\1 \\0 \end{bmatrix}$, $\begin{bmatrix} 0\\1 \\2 \end{bmatrix}$ 注意这跟前一个特征向量，天生是垂直的，因此我们只需操作一下，使得这两个也互相垂直。

不妨修改第二个向量为 $\begin{bmatrix} 0\\1 \\2 \end{bmatrix} +k \begin{bmatrix} 2\\1 \\0 \end{bmatrix}$, 考虑一下与第一个向量内积并使其互相垂直，得到 $5k+1=0$, $k=-\frac{1}{5}$. 因此第二个向量为 $\begin{bmatrix} -\frac{2}{5} \\ \frac{4}{5} \\ 2 \end{bmatrix}$

In [26]:
v1= sp.Matrix([1,-2,1])
v2= sp.Matrix([2,1,0])
#v3 = sp.Matrix([-2/5,4/5,2])
v3 = sp.Matrix([sp.Rational(-2, 5),sp.Rational(4, 5),2])

In [33]:
v1= v1/v1.norm()
v2= v2/v2.norm()
v3= v3/v3.norm()
P = sp.BlockMatrix([v1,v2,v3])
print_nice(P)

Matrix([
[ sqrt(6)/6, 2*sqrt(5)/5, -sqrt(30)/30],
[-sqrt(6)/3,   sqrt(5)/5,  sqrt(30)/15],
[ sqrt(6)/6,           0,   sqrt(30)/6]])

In [34]:
print_nice(P*P.T)

Matrix([
[1, 0, 0],
[0, 1, 0],
[0, 0, 1]])

In [35]:
print_nice(M*P)

Matrix([
[-sqrt(6)/2, 6*sqrt(5)/5, -sqrt(30)/10],
[   sqrt(6), 3*sqrt(5)/5,   sqrt(30)/5],
[-sqrt(6)/2,           0,   sqrt(30)/2]])

In [36]:
print_nice(P.inv()*M*P)

Matrix([
[-3, 0, 0],
[ 0, 3, 0],
[ 0, 0, 3]])

## Cramer rule 补充

回忆 Cramer rule 如下：

假设$\mathtt{det}(\mathbf{M})\neq0$,$\mathbf{Mx}=\mathbf{b}_j$ 则我们可以把 $\mathbf{M}$ 的第 $i$ 个列向量换成 $\mathbf{b}_j$ 得到 $\mathbf{B}_{ij}$。则我们可以解出 $\mathbf{x}_j$, 其中 $$x_{ij}=\frac{\mathtt{det}(\mathbf{B}_{ij})}{\mathtt{det}(\mathbf{M})}$$
我们稍微叙述下证明的思路：
假设 $\mathbf{M}$ 为  $3 \times 3$ 可逆矩阵
	$$\mathbf{M}\begin{bmatrix}
      x_{1j} & 0& 0 \\
    x_{2j}&1& 0  \\
 x_{3j}&0& 1
	\end{bmatrix}=\begin{bmatrix}
      b_{1j} & m_{12}& m_{13} \\
    b_{2j}&m_{22}& m_{23}  \\
 b_{3j}&m_{32}& m_{33}
	\end{bmatrix}$$ 两边同取 $\mathtt{det}$ 则有 $\mathtt{det}(\mathbf{M})x_{1j}=\mathtt{det}(\mathbf{B}_{1j})$, 稍微变化一下中间乘的矩阵，可以得到 $\mathtt{det}(\mathbf{M})x_{ij}=\mathtt{det}(\mathbf{B}_{ij})$

回忆完毕。


现在令 $\mathbf{b}_1 = \begin{bmatrix}1 \\ 0 \\ 0 \end{bmatrix}$, $\mathbf{b}_2 = \begin{bmatrix}0 \\ 1 \\ 0 \end{bmatrix}$, $\mathbf{b}_3 = \begin{bmatrix}0 \\ 0 \\ 1 \end{bmatrix}$, 对应的 $(x_{ij})=\mathbf{M}^{-1}$