# Numpy 矩阵运算代码参考教程，请大家一定自己动手练习  
http://liao.cpython.org/numpy10/

# 书籍推荐，Part I 为数学基础
https://github.com/exacity/deeplearningbook-chinese

# 矩阵
如果把向量看成是对数的拓展，一个向量表示一组数；那么矩阵可以看成是对向量的拓展，一个矩阵表示一组向量。   
    
矩阵的行数和列数可以不相等，行数和列数相等的矩阵叫做方阵。
   
![1.png](attachment:1.png)


## 1. 矩阵的表示
$$ 
A = 
\left( %左括号
\begin{array}{ccc} 
a_{11} & a_{12} & a_{13}\\ %第一行元素
a_{21} & a_{22} & a_{23}\\ %第二行元素
a_{31} & a_{32} & a_{33}\\ %第三行元素
\end{array}
\right) %右括号
$$

$a_{ij}$ 表示第i行第j列

## 2. 矩阵的加法
$$
A = 
\left( %左括号
\begin{array}{ccc} 
a_{11} & a_{12} & ... & a_{1c}\\ 
a_{21} & a_{22} & ... & a_{2c}\\
... & ... & ... & ...\\
a_{r1} & a_{r2} & ... & a_{rc}\\ 
\end{array}
\right) %右括号
$$    
$$
B = 
\left( %左括号
\begin{array}{ccc} 
b_{11} & b_{12} & ... & b_{1c}\\ 
b_{21} & b_{22} & ... & b_{2c}\\
... & ... & ... & ...\\
b_{r1} & b_{r2} & ... & b_{rc}\\ 
\end{array}
\right) %右括号
$$

$$
A + B = 
\left( %左括号
\begin{array}{ccc} 
a_{11} + b_{11} & a_{12} + b_{12} & ... & a_{1c} + b_{1c}\\ 
a_{21} + b_{21} & a_{22} + b_{22} & ... & a_{2c} + b_{2c}\\
... & ... & ... & ...\\
a_{r1} + b_{r1} & a_{r2} + b_{r2} & ... & a_{rc} + b_{rc}\\ 
\end{array}
\right) %右括号
$$

## 3. 矩阵的数量乘法
$$
A = 
\left( %左括号
\begin{array}{ccc} 
a_{11} & a_{12} & ... & a_{1c}\\ 
a_{21} & a_{22} & ... & a_{2c}\\
... & ... & ... & ...\\
a_{r1} & a_{r2} & ... & a_{rc}\\ 
\end{array}
\right) %右括号
$$

$$
k \cdot A = 
\left( %左括号
\begin{array}{ccc} 
ka_{11} & ka_{12} & ... & ka_{1c}\\ 
ka_{21} & ka_{22} & ... & ka_{2c}\\
... & ... & ... & ...\\
ka_{r1} & ka_{r2} & ... & ka_{rc}\\ 
\end{array}
\right) %右括号
$$ 

## 4. 矩阵运算的基本性质

$$
A + B = B + A  
$$

$$
(A + B) + C = A + (B + C)
$$

$$
(ck)A = c(kA)
$$

$$
k \cdot (A + B) = k \cdot A + k \cdot B
$$

$$
(c + k) \cdot A = c \cdot A + k \cdot A
$$

## 5. 矩阵和向量的乘法
矩阵A的列数必须和向量u的元素个数一致， 矩阵A的行数没有限制。   
可以把一个矩阵看成向量的函数，完成了一个向量到另一个向量的映射。
![2.png](attachment:2.png)

$$
\begin{pmatrix}
a_{11} & a_{12} & ... & a_{1n}\\ 
a_{21} & a_{22} & ... & a_{2n}\\
... & ... & ... & ...\\
a_{m1} & a_{m2} & ... & a_{mn}\\ 
\end{pmatrix}
\cdot
\begin{pmatrix}
u_{1}\\ 
u_{2}\\
... \\
u_{n}\\ 
\end{pmatrix}
=
\begin{pmatrix}
a_{11} \cdot u_{1} & a_{12} \cdot u_{2} & ... & a_{1n} \cdot u_{n}\\ 
a_{21} \cdot u_{1} & a_{22} \cdot u_{2} & ... & a_{2n} \cdot u_{n}\\
... & ... & ... & ...\\
a_{m1} \cdot u_{1} & a_{m2} \cdot u_{2} & ... & a_{mn} \cdot u_{n}\\
\end{pmatrix}
$$

$$
\begin{pmatrix}
-- \vec r_{1} --\\ 
-- \vec r_{2} --\\
... \\
-- \vec r_{n} --\\ 
\end{pmatrix}
\cdot
\vec u
=
\begin{pmatrix}
\vec r_1 \cdot \vec u_{1}\\ 
\vec r_2 \cdot \vec u_{2}\\
... \\
\vec r_n \cdot u_{n}\\
\end{pmatrix}
$$

## 5. 矩阵和矩阵的乘法
矩阵A的列数必须和矩阵B的行数一致：$A_{mk} \cdot B_{kn} = C_{mn}$
![3.png](attachment:3.png)

$$
A \cdot B = A \cdot 
\begin{pmatrix}
| & | &  ... & |\\
\vec c_{1} & \vec c_{2} & ... &\vec c_{n} \\ 
| & | &  ... & |\\
\end{pmatrix}
= 
\begin{pmatrix}
| & | &  ... & |\\
A \cdot \vec c_{1} & A \cdot\vec c_{2} & ... &A \cdot \vec c_{n} \\ 
| & | &  ... & |\\
\end{pmatrix}
$$

$$
\begin{pmatrix}
-- \vec r_{1} --\\ 
-- \vec r_{2} --\\
... \\
-- \vec r_{n} --\\ 
\end{pmatrix}
\cdot
\begin{pmatrix}
| & | &  ... & |\\
\vec c_{1} & \vec c_{2} & ... &\vec c_{n} \\ 
| & | &  ... & |\\
\end{pmatrix}
=
\begin{pmatrix}
\vec r_1 \cdot \vec c_{1} & \vec r_1 \cdot \vec c_{2} ... & \vec r_1 \cdot \vec c_{n}\\ 
\vec r_2 \cdot \vec c_{1} & \vec r_2 \cdot \vec c_{2} ... & \vec r_2 \cdot \vec c_{n}\\
... ... \\
\vec r_m \cdot c_{1} & \vec r_m \cdot c_{2} ... & \vec r_m \cdot \vec c_{n}\\
\end{pmatrix}
$$

## 6. 矩阵乘法的性质
1. 矩阵的乘法不遵守交换律 $A \cdot B \neq B \cdot A $
2. $(A \cdot B) \cdot C = A \cdot (B \cdot C) $
3. $A \cdot (B + C) = A \cdot B + A \cdot C $
4. $(B + C) \cdot A = B \cdot A + C \cdot A $
5. 对于任意 $r * c$的矩阵$A$， 存在$c * x$的矩阵$O$，满足：$A \cdot O_{cx} = O_{rx}$
6. 对于任意 $r * c$的矩阵$A$， 存在$x * r$的矩阵$O$，满足：$ O_{xr} \cdot A = O_{xo}$

## 7. 矩阵的幂
只有方阵才可以进行幂运算: $A^k = A \cdot A \cdot ... \cdot A$, $k$个$A$相乘。

## 8.矩阵的转置
把矩阵的行变成列，列变成行。
$$
P = 
\begin{pmatrix} 
0 & 1 \\ 
2 & 3 \\ 
4 & 5 \\ 
\end{pmatrix}
$$

$$
P^T = 
\begin{pmatrix} 
0 & 2 & 4 \\ 
1 & 3 & 5 \\ 
\end{pmatrix}
$$

性质：
1. $(A^T)^T = A$
2. $(A + B)^T = A^T + B^T$
3. $(k \cdot A)^T = k \cdot A^T$
4. $(A \cdot B)^T = B^T \cdot A^T$

## 9. 单位矩阵
$I \cdot A = A$， $I$为单位矩阵。  
单位矩阵一定是方阵。
$$
I_n = 
\begin{pmatrix} 
1 & 0 & ... & 0\\ 
0 & 1 & ... & 0\\
... & ... & ... & ...\\
0 & 0 & ... & 1\\ 
\end{pmatrix}
$$

$$
I_n = (i_{kj})
\left\{ 
    \begin{array}{lr}
    1 , & (k = j) \\
    0 , & (k \neq j) &
    \end{array}
\right. 
$$

$$
\begin{pmatrix} 
1 & 0 \\ 
0 & 1 \\ 
\end{pmatrix}
\cdot
\begin{pmatrix} 
a & b & c \\ 
d & e & f \\ 
\end{pmatrix}
=
\begin{pmatrix} 
a & b & c \\ 
d & e & f \\ 
\end{pmatrix}
$$

## 10. 逆矩阵
回忆：数字系统中, $x \cdot (x^{-1}) = 1$   
在矩阵中， $AB = BA = I$, 则称$B$是$A$的逆矩阵，记作：$B = A^{-1}$。$A^0 = I$。        
A称为可逆矩阵，或者叫**非奇异**矩阵。   
有些矩阵是不可逆的，称为**奇异**矩阵。

如果$BA = I$, 则称$B$是$A$的左逆矩阵。   
如果$AC = I$, 则称$C$是$A$的右逆矩阵。   
如果一个矩阵$A$既存在左逆矩阵$B$,又存在右逆矩阵$C$，则$B=C$。  
可逆矩阵一定为方阵！   
非方阵一定不可逆！

## 11. 矩阵逆的性质
1. 对于矩阵$A$，如果存在逆矩阵$B$，则$B$唯一。(可以用反证法证明)
2. $(A^{-1})^{-1} = A$
3. $(A \cdot B)^{-1} = B^{-1}A^{-1}$
4. $(A^T)^{-1} = (A^{-1})^T$

## 12. 看待矩阵的四个重要视角
1. 数据表  

name | age
---- | ---
LearnShare | 12
Mike |  32

2. 线性系统
$$
\begin{cases}
2x_1 + x_2 = 1\\\\
\frac{1}{10}x_1+6x_2= 5
\end{cases}
$$

$$
\begin{bmatrix}
    2 & 1 \\\\
    1/10 & 6 
\end{bmatrix}
\cdot
\begin{bmatrix}
    x_1 \\\\
    x_2
\end{bmatrix}
=
\begin{bmatrix}
    1 \\\\
    5
\end{bmatrix}
$$
3. 变换（向量的函数）: $T \cdot \vec a = \vec b$
4. 空间
![4.png](attachment:4.png)

## 13. 线性系统和矩阵
线性方程：未知数x只能是一次方。$ax + b = y$，$x+y+3z = 0$。   
线性方程组组成了线性系统：
$
\begin{cases}
2x_1 + x_2 = 1\\\\
10x_1+6x_2= 5
\end{cases}
$

### 13.1 消元法
$
\begin{cases}
2x_1 + x_2 = 1\\\\
10x_1+6x_2= 5
\end{cases}
=>
\begin{cases}
12x_1 + 6x_2 = 6\\\\
10x_1+6x_2= 5
\end{cases}
=>
2x_1 = 1
=>
x_1 = 0.5
$

### 13.2 高斯消元法
利用增广矩阵  
 
$$
\begin{bmatrix}
    2 & 1 & | & 1\\\\
    10 & 6 & | & 5
\end{bmatrix}
=> 
\begin{bmatrix}
    12 & 6 & | & 6\\\\
    10 & 6 & | & 5
\end{bmatrix}
=> 
\begin{bmatrix}
    2 & 0 & | & 1\\\\
    10 & 6 & | & 5
\end{bmatrix}
=> 
\begin{bmatrix}
    1 & 0 & | & 0.5\\\\
    10 & 6 & | & 5
\end{bmatrix}
=> 
\begin{bmatrix}
    1 & 0 & | & 0.5\\\\
    0 & 1 & | & 0
\end{bmatrix}
$$

### 13.3求矩阵的逆
已知 $AA^{-1}= I$，把$A^{-1}$ 看成 
$
\begin{bmatrix}
    x1 & x2 \\\\
    x3 & x4 
\end{bmatrix}
$,  


那么求解过程为：
$
\begin{bmatrix}
    2 & 1 & | & 1 & 0\\\\
    10 & 6 & | & 0 & 1
\end{bmatrix}
=> 
\begin{bmatrix}
    1 & 0 & | & x1 & x2\\\\
    0 & 1 & | & x3 & x4
\end{bmatrix}
$,   


即：$(A | I) => (I | A^{-1})$

### 13.4 使用矩阵的逆求解
假设 $A^{−1}$ 存在，则 $Ax=b$ 的解 $x=A^{−1}b$
$$
\begin{bmatrix}
    x_1 \\\\
    x_2
\end{bmatrix}
=
\begin{bmatrix}
    2 & 1 \\\\
    1/10 & 6 
\end{bmatrix}^{-1}
\cdot
\begin{bmatrix}
    1 \\\\
    5
\end{bmatrix}
$$

## 14. 初等矩阵
**对单位矩阵进行一次初等变换，得到初等矩阵。**   
**高斯消元法的过程可以看成寻找一系列的初等矩阵E，使得：$E_p \cdot ... \cdot E_3 \cdot E_2 \cdot E_1 \cdot A = rref(A)$**
1. 矩阵中的某一行乘以一个常数：
$$
\begin{pmatrix} 
k & 0 & 0 \\ 
0 & 1 & 0 \\ 
0 & 0 & 1 \\
\end{pmatrix}
\cdot
\begin{pmatrix} 
0 & 1 \\ 
2 & 3 \\ 
4 & 5 \\ 
\end{pmatrix}
=
\begin{pmatrix} 
0 & k \\ 
2 & 3 \\ 
4 & 5 \\ 
\end{pmatrix}
$$
2. 矩阵的一行加（减）另一行的若干倍
$$
\begin{pmatrix} 
1 & 0 & 0 \\ 
0 & 1 & -p \\ 
0 & 0 & 1 \\
\end{pmatrix}
\cdot
\begin{pmatrix} 
0 & 1 \\ 
2 & 3 \\ 
4 & 5 \\ 
\end{pmatrix}
=
\begin{pmatrix} 
0 & 1 \\ 
2-4p & 3-5p \\ 
4 & 5 \\ 
\end{pmatrix}
$$
3. 交换矩阵的两行
$$
\begin{pmatrix} 
1 & 0 & 0 \\ 
0 & 0 & 1 \\ 
0 & 1 & 0 \\
\end{pmatrix}
\cdot
\begin{pmatrix} 
0 & 1 \\ 
2 & 3 \\ 
4 & 5 \\ 
\end{pmatrix}
=
\begin{pmatrix} 
0 & 1 \\ 
4 & 5 \\ 
2 & 3 \\ 
\end{pmatrix}
$$

## 15. 初等矩阵和可逆性
由于初等矩阵是对单位矩阵进行一次初等变换得到的，单位矩阵是可逆的，初等变换是可逆的，所以初等矩阵页数可逆的。

![5.png](attachment:5.png)

#### 证明：
1. 对于方阵$A$ ，如果$A$可逆，那么线性系统$Ax=0$只有唯一解,$x=0$。  
证明：
$
A \cdot x = O \\ 
A^{-1} \cdot A \cdot x = A^{-1} \cdot O \\
I \cdot x = O \\
x = O
$  
   
2. 线性系统$Ax=0$只有唯一解,$x=0$， 那么reef(A) = I   
证明：
假设A为$n*n$矩阵, $Ax=0$有唯一解，则有$n$个未知数，且$rref(A)$有$n$个非零行。   
根据行最简形式的定义，$rref(A)=I$
  
3. 若$rref(A)=I$， 则A可以表示成一系列初等矩阵的乘积。
证明：   
$E_p \cdot ... \cdot E_3 \cdot E_2 \cdot E_1 \cdot A = rref(A)=I$      
$(E^{-1}_1 \cdot E^{-1}_2 \cdot E^{-1}_3 \cdot ... \cdot E^{-1}_p ) \cdot E_p \cdot ... \cdot E_3 \cdot E_2 \cdot E_1 \cdot A = 
(E^{-1}_1 \cdot E^{-1}_2 \cdot E^{-1}_3 \cdot ... \cdot E^{-1}_p ) \cdot rref(A)$   
$I \cdot A = (E^{-1}_1 \cdot E^{-1}_2 \cdot E^{-1}_3 \cdot ... \cdot E^{-1}_p ) \cdot I$  
$A = E^{-1}_1 \cdot E^{-1}_2 \cdot E^{-1}_3 \cdot ... \cdot E^{-1}_p $
   
4. A可以表示成一系列初等矩阵的乘积, A可逆。   
$A = E_1 \cdot E_2 \cdot E_3 \cdot ... \cdot E_p $  
$B = E^{-1}_p \cdot ... \cdot E^{-1}_3 \cdot E^{-1}_3 \cdot E^{-1}_1 $   
$A \cdot B = I$   
$B = (E_1 \cdot E_2 \cdot E_3 \cdot ... \cdot E_p)^{-1} $  
$B \cdot A = ((BA)^{-1})^{-1} =  (A^{-1} \cdot B^{-1})^{-1}$  

## 16. 线性组合
对于若干个n维向量 $\vec v_1, \vec v_2, \vec v_3, ..., \vec v_p$，
$k_1 \vec v_1 + k_2 \vec v_2 + k_3 \vec v_3 + ... + k_p \vec v_p$ 称为这些向量的线性组合。
![6.png](attachment:6.png)

## 17. 线性相关和线性无关
对于若干个n维向量 $\vec v_1, \vec v_2, \vec v_3, ..., \vec v_p$，存在一组k不全为0，
使得$k_1 \vec v_1 + k_2 \vec v_2 + k_3 \vec v_3 + ... + k_p \vec v_p = 0$ ，
则称$\vec v_1, \vec v_2, \vec v_3, ..., \vec v_p$线性相关。

=> **其中一个**向量可以写成其他向量的线性组合。

对于若干个n维向量 $\vec v_1, \vec v_2, \vec v_3, ..., \vec v_p$，只有全为0时，
$k_1 \vec v_1 + k_2 \vec v_2 + k_3 \vec v_3 + ... + k_p \vec v_p = 0$ ，
则称$\vec v_1, \vec v_2, \vec v_3, ..., \vec v_p$线性无关。

=> **任何一个**向量都不可以表示成其他向量的线性组合。
![7.png](attachment:7.png)

### 17. 线性相关的重要性质
1. m个n维向量$\vec v_1, \vec v_2, \vec v_3, ..., \vec v_m$，若m>n，则$\vec v_1, \vec v_2, \vec v_3, ..., \vec v_m$线性相关。  
举例：100个三维向量一定线性相关。
![8.png](attachment:8.png)
  
2. $n*n$的方阵A，其列向量由$\vec v_1, \vec v_2, \vec v_3, ..., \vec v_n$组成，即：$A=(\vec v_1 \vec v_2  \vec v_3 ... \vec v_n)$,
则：A可逆 <=> $\vec v_1, \vec v_2, \vec v_3, ..., \vec v_n$ 线性无关。
![9.png](attachment:9.png)

## 18. 生成空间
![10.png](attachment:10.png)

思考：*最少几个向量生成二维空间？*  
一个向量只能生成这条直线上的其他向量  
二位空间中的3个向量肯定是现行相关的。  
所以？

**对于一个n维空间，至少需要n个向量才能够生成。**

n个向量何时才成整个空间？

## 19. 空间的基
若一组向量可以生成整个n维空间，且线性无关，这组向量一定有n个，称这组向量为这个n维空间的一组基。  
  
n个n维向量$\vec v_1, \vec v_2, \vec v_3, ..., \vec v_n$,若他们是这个n维空间的基：  
1. $\vec v_1, \vec v_2, \vec v_3, ..., \vec v_n$生成整个n维空间。  
2. $\vec v_1, \vec v_2, \vec v_3, ..., \vec v_n$线性无关。

![11.png](attachment:11.png)

在n维空间中，如果给定一组基，任何一个向量（或者是点）都可以表示成这组基的线性组合，**且表示方法唯一**。

## 20. 正交基和标准正交基
正交：垂直   
$\vec u \cdot \vec v = u_1 \cdot v_1 + u_2 \cdot v_2 + ... + u_n \cdot v_n = ||\vec u|| \cdot ||\vec v|| \cdot cos \theta$  
当 $\theta=90{\circ}$， $cos\theta = 0$，
$ \vec u \cdot \vec v = 0$   
  
两个向量相互垂直，两个向量相互正交。

正交向量组：一组向量，如果两两正交，则称为正交向量组。  
正交非零向量组一定线性无关。  
![12.png](attachment:12.png)

**如果空间中的一组基两两正交，则称这组基为一组正交基。**  
**标准正交基的模是1。**  
一个空间中的标准正交基也有无数组。

## 21. 行列式
https://zh.wikipedia.org/wiki/%E8%A1%8C%E5%88%97%E5%BC%8F   
  
行列式是**方阵**的一个属性。  
![16.png](attachment:16.png)

每组基之间的**有向**面积（或 体）来表示。

![17.png](attachment:17.png)

#### 有向
$
\begin{vmatrix}
    a & b \\
    c & d 
\end{vmatrix}
=
ad - bc
$

$
\begin{vmatrix}
    c & d \\
    a & b 
\end{vmatrix}
=
bc - ad
$

$
\begin{vmatrix}
    a & b \\
    c & d 
\end{vmatrix}
=
-\begin{vmatrix}
    c & d \\
    a & b 
\end{vmatrix}
$

## 22. 特征值和特征向量
![13.png](attachment:13.png)

$A \vec u = \lambda \vec u$  
$\lambda$称为A的特征值，   
$\vec u$称为对应于$\lambda$的特征向量。

### 22.1 求解特征值和特征向量
注意：零向量肯定能满足，是平凡解，所以特征向量不考虑零向量。   
思考：$\lambda = 0$的时候呢？   
$A \vec u = 0$有非零解，所以$\lambda = 0$不通用，特征值可以为0.
   
 => $A \vec u = \lambda \vec u$  
 => $A \vec u - \lambda \vec u = 0$   
 => $A \vec u - \lambda I \vec u = 0$   
 => $(A  - \lambda I ) u = 0$  
 => 有非零解
 => $det(A  - \lambda I ) = 0$
 
![14.png](attachment:14.png)

![15.png](attachment:15.png)

## 23. 对称矩阵
$$A = A^T$$
![18.png](attachment:18.png)

## 24. 矩阵的相似性
如果矩阵$A$，$B$满足$A = P^{-1}BP$，则称$A$和$B$相似。=》$B = P^{-1}AP$
![19.png](attachment:19.png)
观察$B$变换是在标准坐标系下，观察$A$变换是在$P$矩阵定义的坐标下，观察同一个矩阵，在不用坐标系下得到的结果也是不同的。
![20.png](attachment:20.png)

**$A$和$B$的特征方程相同、特征值相同。**
![21.png](attachment:21.png)

## 25. 矩阵的对角化
用最好的角度观察矩阵变换。

$A = PDP^{-1}$在p坐标系下观察A变换，得到$D$，$D$是一个对角矩阵。  
如果$A$有$n$个线性无关的特征向量，则$A$和某个$D$相似。   

$$
D = 
\begin{pmatrix} 
\lambda_0 & 0 & ... & 0\\ 
0 & \lambda_1 & ... & 0\\
... & ... & ... & ...\\
0 & 0 & ... & \lambda_n\\ 
\end{pmatrix}
\\\\
P=
\begin{pmatrix}
| & | &  ... & |\\
\vec u_{1} & \vec u_{2} & ... &\vec u_{n} \\ 
| & | &  ... & |\\
\end{pmatrix}
$$

证明：
![22.png](attachment:22.png)