# 第1章 用空间的语言表达向量、矩阵和行列式

| |字面意思|实际意思|
| :-: | :-: | :-: |
|向量|排成一列的数字|有向线段（带有方向的线段）、空间内的点|
|矩阵|排成矩阵的数字|空间到空间的映射|
|行列式|麻烦的计算|上面的映射对应的“体积扩大率”|

在技术层面，本章的目标时掌握四则运算。

## 1.1 向量与空间

当我们需要把几数值放在一起，作为一个整体来处理时，就有了向量。

### 1.1.1 最直接的定义：把数值罗列起来就是向量

在没有特别说明的情况下，提到向量，就是指“列向量”。由于列向量书写起来比较占空间，所以经常采用如下写法：
$$
\begin{pmatrix}x_1，\dots，x_n \end{pmatrix}^T
=
\begin{pmatrix}x_1 \\ \vdots \\ x_n \end{pmatrix}
$$

向量的加法：
$$
\begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix}
+
\begin{pmatrix} y_1 \\ \vdots \\ y_n \end{pmatrix}
=
\begin{pmatrix} x_1+y_1 \\ \vdots \\ x_n+y_n \end{pmatrix}
$$

标量与向量的乘法：
$$
c
\begin{pmatrix}
x_1 \\ 
\vdots \\
x_n
\end{pmatrix}
=
\begin{pmatrix} 
cx_1 \\
\vdots \\
cx_n 
\end{pmatrix}
$$

### 1.1.2 “空间”的形象

强调向量的位置的时候，也称为**位置向量**。

除了用位置聊表示向量意外，也可以用有向线段来解释，其中线段的起点是远点$O$，终点是该向量对应的位置。在用有向线段解释向量的情况下，就可以通过图形来理解向量的加减法和标量与向量乘法。

### 1.1.3 基底

对于一个附加了加法与标量乘法运算的世界，我们就称之为**线性空间**，也有人称之为**向量空间**。

线性空间是我们生活的现实空间的一个缩影，是对现实空间的抽象化。在这个抽象世界中，我们能做的只有加法、标量乘法，一切都是这么简单直接。

在这个世界中，没有定义长度，也没有定义角度。对于不同方向的向量，无法比较大小。旋转操作同样没有定义。在最朴素的线性空间中，这些功能都被剥夺了。

*从线性空间去掉原点，我们会得到一个全新的世界，人称**仿射空间**，也是非常有用的理论体系。*

作为基准的一组向量叫做**基底**，沿着各个基准向量走的步数叫做**坐标**。作为基底的向量，叫做**基向量**。

### 1.1.4 构成基底的条件

只有当一下两个条件同时满足时，一组向量$(\vec{e_1}，\dots，\vec{e_n})$才能称为基底。

1. （当前空间中的）任何向量$\vec{v}$都可以表示成$$\vec{v}=x_1\vec{e_1}+\dots+x_n\vec{e_n}$$的形式($x_1，\dots，x_n$为任意数})
2. 并且这种表示方法是唯一的。

两者互为**对偶**(逆否)命题。“非A则非B”与“B则A”是一回事。

对于给定的向量$\vec{e_1}，\dots，\vec{e_n}$，我们可以用标量$u_1，\dots，u_n$表示出来的向量$u_1\vec{e_1}+\dots+u_n\vec{e_n}$称为$\vec{e_1}，\dots，\vec{e_n}$的线性组合。

### 1.1.5 维数

维数=基向量的个数=坐标的分量数

### 1.1.6 坐标

不指定基底的情况下，讨论坐标根本没有意义。

有两组基底的情况下，会出现根据一组基底对应的坐标求另一组基底对应的坐标的“坐标变换”问题。


## 1.2 矩阵和映射

### 1.2.1 暂时的定义

把数排列成长方形就是**矩阵**。

需要强调矩阵规模（大小、高和宽，行数和列数）的时候，我们可以称2x2、2x3或5x3矩阵。特别地，当行数和列数相同时，我们称之为**正方矩阵**。需要强调方阵的规模时，则将2x2方阵简称为2阶方阵，将3x3方阵简称为3阶方阵，依此类推。

矩阵$A$中第$i$行第$j$列的值，称为$A$的$(i，j)$元素。当提到$(i，j)$元素时，是先行后列的顺序。

一般情况下，我们用大写字母表示矩阵。

矩阵的加法和标量乘法，按照以下规则定义。

**加法**  相同规模（行数和列数相等）的矩阵之间的加法为
$$
\begin{pmatrix} a_{11} &\dots &a_{1n}\\ \vdots &\quad &\vdots \\ a_{m1} &\dots &a_{mn} \\ \end{pmatrix}
+
\begin{pmatrix} b_{11} &\dots &b_{1n}\\ \vdots &\quad &\vdots \\ b_{m1} &\dots &b_{mn} \\ \end{pmatrix}
=
\begin{pmatrix} a_{11}+b_{11} &\dots &a_{1n}+b_{1n}\\ \vdots &\quad &\vdots \\ a_{m1}+b_{m1} &\dots &a_{mn}+b_{mn} \\ \end{pmatrix}
$$

**标量乘法** 对任意标量c，有
$$
c\begin{pmatrix} a_{11} &\dots &a_{1n}\\ \vdots &\quad &\vdots \\ a_{m1} &\dots &a_{mn} \\ \end{pmatrix}
=
\begin{pmatrix} ca_{11} &\dots &ca_{1n}\\ \vdots &\quad &\vdots \\ ca_{m1} &\dots &ca_{mn} \\ \end{pmatrix}
$$

**乘积** 对于$m\times n$矩阵与$n$维向量，有
$$
\begin{pmatrix} a_{11} &\dots &a_{1n}\\ \vdots &\quad &\vdots \\ a_{m1} &\dots &a_{mn} \\ \end{pmatrix}
\begin{pmatrix} x_1 \\ \vdots\\ x_n\\\end{pmatrix}
=
\begin{pmatrix} a_{11}x_1+\dots+a_{1n}x_n\\ \quad \vdots \quad \\ a_{m1}x_1+\dots+a_{mn}x_n \\ \end{pmatrix}
$$

关于矩阵和向量的乘积，有：

- 矩阵与向量的乘积是向量
- 矩阵的列数（宽度）为“输入”的向量维数，行数（高度）为“输出”向量的维数
- 计算时，就好比把输入的列向量放倒，庵后将对应的元素分别相乘……

对于矩阵$A$，如果$x+y=z$成立，那么$Ax+Ay=Az$也成立；同样，若$cx=y$成立，则$c(Ax)=Ay$也成立。

矩阵是一种**表示“平直”关系的便利手段**。

一般来讲，满足$f(x+y)=f(x)+f(y)$以及$f(cx)=cf(x)$的映射$f$，称为**线性映射**。

矩阵就是用坐标来表示的线性映射。

### 1.2.2 用矩阵来表达各种关系

矩阵和向量的乘积表示了“平直”的关系。

自变量对因变量的整体影响的表现就是矩阵。

### 1.2.3 矩阵就是映射

将$n$维向量$x$乘以$m\times n$矩阵$A$，能得到m维向量$y=Ax$。也就是说，指定了矩阵$A$，就确定了从向量到另外一个向量的映射。

$m\times n$矩阵$A$表示从$n$维空间到$m$维空间的一个映射。

### 1.2.4 矩阵的乘积=映射的合成

矩阵和矩阵之间的乘积，定义如下。

**乘积**  对于$k\times m$矩阵$B=(b_{ij})$和$m\times n$矩阵$A=(a_{jp})$，有
$$
\begin{pmatrix} b_{11} &\dots &b_{1m}\\ \vdots &\quad &\vdots \\ b_{k1} &\dots &b_{km} \\ \end{pmatrix}
\begin{pmatrix} a_{11} &\dots &a_{1n}\\ \vdots &\quad &\vdots \\ a_{m1} &\dots &a_{mn} \\ \end{pmatrix}
=
\begin{pmatrix} (b_{11}a_{11}+\dots+b_{1m}a_{m1}) &\dots &(b_{11}a_{1n}+\dots+b_{1m}a{mn})\\ \quad \vdots &\quad &\vdots \quad \\ (b_{k1}a_{11}+\dots+b_{km}a_{m1} &\dots &(b_{k1}a_{1n}+\dots+b_{km}a_{mn})\\ \end{pmatrix}
$$

$k\times m$矩阵乘以$m\times n$矩阵得到的是$k\times n$矩阵。计算步骤如下：

1. 将右边的矩阵按列分割，将每一列看做一个列向量
2. 将分割开的列向量分别于左边的矩阵做乘法（矩阵与向量的乘法）
3. 把所得的结果拼接起来。

先$A$后$B$便是$BA$。写成式子就是$$(BA)x=B(Ax)$$ 无论$x$是什么向量，上式都成立。

### 1.2.5 矩阵运算的基本性质

- $(cA)x=c(Ax)=A(cx)$
- $(A+B)x=Ax+Bx$
- $A+B=B+A$
- $(A+B)+C=A+(B+C)$
- $(c+c')A=cA+c'A$
- $cc'A=c(c'A)$
- $A(B+C)=AB+AC$
- $(A+B)C=AC+BC$
- $(cA)B=c(AB)=A(cB)$

### 1.2.6 矩阵的乘方=映射的迭代

对于方阵A，有下式成立：$$AA=A^2， AAA=A^3， \dots$$ 在运算顺序上，乘方的优先级高于加减乘除运算。

设$A，B$是规模相同的两个方阵，则有如下关系：
$$(A+B)^2=A^2+AB+BA+B^2$$
$$(A+B)(A-B)=A^2-AB+BA-B^2$$
$$(AB)^2=ABAB$$

### 1.2.7 零矩阵、单位矩阵、对角矩阵

所有元素都是0的矩阵称为**零矩阵**，记为$O$。要强调矩阵规模时，用$O_{m,n}$来表示$m\times n$零矩阵，用$O_{n,n}$来表示n阶零方阵。

方阵中，如果除了“\”方向的对角元素是1，其余元素都是0，则该矩阵称为**单位矩阵**，记为$I$。要强调矩阵规模的时候，用$I_n$来表示$n$阶单位矩阵。

单位矩阵表示的映射是“什么都不做”的映射。

在方阵中，“\”方向的对角线上的值称为**对角元素**。对角元素以外的值为**非对角元素**。

非对角元素全部为0的矩阵称为**对角矩阵**。

对角矩阵表示的映射是“沿着坐标轴伸缩”，其中对角元素就是各轴伸缩的倍率。因此，根据对角元素的不同，空间变形也会呈现出不同的模样。

可以采用以下记法:
$$
\begin{pmatrix}
a_1 \quad 0 \quad 0 \quad 0 \quad 0 \\ 
0 \quad a_2 \quad 0 \quad 0 \quad 0 \\ 
0 \quad 0 \quad a_3 \quad 0 \quad 0 \\
0 \quad 0 \quad 0 \quad a_4 \quad 0 \\
0 \quad 0 \quad 0 \quad 0 \quad a_5
\end{pmatrix}
=
\begin{pmatrix}
a_1 &\quad &O \\
\quad &\ddots &\quad \\
O &\quad &a_5
\end{pmatrix}
=
\begin{pmatrix}
a_1 &\quad &\quad \\
\quad &\ddots &\quad \\
\quad &\quad &a_5
\end{pmatrix}
=diag(a_1, a_2, a_3, a_4, a_5)
$$

对于对角矩阵$A$，$y=Ax$可以分成$n$个独立的子系统。$$y_1=a_1x_1 \\ \vdots \\ y_n=a_nx_n$$ 换句话说，即使看似是$n$维问题，实际上也只是$n$个一维问题而已。

### 1.2.8 逆矩阵=逆映射

对于方阵$A$，它的逆映射对应的矩阵称为$A$的逆矩阵，记为$A^{-1}$。对于任意的向量$x$，若有$Ax=y$，则有$A^{-1}y=x$成立。

把向量压扁成一点（扁平化）的映射所对应的逆矩阵是不存在的。

基本性质：

- $(A^{-1})^{-1}=A$
- $(AB)^{-1}=B^{-1}A^{-1}$
- $(A^k)^{-1}=(A^{-1})^k$
- $diag(1/a_1,\dots,a_n)diag(a_1,\dots,a_n)=diag(a_1/a_1,\dots,a_n/a_n)=diag(1,\dots,1)=I$
