# 线性变换
$\quad$结论：**矩阵代表了一种线性变换，矩阵乘法能将一个向量线性变换为另一个向量**。  
$\quad$**线性变换**，可理解为函数，它有输入有输出，输入即与矩阵相乘的向量，输出即相乘的结果。假设线性变换为$T$，则需满足：
* 对$T$的定义域中一切$\mathbf{u},\mathbf{v}$，$T(\mathbf{u}+\mathbf{v})=T(\mathbf{u})+T(\mathbf{v})$，即$A(\mathbf{u}+\mathbf{v})=A\mathbf{u}+A\mathbf{v}$；  
* 对$T$的定义域中一切$\mathbf{u}$和数$c$，$T(c\mathbf{u})=cT(\mathbf{u})$，即$A(c\mathbf{u})=cA\mathbf{u}$；  

$\quad$有一些常见的线性变换是很容易想象的，例如围绕着原点的旋转、翻转等，这些在游戏制作过程中非常常见，只需要借助矩阵相乘即可实现。那么如何确定一个线性变换？只需抓住基变换即可，线性变换由它对空间的基向量的作用完全决定，因为任何的向量都可用基向量线性组合表示。  
$\quad$举个简单的例子。比如希望能对原空间作一次逆时针旋转90°，如下图所示：

<img src="./_image/8_1.png" width="850" height="300" />  

就这样得到一个旋转90°的变换矩阵$\begin{bmatrix}0 & -1\\1 & 0\end{bmatrix}$。通过这个矩阵，可以计算出任何一个向量在逆时针90°后的形成的新向量，比如$\begin{bmatrix}2\\2\end{bmatrix}$：

$$
\begin{bmatrix}0 & -1\\1 & 0\end{bmatrix}\begin{bmatrix}{}2
\\2
\end{bmatrix}=\begin{bmatrix}-2
\\2
\end{bmatrix}
$$

是不是很简单？不管多么复杂的线性变换（旋转、剪切等），只要记录好变换后的基向量即可，若是逆时针旋转θ呢？如下图所示：

<img src="./_image/8_2.png" width="850" height="300" />  

## 1.1几何解释-矩阵方程与逆矩阵
$\quad$可以结合回前面所学的一些知识，试着从几何上去理解。  
$\quad$比如说解方程$A\mathbf{x}=\mathbf{b}$，矩阵$A$是一次线性变换，那么要解的$\mathbf{x}$就是在线性变换后为$\mathbf{b}$的向量。比如说解方程$\begin{bmatrix}0 & -1\\1 & 0\end{bmatrix}\begin{bmatrix}\mathbf{x}_{1}\\
\mathbf{x}_{2}\end{bmatrix} =\begin{bmatrix}-2\\
2\end{bmatrix}$，需要找到与$A$相反的线性变换将$\mathbf{b}$再线性变换还原为$\mathbf{x}$，与$A$相反的线性变换就是**逆矩阵**$A^{-1}$。比如$A$是逆时针旋转90°，那么$A^{-1}$就是顺时针旋转90°：

<img src="./_image/8_3.png" width="850" height="300" />  

两个矩阵相乘即为两次线性变换，逆时针旋转90°后再顺时针旋转90°，当然是没有变换，$\begin{bmatrix}0 & -1\\1 & 0\end{bmatrix} \begin{bmatrix}0 & 1\\
-1 & 0\end{bmatrix}=\begin{bmatrix}1 & 0\\
0 & 1\end{bmatrix}$。  
$\quad$因此要解出$\mathbf{x}$，只需要一次相反的线性变换$A^{-1}\mathbf{b}=\begin{bmatrix}0 & 1\\-1 & 0\end{bmatrix} \begin{bmatrix}-2\\
2\end{bmatrix}=\begin{bmatrix}2\\
2\end{bmatrix}$。    
$\quad$若是方程无解呢？方程无解意味着矩阵$A$找不到相反的线性变换，比如说：

<img src="./_image/8_4.png" width="850" height="300" />  

线性变换后空间少了个维度，无法从低维的空间线性变换回高维的空间，故不存在逆矩阵，因此每个线性变换后的向量再也回不去了，方程无解。再推广一下，秩是矩阵列空间的维数，那么从几何上理解，秩就是线性变换后空间的维度，故一个满秩矩阵是可逆的。
## 1.2应用-图像旋转
$\quad$学习了线性变换后，来做点实际小应用，做目标检测的数据增强时，经常地对一张图片做一次旋转、翻转等，但是图片的改变导致目标输出值的坐标点也随之改变，这时得去计算某个坐标随着图片旋转或翻转后的新坐标。  
$\quad$图片的坐标以左上角作为原点，如下图所示，图中的红点就是我们要计算的坐标：

<img src="./_image/8_5.png" width="850" height="300" />  

$\quad$对图片的翻转用OpenCV很容易实现，但是图中红点变换后的坐标需要自己的去计算。举例对图片逆时针旋转90°，计算点(x,y)在翻转后的位置，分成两步：

<img src="./_image/8_6.png" width="850" height="300" />  

$\quad$第一步，旋转，即通过矩阵相乘即可，逆时针旋转90°的基为$\begin{bmatrix}0 & -1\\1 & 0\end{bmatrix}$，因此坐标(x,y)变换后为$\begin{bmatrix}0 & -1\\1 & 0\end{bmatrix}\begin{bmatrix}x\\
y\end{bmatrix}=\begin{bmatrix}-y\\
x\end{bmatrix}$.  
$\quad$第二步，平移，观察可知，图片平旋转后需要向下平移图片的宽度width的大小才可让左上角回到原点，故有$\begin{bmatrix}-y\\x-width\end{bmatrix}$，最后取绝对值即可完成：

$$
\begin{bmatrix}x\\y\end{bmatrix}\Rightarrow \begin{bmatrix}y\\
width-x\end{bmatrix}
$$

一条简单的公式即可完成计算。代码如下：

In [None]:
def img_rotate_90(img, landmark):
    # 获取图像尺寸
    height, width = img.shape[0], img.shape[1]

    # 若未指定旋转中心，则将图像中心设为旋转中心
    center = (width / 2, height / 2)

    # 执行旋转
    M = cv2.getRotationMatrix2D(center, 90, 1)
    rotate_img = cv2.warpAffine(img, M, (width, height))
    
    # 计算landmark在旋转后的坐标
    rotated_landmark = [i for i in landmark]
    for i in range(0, len(landmark), 2):
        # landmark为每个待计算的坐标点，例如[x,y,x1,y1,...,xn,yn]，两个两个出现
        rotated_landmark[i], rotated_landmark[i+1] = landmark[i+1], -landmark[i]+width
    return rotate_img, rotated_landmark

## 1.3非方阵的情况
$\quad$如果是非方阵呢？给定一个矩阵$m\times n$，当这个矩阵与$n$维向量做乘法时，表示将该向量从$n$维空间映射$m$维空间。下面分别讨论当$n>m$或$m>n$的情况。  
$\quad$当一个矩阵$n>m$时，例如$\begin{bmatrix}1 & 0 & -2\\-1 & 2 & -5\end{bmatrix}$，列空间的维数为3，拥有三个基向量，如下图所示：

<img src="./_image/8_7.png" width="580" height="300" />  

当它与一个三维向量做矩阵乘法时，会得到一个二维向量，相当于是做了一次降维，将三维向量投影到二维上、将空间上的一个向量投影到这三个向量所在的平面上，例如：

$$
\begin{bmatrix}1 & 0 & -2\\-1 & 2 & -5\end{bmatrix}\begin{bmatrix}1 \\
2 \\
3
\end{bmatrix}=\begin{bmatrix}-5 \\
-12\end{bmatrix}
$$

特别地，如果是一维的情况，例如$\begin{bmatrix}1 & -5\end{bmatrix}$，就相当于是一条直线上的两个点，如图：

<img src="./_image/8_8.png" width="650" height="300" />  

通过矩阵相乘来做降维是机器学习中常用的手法，例如[主成分分析法]。  
$\quad$当一个矩阵$m>n$时，例如$\begin{bmatrix}1 & 2\\0 & -4\\3 & -1\end{bmatrix}$，从几何上理解，即从三维空间取两个向量构成了一个平面，该平面与平面中的一个向量做乘法得到一个三维的向量，相当于是做了升维，将平面中的的向量投影到空间中，例如：

$$
\begin{bmatrix}1 & 2\\0 & -4\\3 & -1\end{bmatrix}\begin{bmatrix}5 \\
6
\end{bmatrix}=\begin{bmatrix}17 \\
-24 \\
9
\end{bmatrix}
$$

$\quad$从矩阵方程$A\mathbf{x}=\mathbf{b}$的角度，若$n>m$，未知量数目大于方程数，方程要从一个低维的向量逆变换为一个高维的向量，要么无解，要么无穷多解；若$m>n$，方程数大于未知量数，方程要从一个高维向量逆变换回一个低维向量，要么无解，要么一个解。