In [None]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'
!pip install matplotlib numpy

Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple


# 奇异值分解

对于 $mxn$ 的实数矩阵$A$， 我们想把它分解为如下的形式：
$$
A=UDV^T \tag{1}
$$
其中 $U$ 和 $V$ 均为单位正交阵，即有 $UU^T=I$ 和 $VV^T=I$,$U$ 称为 左奇异矩阵
，$V$ 称为 右奇异矩阵，$D$ 仅在主对角线上有值，我们称之为 奇异值，其他元素均为0。上面的矩阵维度分别为： $U \in R^{m \times n}$ , $D \in R^{n \times n}$ ,$V \in R^{n \times n}$

在求解上面的 $U,D,V$ 时，可以利用如下性质：
$$
AA^T = UDV^TVD^TU^T = UDD^TU^T      \tag{2}   
$$
$$
A^TA = VD^TU^TUDV^T = VD^TDV^T      \tag{3}
$$

对公式（2）和（3）做特征分解，即可得到奇异值分解的结果。但分开求存在一定的问题，由于做特征值分解的时候，特征向量的正负号并不影响结果，如
对（2）和（3）做特征分解：
$$
AA^T \mu_i=\sigma_i\mu_i \space or \space AA^T(-\mu_i)=\sigma_i(-\mu_i) \tag{4}
$$
$$
A^TA \nu_i=\sigma_i \nu_i \space or \space A^TA(-\nu_i)=\sigma_i(-\nu_i) \tag{5}
$$
如果在计算过程取，取上面的 $\mu_i$ 组成左奇异矩阵 $U$，取 $-\nu_i$ 组成右奇异矩阵 $V$，此时$A \ne UDV^T$。因此求$\nu_i$时，要根据$\mu_i$来求，这样才能保证$A=UDV^T$。因此，我们可以得出如下计算SVD的算法。它主要是先做特性值分解，再根据特征值分解得到的左奇异矩阵U,间接地求出部分的右奇异矩阵$V'\in R^{m \times n}$`。

---
算法: SVD

---
输入： 样本数据
输出： 左奇异矩阵，奇异值矩阵，右奇异矩阵

---

1. 计算特征值：特征值分解 $AA^T$,其中 $A \in R^{m \times n}$ 为原始样本数据
$$
AA^T =  UDD^TU^T 
$$
得到左奇异矩阵$U \in R^{mxm}$ 和 奇异值矩阵$D'\in R^{m \times m}$

2. 间接求部分右奇异矩阵： 求$V'\in R^{m \times n}$
利用$A=UD'V'$可得
$$
V'=(UD')^{-1}A=(D')^{-1}U^TA
$$
3. 返回$U, D', V'$，分别为左奇异矩阵，奇异值矩阵，右奇异矩阵。

注意：这里得到的$D'$和$V'$与式（3）所得到的$D, V$有区别，它们的维度不一样。$D'$是只取了前𝑚个奇异值形成的对角方阵，即$D'\in R^{m\times m}$；$V'$不是一个方阵，它只取了$V \in R^{m \times n}$的前m行（假设m<n），即有$V'=V(:m,⋅)$。这样一来，我们同样有类似式（1）的数学关系成立，即

$$
A=UD'(V')^T \tag{6}
$$

我们可以利用此关系重建原始数据。

## SVD 实现


测试矩阵的生成：

In [None]:
import numpy as np
test=np.random.rand(4,3)
test

特征值分解：

In [None]:
# 计算特征值和特征向量
eval_sigma1,evec_u = np.linalg.eigh(test.dot(test.T))
eval_sigma1
evec_u

计算右奇异矩阵


In [None]:
#降序排列后，逆序输出
eva1_sort_idx = np.argsort(eval_sigma1)[::-1]
eva1_sort_idx


In [None]:
# 将特征值对应的特征向量也对应排好序
eval_sigma1 = np.sort(eval_sigma1)[::-1]
evec_u = evec_u[:,eva1_sort_idx]



In [None]:
# 计算奇异值矩阵的逆
eval_sigma1 = np.sqrt(eval_sigma1)
eval_sigma1_inv = np.linalg.inv(np.diag(eval_sigma1))
eval_sigma1


In [None]:
# 计算右奇异矩阵
evec_part_v = eval_sigma1_inv.dot((evec_u.T).dot(test))
evec_part_v

上面的计算出的evec_u, eval_sigma1, evec_part_v分别为左奇异矩阵，所有奇异值，右奇异矩阵。



## SVD降维后重建数据
取不同个数的奇异值，重建数据，计算出均方误差，随着奇异值个数的增加，均方误差（MSE）在减小，且奇异值和的比率正快速上升。

## 在图像压缩中的应用


1. 读图片

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np

imageurl="https://i.loli.net/2019/08/21/TwXSnfU1F8Btle4.png"
img_eg = mpimg.imread(imageurl)
print(img_eg.shape)

2. 奇异值分解

In [None]:
img_temp = img_eg.reshape(img_eg.shape[0],  img_eg.shape[1]*img_eg.shape[2] )
U,Sigma,VT = np.linalg.svd(img_temp)
U
Sigma
VT

我们先将图片变成二维，再做奇异值分解。从svd函数中得到的奇异值sigma它是从大到小排列的。

3. 取前部分奇异值重构图片

In [None]:
# 取前60个奇异值
sval_nums = 60
img_restruct1 = (U[:,0:sval_nums]).dot(np.diag(Sigma[0:sval_nums])).dot(VT[0:sval_nums,:])
img_restruct1 = img_restruct1.reshape(img_eg.shape[0],img_eg.shape[1],img_eg.shape[2])

# 取前120个奇异值
sval_nums = 120
img_restruct2 = (U[:,0:sval_nums]).dot(np.diag(Sigma[0:sval_nums])).dot(VT[0:sval_nums,:])
img_restruct2 = img_restruct2.reshape(img_eg.shape[0],img_eg.shape[1],img_eg.shape[2])

将图片显示出来看一下，对比下效果



In [None]:
fig, ax = plt.subplots(1,3,figsize = (24,32))

ax[0].imshow(img_eg)
ax[0].set(title = "src")
ax[1].imshow(img_restruct1)
ax[1].set(title = "nums of sigma = 60")
ax[2].imshow(img_restruct2)
ax[2].set(title = "nums of sigma = 120")

可以看到，当我们取到前面120个奇异值来重构图片时，基本上已经看不出与原图片有多大的差别。



# 总结
从上面的图片的压缩结果中可以看出来，奇异值可以被看作成一个矩阵的代表值，或者说，奇异值能够代表这个矩阵的信息。当奇异值越大时，它代表的信息越多。因此，我们取前面若干个最大的奇异值，就可以基本上还原出数据本身。
