# 第15章 奇异值分解
---
奇异值分解(singular value decomposition, SVD)是一种矩阵因子分解方法, 是线性代数的概念, 但在统计学中有广泛应用，PCA和LSA中都有应用，在本书中定义为基础学习方法.

## 奇异值分解定义与性质

### 定义

矩阵的奇异值分解是指将任意非零的$m\times n$实矩阵$A$表示为以下三个实矩阵乘积形式的运算
$$
A=U\mit\Sigma V^\mathrm T
$$
其中$U$是m阶正交矩阵, $V$是n阶正交矩阵, $\Sigma$是由降序排列的非负对角线元素组成的$m\times n$矩形对角矩阵.
> 如果n阶矩阵$A$满足:
$$U^TU = I\quad(即U^{-1}=U^T)$$
那么称$U$为正交矩阵,简称正交阵

满足
$$\Sigma = diag(\sigma_1, \sigma_2, \cdots, \sigma_p) \\
\sigma_1 \geq \sigma_2 \geq  \cdots \geq \sigma_p \geq 0 \\
p = min(m, n)
$$
$U$的列向量$u_i \in \mathbb{R}^{m}$称为$A$的**左奇异向量**(left-singular vector), $V$的列向量$v_i \in \mathbb{R}^{n}$称为$A$的**右奇异向量**(right-singular vector), $\sigma_i$称为**奇异值**(singular value). 矩阵$A$的秩就等于非零奇异值的个数

In [1]:
import numpy as np

In [18]:
# 5 X 4
A = np.array([[1, 0, 0, 0], [0, 0, 0, 4], [0, 3, 0, 0], [0, 0, 0, 0], [2, 0, 0, 0]])
A

array([[1, 0, 0, 0],
       [0, 0, 0, 4],
       [0, 3, 0, 0],
       [0, 0, 0, 0],
       [2, 0, 0, 0]])

In [3]:
u, sigma, v = np.linalg.svd(A)

In [4]:
u

array([[ 0.        ,  0.        , -0.4472136 ,  0.        , -0.89442719],
       [-1.        ,  0.        ,  0.        ,  0.        ,  0.        ],
       [ 0.        , -1.        ,  0.        ,  0.        ,  0.        ],
       [ 0.        ,  0.        ,  0.        ,  1.        ,  0.        ],
       [ 0.        ,  0.        , -0.89442719,  0.        ,  0.4472136 ]])

In [15]:
s_ = np.vstack((np.diag(sigma), np.zeros(4)))
s_

array([[ 4.        ,  0.        ,  0.        ,  0.        ],
       [ 0.        ,  3.        ,  0.        ,  0.        ],
       [ 0.        ,  0.        ,  2.23606798,  0.        ],
       [ 0.        ,  0.        ,  0.        , -0.        ],
       [ 0.        ,  0.        ,  0.        ,  0.        ]])

In [8]:
v  # V^T

array([[-0., -0., -0., -1.],
       [-0., -1., -0., -0.],
       [-1., -0., -0., -0.],
       [-0., -0., -1., -0.]])

In [19]:
np.dot(np.dot(u, s_), v)

array([[1., 0., 0., 0.],
       [0., 0., 0., 4.],
       [0., 3., 0., 0.],
       [0., 0., 0., 0.],
       [2., 0., 0., 0.]])

矩阵的奇异值分解并不是唯一的

完全奇异值分解：$A=U\mit\Sigma V^\mathrm T$

紧奇异值分解：$A=U_r\mit\Sigma_r V_r^\mathrm T$

截断奇异值分解：$A=U_k\mit\Sigma_k V_k^\mathrm T$