In [1]:
import numpy as np


def load_data():
    A = np.mat([[0, 0, 0, 2, 2], [0, 0, 0, 3, 3], [0, 0, 0, 1, 1],
                [1, 1, 1, 0, 0], [2, 2, 2, 0, 0], [5, 5, 5, 0, 0],
                [1, 1, 1, 0, 0]])

    return A


A = load_data()
A

matrix([[0, 0, 0, 2, 2],
        [0, 0, 0, 3, 3],
        [0, 0, 0, 1, 1],
        [1, 1, 1, 0, 0],
        [2, 2, 2, 0, 0],
        [5, 5, 5, 0, 0],
        [1, 1, 1, 0, 0]])

In [2]:
#奇异值分解
U, temp, VT = np.linalg.svd(A)

sigma = np.zeros(A.shape)
for i in range(len(temp)):
    sigma[i, i] = temp[i]

U.shape, sigma.shape, VT.shape

((7, 7), (7, 5), (5, 5))

In [3]:
#U * U.T = E
np.around(U * U.T, decimals=1)

array([[ 1.,  0.,  0.,  0., -0., -0., -0.],
       [ 0.,  1.,  0., -0.,  0., -0.,  0.],
       [ 0.,  0.,  1.,  0., -0., -0., -0.],
       [ 0., -0.,  0.,  1., -0.,  0.,  0.],
       [-0.,  0., -0., -0.,  1., -0., -0.],
       [-0., -0., -0.,  0., -0.,  1., -0.],
       [-0.,  0., -0.,  0., -0., -0.,  1.]])

In [4]:
#V * V.T = E
np.around(VT * VT.T, decimals=1)

array([[ 1.,  0.,  0., -0.,  0.],
       [ 0.,  1.,  0.,  0., -0.],
       [ 0.,  0.,  1., -0.,  0.],
       [-0.,  0., -0.,  1.,  0.],
       [ 0., -0.,  0.,  0.,  1.]])

In [5]:
#U * sigma * V = A
np.around(U * sigma * VT, decimals=1)

array([[ 0., -0., -0.,  2.,  2.],
       [ 0., -0., -0.,  3.,  3.],
       [ 0., -0., -0.,  1.,  1.],
       [ 1.,  1.,  1.,  0.,  0.],
       [ 2.,  2.,  2., -0., -0.],
       [ 5.,  5.,  5.,  0.,  0.],
       [ 1.,  1.,  1., -0., -0.]])

In [6]:
#求保留90%信息量的切分点
def get_k():
    sigma_power_sum = np.power(sigma, 2).sum()

    _sum = 0
    for i in range(min(sigma.shape)):
        _sum += np.power(sigma[i, i], 2)

        #保留90%的信息量
        if _sum >= sigma_power_sum * 0.9:
            return i


k = get_k()
k

1

In [7]:
#矩阵降秩
U = U[:, :k]
sigma = sigma[:k, :k]
VT = VT[:k, :]

U.shape, sigma.shape, VT.shape

((7, 1), (1, 1), (1, 5))

In [8]:
#矩阵降秩
A2 = U * sigma * VT

np.around(A2, decimals=1)

array([[-0., -0., -0.,  0.,  0.],
       [-0., -0., -0.,  0.,  0.],
       [-0., -0., -0.,  0.,  0.],
       [ 1.,  1.,  1., -0., -0.],
       [ 2.,  2.,  2., -0., -0.],
       [ 5.,  5.,  5., -0., -0.],
       [ 1.,  1.,  1., -0., -0.]])

In [9]:
#计算矩阵的秩
np.linalg.matrix_rank(A), np.linalg.matrix_rank(A2)

(2, 1)