# 稀疏矩阵

- 稀疏矩阵（sparse matrix）指的是在数值分析中绝大多数数值为零的矩阵。反之，如果大部分元素都非零，则这个矩阵是稠密的(Dense)
- 在科学与工程领域中求解线性模型时经常出现大型的稀疏矩阵

scipy.sparse 模块提供了处理稀疏矩阵的函数
- CSC - 压缩稀疏列（Compressed Sparse Column），按列压缩
- CSR - 压缩稀疏行（Compressed Sparse Row），按行压缩

In [2]:
import numpy as np
from scipy.sparse import csr_matrix

arr = np.array([0, 0, 0, 0, 0, 1, 1, 0, 2])

print(csr_matrix(arr))

  (0, 5)	1
  (0, 6)	1
  (0, 8)	2


In [5]:
arr = np.array([[0, 0, 0], [0, 0, 1], [1, 0, 2]])

# 使用data属性查看存储的数据
print(csr_matrix(arr).data)

# 统计非0元素的总数
print(csr_matrix(arr).count_nonzero())

[1 1 2]
3


In [6]:
# 删除矩阵中的0元素
mat = csr_matrix(arr)
mat.eliminate_zeros()

print(mat)

  (1, 2)	1
  (2, 0)	1
  (2, 2)	2


In [8]:
# 删除重复项
mat = csr_matrix(arr)
mat.sum_duplicates()

print(mat)

  (1, 2)	1
  (2, 0)	1
  (2, 2)	2


In [9]:
# csr转换为csc
arr = np.array([[0, 0, 0], [0, 0, 1], [1, 0, 2]])
newarr = csr_matrix(arr).tocsc()

print(newarr)

  (2, 0)	1
  (1, 2)	1
  (2, 2)	2
