In [1]:
from scipy.sparse import lil_matrix, csr_matrix

### lil_matrix 演算処理が遅い形式

In [2]:
a = lil_matrix((5,5))
a

<5x5 sparse matrix of type '<class 'numpy.float64'>'
	with 0 stored elements in LInked List format>

In [3]:
a[0,0]=1
a[1,1]=2
a[2,2]=3
a

<5x5 sparse matrix of type '<class 'numpy.float64'>'
	with 3 stored elements in LInked List format>

In [4]:
a.toarray()

array([[1., 0., 0., 0., 0.],
       [0., 2., 0., 0., 0.],
       [0., 0., 3., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [5]:
%%timeit
a2 = a + a

289 µs ± 7.67 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


### csr_matrix 行のアクセスが速い形式

In [6]:
a_csr = a.tocsr()
a_csr

<5x5 sparse matrix of type '<class 'numpy.float64'>'
	with 3 stored elements in Compressed Sparse Row format>

In [7]:
%%timeit
a_csr2 = a_csr + a_csr

113 µs ± 716 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


### csc_matrix 列のアクセスが速い形式

In [8]:
a_csc = a.tocsc()
a_csc

<5x5 sparse matrix of type '<class 'numpy.float64'>'
	with 3 stored elements in Compressed Sparse Column format>

In [9]:
%%timeit
a_csc2 = a_csc + a_csc

118 µs ± 4.78 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


### まとめ
* 逐次データを更新する場合は、lil_matrixを使用する
* 演算する場合は、csr_matrixまたはcsc_matrixを使用する
* csr_matrixとcsc_matrixはどちらで演算しても同程度の速度
  * ただし、同じ型同士が良い模様。