# 数值计算基础

### 原则1：矩阵相乘，小维度优先

矩阵 $A_{n\times p}$，向量 $x_{p\times 1}$，计算 $A^{T}Ax$。

In [1]:
import numpy as np
np.set_printoptions(linewidth=100)

np.random.seed(123)
n = 2000
p = 1000
A = np.random.normal(size=(n, p))
x = np.random.normal(size=p)

方法1：先计算 $A^{T}A$，再与 $x$ 相乘：

In [2]:
%timeit A.transpose().dot(A).dot(x) # O(pnp + pp)

136 ms ± 13.1 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


方法2：先计算 $Ax$，再左乘 $A^{T}$：

In [3]:
%timeit A.transpose().dot(A.dot(x)) # O(2np) 

4.12 ms ± 364 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


经验法则：对于更一般的矩阵乘法 $A_{m\times n}B_{n\times p}C_{p\times r}$，如果 $n\approx p$ 且 $m>r$，则优先计算 $BC$，反之优先计算 $AB$。

In [4]:
np.random.seed(123)
m = 1000
n = 500
p = 200
r = 100
A = np.random.normal(size=(m, n))
B = np.random.normal(size=(n, p))
C = np.random.normal(size=(p, r))

In [5]:
%timeit A.dot(B).dot(C)

18 ms ± 714 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [6]:
%timeit A.dot(B.dot(C))

12.1 ms ± 808 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


### 原则2：尽量避免显式矩阵求逆

矩阵 $A_{n\times n}$，向量 $b_{n\times 1}$，计算 $A^{-1}b$。

In [7]:
np.random.seed(123)
n = 1000
A = np.random.normal(size=(n, n))
b = np.random.normal(size=n)

方法1：先计算 $A^{-1}$，再与 $b$ 相乘：

In [8]:
%timeit np.linalg.inv(A).dot(b)

474 ms ± 74.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


方法2：解线性方程组 $Ax=b$：

In [9]:
%timeit np.linalg.solve(A, b)

257 ms ± 51.5 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


线性方程组右边也可以是矩阵，即 $A_{n\times n}$，$B_{n\times p}$，计算 $A^{-1}B$。

In [10]:
np.random.seed(123)
n = 1000
p = 100
A = np.random.normal(size=(n, n))
B = np.random.normal(size=(n, p))

In [11]:
%timeit np.linalg.inv(A).dot(B)

387 ms ± 39.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [12]:
%timeit np.linalg.solve(A, B)

259 ms ± 48.1 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


### 原则3：利用矩阵的特殊结构

矩阵 $A_{n\times n}$，对角矩阵 $W_{n\times n}$，计算 $WA$ 和 $AW$。

In [2]:
np.random.seed(123)
n = 1000
A = np.random.normal(size=(n, n))
w = np.random.normal(size=n)
W = np.diag(w)

In [3]:
%timeit W.dot(A)

37 ms ± 646 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [4]:
%timeit A.dot(W)

33 ms ± 713 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


令 $w_{n\times 1}$ 表示 $W$ 的对角元素，$WA$ 相当于将 $A$ 的每一列乘以 $w$，$AW$ 相当于将 $A$ 的每一行乘以 $w^{T}$。此时可利用 Numpy 的广播机制进行运算。

In [5]:
%timeit A * w.reshape(n, 1)

5.15 ms ± 508 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [6]:
%timeit A * w # 默认行向量，并非矩阵和向量乘法，利用广播

5.05 ms ± 261 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


### 练习：回归分析

计算 $\hat{y}=X(X^{T}X)^{-1}X^{T}y$

In [None]:
np.random.seed(123)
n = 2000
p = 500
X = np.random.normal(size=(n, p))
y = np.random.normal(size=n)