# A.06 数组计算之广播(Broadcasting)

NumPy 的通用函数可用于向量化操作，因而去掉了慢速的 Python 循环

另一种向量化操作方法是 NumPy 的*广播*功能

*广播*是一系列将二元通用函数（例如，相加、相减、相乘等）应用于不同尺寸数组的规则。

### 6.1 广播介绍

- 回顾：对于同样尺寸的数组，二元操作是对数组元素逐对进行

In [1]:
import numpy as np

In [2]:
a = np.array([0, 1, 2])
b = np.array([5, 5, 5])
a + b

array([5, 6, 7])

#### 广播的特点

- 广播 允许二元操作对不同尺寸的数组进行
- 例如 可让一个数组加上一个标题

In [3]:
a + 5

array([5, 6, 7])

#### 广播的本质

- 上述操作本质是：将值``5``<font color="red">伸展或复制</font>成数组``[5, 5, 5]``，然后与原数组 `a` 相加得到最后结果
- NumPy 广播的好处在于，复制值的操作仅<font color="red">停留在想象中</font>，实际上并没有做
- 可以<font color="red">扩展到更高维情况</font>，例如 一维数组 加 二维数组

In [4]:
M = np.ones((3, 3))
M

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [5]:
M + a

array([[1., 2., 3.],
       [1., 2., 3.],
       [1., 2., 3.]])

这里，先伸张一维数组 ``a``，向第二维广播，以匹配``M``的维度。

考虑如下更复杂的例子

In [6]:
a = np.arange(3)
b = np.arange(3)[:, np.newaxis]

print(a)
print(b)

[0 1 2]
[[0]
 [1]
 [2]]


In [7]:
a + b

array([[0, 1, 2],
       [1, 2, 3],
       [2, 3, 4]])

In [9]:
a = np.arange(12)

b = np.arange(12)[:,np.newaxis]

a


array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

#### 示意图

与前述伸张和广播以匹配维度的情况相同，这里

- 向量``a``和``b``都被伸张以匹配一个共同的维度
- 结果都伸张成二维数组。

本例的示意图如下

![Broadcasting Visual](figures/02.05-broadcasting.png)

浅色盒子代表广播值

再提醒一次：
- 伸张并不在操作过程中发生内存申请

### 6.2 广播规则

- 规则1 如果2个数组维数不同，维数少者进行填充（左边引导）
- 规则2 如果2个数组不是按所有的维匹配，具有维度(shape)为1的数组将延展以匹配另一个维度
- 规则3 如果任一维的尺度都不符，也不等于1，错误将发生

考虑以下例子

#### 广播示例 1

二维数组与一维数组相加

In [None]:
M = np.ones((2, 3))
a = np.arange(3)

两个数组的维度分别为：

- ``M.shape = (2, 3)``
- ``a.shape = (3,)``

由规则 1，数组``a``的维数较小，因此将被伸张填充成

- ``M.shape -> (2, 3)``
- ``a.shape -> (1, 3)``

由规则 2，两数组的第一维不匹配，因此将维度向这一维填充

- ``M.shape -> (2, 3)``
- ``a.shape -> (2, 3)``

最终，两数组匹配，维度为``(2, 3)``

In [None]:
M + a

#### 广播示例2

两个数组的广播

In [None]:
a = np.arange(3).reshape((3, 1))
b = np.arange(3)

写下它们的维度

- ``a.shape = (3, 1)``
- ``b.shape = (3,)``

规则 1 表明要填充数组``b``

- ``a.shape -> (3, 1)``
- ``b.shape -> (1, 3)``

同时，规则 2 表明，每一数组都要向另一数组看齐

- ``a.shape -> (3, 3)``
- ``b.shape -> (3, 3)``

In [None]:
a + b

#### 广播示例3

考虑两数组不兼容的情况

In [None]:
M = np.ones((3, 2))
a = np.arange(3)

In [None]:
M.shape, a.shape

本例与前例又有不同，矩阵``M``被转置了

会影响结果吗？会影响计算吗？

- ``M.shape = (3, 2)``
- ``a.shape = (3,)``

再注意，规则 1告知，要把数组 ``a``配置好

- ``M.shape -> (3, 2)``
- ``a.shape -> (1, 3)``

规则 2, ``a``的第一维被用来检验匹配矩阵``M``:

- ``M.shape -> (3, 2)``
- ``a.shape -> (3, 3)``

现在，规则 3

- 最后的形状不匹配，因此该两数组不相容

In [None]:
M + a

#### 潜在的混淆可能

- 是否可伸张 ``a`` 的右侧维度，而不是左侧维度？
- 但这不是广播的操作方式
- 这种灵活性或许适用于某些特例，但可能会产生歧义
- 如果本义是要右侧填充，应该做的是<font color="red">显式重构数组</font>（使用关键字``np.newaxis``，见[NumPy数组基础](A.03 NumPy 数组基础.ipynb))）

In [None]:
a[:, np.newaxis].shape

In [None]:
M + a[:, np.newaxis]

#### 广播的推广

- 运算符 ``+``的广播，可以推广到任一二元*通用函数*

例如，函数``logaddexp(a, b)``用于计算``log(exp(a) + exp(b))``，与初级方法相比，它具有更高的精度

In [None]:
np.logaddexp?

In [None]:
np.logaddexp(M, a[:, np.newaxis])

关于通用函数更多的内容，参看[A.04 NumPy 数组计算 —— 通用函数](A.04 NumPy 数组计算 —— 通用函数.ipynb)。

### 6.3 广播实战

#### 快速化手段

- 使用通用函数 —— 可避免慢速循环
- 广播更进一步扩展这一能力

#### 考虑若干有用的示例

- 中心化数组

假设有10组观察值，每组含三个数，按标准数组表示方式，将它们存放在一$10 \times 3$ 的数组中。

In [None]:
X = np.random.random((10, 3))
X

计算均值通过 ``mean`` 聚合函数（沿第一维）进行

In [None]:
Xmean = X.mean(0)
Xmean

现在通过减去均值得到中心化的数组 (此即广播操作):

In [None]:
X_centered = X - Xmean
X_centered

检查中心化的数组，其均值接近零

In [None]:
X_centered.mean(0)

### 6.4 二维函数绘图

广播特别适合给二维函数绘图。

设有函数 $z = f(x, y)$，利用广播来计算绘图网格

In [None]:
# x and y have 50 steps from 0 to 5
x = np.linspace(0, 5, 50)
y = np.linspace(0, 5, 50)[:, np.newaxis]

z = np.sin(x) ** 10 + np.cos(10 + y * x) * np.cos(x)

####  利用 Matplotlib 画图模块

- Matplotlib 后续有介绍

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

In [None]:
plt.imshow(z, origin='lower', extent=[0, 5, 0, 5],
           cmap='viridis')
plt.colorbar();

### 结束