# NumPy 广播(Broadcast)

广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式， 对数组的算术运算通常在相应的元素上进行。首先我们一定要注意，执行 broadcast 的前提在于，两个 ndarray 执行的是 element-wise（按位加，按位减） 的运算，而不是矩阵乘法的运算，矩阵乘法运算时需要维度之间严格匹配。

如果两个数组 a 和 b 形状相同，即满足 a.shape == b.shape，那么 a*b 的结果就是 a 与 b 数组对应位相乘。这要求维数相同，且各维度的长度相同。

下面这种图是点积,np.dot
![image.png](attachment:image.png)

In [26]:
import numpy as np

a=np.array([1,2,3,4])
b=np.array([10,20,30,40])
c=a*b
print(c)
print(np.dot(a,b))

a = np.array([1,2,3])
b = np.array([2,2,2])
print(a*b) # a和b对应元素相乘
# a*b的结果是： [1*2,2*2,3*2]
'''
np.dot(a,b) # 这就不是对应元素操作，这是矩阵相乘。
# np.dot(a,b)的结果是a,b的点积。
'''

a = np.array([1,2,3])
b = 2
print(a*b) #a是1维向量，b是标量，这就是形状不同
# 结果也是：[1*2,2*2, 3*2]
'''
这是因为发生了广播。b被填充为[2,2,2]
然后a*b的效果变成了，[1,2,3]*[2,2,2]
'''

[ 10  40  90 160]
300
[2 4 6]
[2 4 6]


'\n这是因为发生了广播。b被填充为[2,2,2]\n然后a*b的效果变成了，[1,2,3]*[2,2,2]\n'

可以广播的几种情况：
假定只有两个数组进行操作，即A+B、A*B这种情况。

1. 两个数组各维度大小从后往前比对均一致,
广播是从内向外的扩展元素的，所有需要将两个元素从后往前对比 : )
举个例子：

In [27]:
A = np.zeros((2,5,3,4))
B = np.zeros((3,4))
print((A+B).shape) # 输出 (2, 5, 3, 4)

A = np.zeros((4))
B = np.zeros((3,4))
print((A+B).shape) # 输出(3,4)

(2, 5, 3, 4)
(3, 4)


举个反例：(报错：
ValueError: operands could not be broadcast together with shapes (2,5,3,4) (3,3)
为啥呢？因为最后一维的大小A是4，B是3，不一致。)

In [29]:
A = np.zeros((2,5,3,4))
B = np.zeros((3,3))
print((A+B).shape)

ValueError: operands could not be broadcast together with shapes (2,5,3,4) (3,3) 

2. 两个数组存在一些维度大小不相等时，有一个数组的该不相等维度大小为1
这是对上面那条规则的补充，虽然存在多个维大小不一致，但是只要不相等的那些维有一个数组的该大小是1就可以。

举个例子：

In [30]:
A = np.zeros((2,5,3,4))
B = np.zeros((3,1))
print((A+B).shape) # 输出：(2, 5, 3, 4)

A = np.zeros((2,5,3,4))
B = np.zeros((2,1,1,4))
print((A+B).shape) # 输出：(2, 5, 3, 4)

A = np.zeros((1))
B = np.zeros((3,4))
print((A+B).shape) # 输出(3,4)


# 下面是报错案例
# ValueError: operands could not be broadcast together with shapes (2,5,3,4) (2,4,1,4)
# 为啥报错？因为A和B的第2维不相等。并且都不等于1.
A = np.zeros((2,5,3,4))
B = np.zeros((2,4,1,4))
print((A+B).shape)

SyntaxError: invalid syntax (2212175785.py, line 18)

额外不相干的小知识：

数组新增一维的方法

In [31]:
a = np.array([0.0, 10.0, 20.0, 30.0])
a[:, np.newaxis] #新增一维

array([[ 0.],
       [10.],
       [20.],
       [30.]])

当运算中的 2 个数组的形状不同时，numpy 将自动触发广播机制。后面两行代码演示了数组a和b之间的逐元素乘法。当对不同形状的数组进行逐元素运算时，NumPy会将较小的数组广播以匹配较大数组的形状，然后再进行运算。在这种情况下，b被广播以匹配a的形状，然后进行逐元素乘法。如：

实例

In [6]:
a=np.array([[ 0, 0, 0],
           [10,10,10],
           [20,20,20],
           [30,30,30]])
b=np.array([0,1,2])
print(a+b)
print(a*b)
print(b*a)

[[ 0  1  2]
 [10 11 12]
 [20 21 22]
 [30 31 32]]
[[ 0  0  0]
 [ 0 10 20]
 [ 0 20 40]
 [ 0 30 60]]
[[ 0  0  0]
 [ 0 10 20]
 [ 0 20 40]
 [ 0 30 60]]


下面的图片展示了数组 b 如何通过广播来与数组 a 兼容。
![image.png](attachment:image.png)
4x3 的二维数组与长为 3 的一维数组相加，等效于把数组 b 在二维上重复 4 次再运算：

In [8]:
a=np.array([[ 0, 0, 0],
           [10,10,10],
           [20,20,20],
           [30,30,30]])
b=np.array([1,2,3])
bb=np.tile(b,(4,1)) # 重复b的各个维度,行复制为原来的4倍
print(a+bb)
print(a+b)

[[ 1  2  3]
 [11 12 13]
 [21 22 23]
 [31 32 33]]
[[ 1  2  3]
 [11 12 13]
 [21 22 23]
 [31 32 33]]


广播的规则:

让所有输入数组都向其中形状最长的数组看齐，形状中不足的部分都通过在前面加 1 补齐。

输出数组的形状是输入数组形状的各个维度上的最大值。

如果输入数组的某个维度和输出数组的对应维度的长度相同或者其长度为 1 时，这个数组能够用来计算，否则出错。

当输入数组的某个维度的长度为 1 时，沿着此维度运算时都用此维度上的第一组值。

简单理解：对两个数组，分别比较他们的每一个维度（若其中一个数组没有当前维度则忽略），满足：

数组拥有相同形状。
当前维度的值相等。
当前维度的值有一个是 1。
若条件不满足，抛出 "ValueError: frames are not aligned" 异常。

tile() 函数，就是将原矩阵横向、纵向地复制。

In [14]:
b = np.array( [1,2] )   # 表示有 1 行，2 列
c = np.array( [ [1], [2] ] )
bb = np.tile( b, (3,1)) # 表示把 b 在行方向复制为 3 行
cc = np.tile( c, (1,3)) # 表示把 c 在列方向复制为 3 列
print(bb,"\n",cc)

[[1 2]
 [1 2]
 [1 2]] 
 [[1 1 1]
 [2 2 2]]


上面三个笔记写得很一般，没有抓到本质。

numpy.tile(A , reps)
这里的 A 就是数组，reps 可以是一个数，一个列表、元组或者数组等，就是类数组的类型。先要理解准确，先把 A 当作一个块（看作一个整体，别分开研究每个元素）。

（1）如果 reps 是一个数，就是简单的将 A 向右复制 reps - 1 次形成新的数组，就是 reps 个 A 横向排列：

In [17]:
a=np.array([[1,2],[3,4]],dtype="i1")
print(a)
b=np.tile(a,2)
print(b)

[[1 2]
 [3 4]]
[[1 2 1 2]
 [3 4 3 4]]


（2）如果 reps 是一个 array-like（类数组的，如列表，元组，数组）类型的，它有两个元素，如 [m , n]，实际上就是将 A 这个块变成 m * n 个 A 组成的新数组，有 m 行，n 列 A：

In [21]:
a=np.array([[1,2],[3,4]],dtype='i1')
print(a,"\n")
b=np.tile(a,(2,3)) # 2 * 3 个 A 组成新数组
print(b)
print("\n")
a = np.array([0, 1, 2])
a_ = np.tile(a, [2, 2])
print(a,"\n\n",a_)

[[1 2]
 [3 4]] 

[[1 2 1 2 1 2]
 [3 4 3 4 3 4]
 [1 2 1 2 1 2]
 [3 4 3 4 3 4]]


[0 1 2] 

 [[0 1 2 0 1 2]
 [0 1 2 0 1 2]]
