## numpy中数组计算的广播机制

numpy模块的两个数组做相应运算时（+，-，*，\），是按照元素进行（和线性代数运算区别）。做这种运算的前提条件是：两个数组的shape一致。如果两个数组的shape不一致，numpy会实行广播机制。

当两个数组的形状并不相同的时候，我们可以通过扩展数组的方法来实现相加、相减、相乘等操作，这种机制叫做广播（broadcasting）。
比如，一个二维数组减去列平均值，来对数组的每一列进行距平化处理：

In [2]:
import numpy as np
import random

In [9]:
arr = np.random.randn(4,3)
arr

array([[ 0.28884164, -1.74328561, -1.05925287],
       [-0.23169775,  1.42495722,  0.87593576],
       [ 0.91126661,  0.93264832,  1.46388955],
       [ 0.89833404, -0.32648783,  0.43164774]])

In [4]:
arr_mean = arr.mean(0)
print(arr_mean)
arr_mean.shape

[ 0.11643465  0.10773404 -0.71046974]


(3,)

In [36]:
arr-arr_mean

array([[-0.9259803 ,  0.17030095, -0.92905622],
       [-0.04549615, -0.71719414, -0.0104473 ],
       [-0.00704713,  0.46832089,  0.61928124],
       [ 0.97852358,  0.0785723 ,  0.32022228]])

上式arr和arr_mean维度并不形同，但是它们可以进行相减操作，这就是通过广播机制来实现的

In [12]:
arr_mean = arr.mean(1)
print(arr_mean)
arr_mean.shape

[-0.83789894  0.68973174  1.10260149  0.33449799]


(4,)

In [13]:
arr-arr_mean

ValueError: operands could not be broadcast together with shapes (4,3) (4,) 

广播的原则：如果两个数组的后缘维度（trailing dimension，即从末尾开始算起的维度）的轴长度相符，或其中的一方的长度为1，则认为它们是广播兼容的。广播会在缺失和（或）长度为1的维度上进行(这句话乃是理解广播的核心)。广播主要发生在两种情况，一种是两个数组的维数不相等，但是它们的后缘维度的轴长相符，另外一种是有一方的长度为1。

1、维度不同，但是后缘维度相同

In [45]:
import numpy as np
import random
arr1 = np.random.randn(4,5)#arr1.shape=(4,5)
arr2 = np.array([1,2,3,4,5])#arr2.shape=(5,)
print("arr1=\n",arr1,"\n","arr2=\n",arr2,"\n","arr1+arr2=\n",arr1+arr2)

arr1=
 [[ 1.25543834 -1.06585291 -0.27434819  1.49523174  2.19114238]
 [-0.52459474  0.73811633  0.22977074  0.24681176  0.52329189]
 [-1.18423267  0.09594318 -1.35196    -2.1143115  -0.90934572]
 [-0.49176489 -1.13485332 -0.20063068 -0.41417959 -0.89626773]] 
 arr2=
 [1 2 3 4 5] 
 arr1+arr2=
 [[ 2.25543834  0.93414709  2.72565181  5.49523174  7.19114238]
 [ 0.47540526  2.73811633  3.22977074  4.24681176  5.52329189]
 [-0.18423267  2.09594318  1.64804     1.8856885   4.09065428]
 [ 0.50823511  0.86514668  2.79936932  3.58582041  4.10373227]]


  上例中arr1的shape为（4,3），arr2的shape为（3，）。可以说前者是二维的，而后者是一维的。但是它们的后缘维度相等，arr1的第二维长度为3，和arr2的维度相同。arr1和arr2的shape并不一样，但是它们可以执行相加操作，这就是通过广播完成的，在这个例子当中是将arr2沿着0轴进行扩展

In [51]:

arr1 = np.random.randn(3,4,2)#arr1.shape=(3,4,2)
arr2 = np.random.randn(4,2)#arr2.shape=(4,2)
print("arr1=\n",arr1,"\n","arr2=\n",arr2,"\n","arr1+arr2=\n",arr1+arr2)

arr1=
 [[[-1.31923726 -0.02902639]
  [ 1.85464412  0.41428047]
  [ 0.358164    0.00248155]
  [ 0.44607763 -0.59050035]]

 [[ 0.39449064  0.3597871 ]
  [-0.53151628 -0.72997639]
  [ 0.31099557  1.42766657]
  [ 0.10327547 -1.81468962]]

 [[ 0.63752705  0.92017257]
  [ 0.02879847  0.27200378]
  [-0.80889928 -0.38037749]
  [-0.89976586 -0.48071647]]] 
 arr2=
 [[ 0.666808    0.63264601]
 [-0.79475543 -1.68347626]
 [-0.52051361  1.88616034]
 [ 2.71641485 -0.56605883]] 
 arr1+arr2=
 [[[-0.65242926  0.60361962]
  [ 1.05988868 -1.2691958 ]
  [-0.16234961  1.88864189]
  [ 3.16249248 -1.15655918]]

 [[ 1.06129863  0.99243311]
  [-1.32627171 -2.41345265]
  [-0.20951803  3.31382691]
  [ 2.81969031 -2.38074845]]

 [[ 1.30433504  1.55281857]
  [-0.76595696 -1.41147249]
  [-1.32941288  1.50578285]
  [ 1.81664898 -1.0467753 ]]]


2、数组维度相同，其中有个轴为1

In [14]:
arr1 = np.array([[0,0,0],[1,1,1],[2,2,2],[3,3,3]])
arr2 = np.array([[1],[2],[3],[4]])
print("arr1=\n",arr1,"\n","arr2=\n",arr2,"\n","arr1+arr2=\n",arr1+arr2)

arr1=
 [[0 0 0]
 [1 1 1]
 [2 2 2]
 [3 3 3]] 
 arr2=
 [[1]
 [2]
 [3]
 [4]] 
 arr1+arr2=
 [[1 1 1]
 [3 3 3]
 [5 5 5]
 [7 7 7]]


在这种情况下，两个数组的维度要保证相等，其中有一个轴的长度为1，这样就会沿着长度为1的轴进行扩展。这样的例子还有：（4,6）和（1,6） 。（3,5,6）和（1,5,6）、（3,1,6）、（3,5,1），后面三个分别会沿着0轴，1轴，2轴进行广播。