## NumPy 快速入门 中

上一篇中，对 NumPy 中最基本的概念 ndarray 对象对了介绍，图文并茂，让大家可以快速掌握它的基本要素以及索引和切片等必备知识。本篇将接着对常用函数以及重要的广播机制作进一步介绍。

In [1]:
import numpy as np

## 创建常用数组

- 创建全是 `1` 的数组，注意参数是表示数组 `shape` 的元组。

In [6]:
arr_ones = np.ones((3,4))
arr_ones

array([[1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.]])

In [7]:
arr_ones.dtype

dtype('float64')

- 创建全是 `0` 的数组

In [8]:
arr_zeros = np.zeros((3,4))
arr_zeros

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

- 创建单位矩阵

In [9]:
# 返回一个二维数组，对角线上元素全是 1，其他元素全为 0。
arr_eye = np.eye(3, dtype=np.int64)
arr_eye

array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]])

- 创建给定 `shape` 和 `dtype` 的新数组，而无需初始化元素。

In [11]:
arr_empty = np.empty((3,4))
arr_empty

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

- 创建一个具有给定 `shape` 和 `dtype` 的新数组，并以 `fill_value` 的值填充元素。

In [13]:
# np.full(shape, fill_value, dtype=None, order='C')
arr_full = np.full((3, 3), 3.1415)
arr_full

array([[3.1415, 3.1415, 3.1415],
       [3.1415, 3.1415, 3.1415],
       [3.1415, 3.1415, 3.1415]])

In [2]:
# 查看函数文档
np.full?

- 创建一个数组，元素为给定间隔的均匀分布的值（不包括 stop）。

In [17]:
# arange([start,] stop[, step,], dtype=None)

np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [18]:
np.arange(3, 10, 2)

array([3, 5, 7, 9])

- 返回在间隔 [`start`, `stop`] 中计算出的 `num` 个均匀间隔的样本。

In [19]:
# np.linspace(start, stop, num=50, ...)

np.linspace(0, 10, num=5)

array([ 0. ,  2.5,  5. ,  7.5, 10. ])

## 常用统计函数

如 `sum`，`mean`，`std`，`var`，`min`，`max` 等函数。

In [20]:
data = np.arange(18).reshape(2, 3, 3)
data

array([[[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8]],

       [[ 9, 10, 11],
        [12, 13, 14],
        [15, 16, 17]]])

In [21]:
data.sum(axis=0)

array([[ 9, 11, 13],
       [15, 17, 19],
       [21, 23, 25]])

- `A.sum(axis=0)` 对应的数学公式为

$$
\large \sum_i A_{ijk}
$$

In [22]:
np.sum(data, axis=1)

array([[ 9, 12, 15],
       [36, 39, 42]])

In [18]:
np.sum(data, axis=(0,1))

array([45, 51, 57])

- `A.sum(axis=(0,1))` 对应的数学公式为

$$
\large \sum_i\sum_j A_{ijk}
$$

In [23]:
# 沿轴取最小值
data.min(axis=1)

array([[ 0,  1,  2],
       [ 9, 10, 11]])

In [19]:
# 标准差
data.std() # 或者 a = np.std(data)

5.188127472091127

In [20]:
a = np.std(data)
a*a

26.916666666666664

In [21]:
#方差
data.var()

26.916666666666668

In [24]:
# 也可以按轴计算标准差
data.std(axis=1) 

array([[2.44948974, 2.44948974, 2.44948974],
       [2.44948974, 2.44948974, 2.44948974]])

## 约简操作

NumPy 中对数组的约简操作是沿着某个或某些轴减少数组中元素数量的操作。例如丢弃某个维度，将数据沿这个维度压缩为单个单元，从而批量减少数据量。如上文中统计数据的函数，实质是约简操作 
- sum 总和
- min 最小值
- max 最大值
- mean 平均值
- standard deviation 标准差

另外，还有如下这些常用函数，
- argmax
- argmin
- reduce & accumulate

- 当我们处理一维数组时，是通过下标对所有元素进行加法、减法、最大/最小值、求和、平均值、标准差等。

In [20]:
data = np.array(np.arange(16))
data

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15])

In [21]:
data.mean()

7.5

当处理更高维度数组时，可以看到 numpy 可以沿任何给定的轴进行约简求和。例如，考虑一个二维数组/矩阵。

In [23]:
# 没有指定轴，指所有元素
data_2d = data.reshape((4,4))
data_2d.mean()

7.5

- 例子，统计学生三门课的成绩

In [27]:
# 假设每一行对应一个学生的三门课的成绩，共十个学生
np.random.seed(0)
data_2d = np.random.randint(60,100,(10,3))
data_2d

array([[60, 63, 63],
       [99, 69, 79],
       [81, 96, 83],
       [66, 84, 84],
       [72, 61, 98],
       [99, 83, 84],
       [77, 97, 85],
       [73, 68, 69],
       [80, 76, 65],
       [75, 60, 78]])

In [28]:
# 统计每门课的平均成绩
data_2d.mean(axis = 0)

array([78.2, 75.7, 78.8])

In [47]:
# 分别计算每个学生三门课的总成绩和平均成绩
data_2d.sum(axis = 1), data_2d.mean(axis = 1)

(array([186, 247, 260, 234, 231, 266, 259, 210, 221, 213]),
 array([62.        , 82.33333333, 86.66666667, 78.        , 77.        ,
        88.66666667, 86.33333333, 70.        , 73.66666667, 71.        ]))

- 找出每门课的最高成绩的学生

In [48]:
data_2d.argmax(axis=0)

array([1, 6, 4])

- 找出每个学生成绩最高的那门课

In [50]:
ind = data_2d.argmax(axis=1)
ind

array([1, 0, 1, 1, 2, 0, 1, 0, 0, 2])

## 课堂练习

- 使用花式索引挑出每个学生成绩最好那门课的成绩

In [None]:
# 这样行？
data_2d[:, ind]

- 约简但仍然保持维数，不丢失轴

In [31]:
# a.mean(axis=None, dtype=None, out=None, keepdims=False)
data_2d.mean(axis=1, keepdims=True)

array([[62.        ],
       [82.33333333],
       [86.66666667],
       [78.        ],
       [77.        ],
       [88.66666667],
       [86.33333333],
       [70.        ],
       [73.66666667],
       [71.        ]])

- np.add.reduce 和 np.add.accumulate

In [44]:
np.add.reduce(data_2d)

array([782, 757, 788])

In [41]:
np.add.accumulate(data_2d)

array([[ 60,  63,  63],
       [159, 132, 142],
       [240, 228, 225],
       [306, 312, 309],
       [378, 373, 407],
       [477, 456, 491],
       [554, 553, 576],
       [627, 621, 645],
       [707, 697, 710],
       [782, 757, 788]])

## 累积约简

##### numpy.cumsum(a, axis=None, dtype=None, out=None)

- 沿给定轴的元素的累加和。

In [32]:
a = np.array([[1,2,3], [4,5,6]])
a

array([[1, 2, 3],
       [4, 5, 6]])

In [33]:
np.cumsum(a)

array([ 1,  3,  6, 10, 15, 21])

In [34]:
# 指定输出的数据类型
np.cumsum(a, dtype=float)

array([ 1.,  3.,  6., 10., 15., 21.])

In [36]:
np.cumsum(a, axis=0)

array([[1, 2, 3],
       [5, 7, 9]])

In [38]:
np.cumsum(a, axis=1)

array([[ 1,  3,  6],
       [ 4,  9, 15]])

## 排序（`sort`）

In [25]:
data = np.array(np.arange(12))
id(data), data

(140441614135584, array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11]))

In [26]:
# 打乱顺序
np.random.shuffle(data)
id(data), data

(140441614135584, array([11, 10,  0,  3,  4,  6,  7,  2,  8,  5,  1,  9]))

In [28]:
data = data.reshape(3, 4)
id(data), data

(140441614136624, array([[11, 10,  0,  3],
        [ 4,  6,  7,  2],
        [ 8,  5,  1,  9]]))

- 对数组元素按轴排序

`np.sort(a, axis=-1, kind='quicksort', order=None)`，默认是按最后一个轴排序的

In [30]:
A1 = np.sort(data)
A2 = np.sort(data, axis=1)
print(A1) 
print(A2)

[[ 0  3 10 11]
 [ 2  4  6  7]
 [ 1  5  8  9]]
[[ 0  3 10 11]
 [ 2  4  6  7]
 [ 1  5  8  9]]


In [31]:
# 也可以选择排序算法
data_0 = np.sort(data, kind='quicksort')
data_0

array([[ 0,  3, 10, 11],
       [ 2,  4,  6,  7],
       [ 1,  5,  8,  9]])

In [33]:
(id(data), id(data_0))

(140608173829056, 140608173889136)

- 假如需要按某列对所有行进行排序，如何操作？

In [34]:
# 自定义一个结构体，以便按某个成员的值排序
dtype = np.dtype([('student', int), ('point',  int), ('index',  float)])

data = np.array([
    (4551109, 94,   5.55772148),
    (4156490, 134,  5.5090355),
    (4822166, 4069, 9.25039792),
    (4367966, 257,  7.3435601),
    (4426400, 3390, 9.19012117),
    (4367966, 301,  7.32418416),
    (3919410, 2566, 8.92952842),
    (4538580, 138,  6.02654709),
    (4214718, 252,  6.89835322),
    (4426400, 3155, 9.59667276)], dtype=dtype)

In [35]:
data

array([(4551109,   94, 5.55772148), (4156490,  134, 5.5090355 ),
       (4822166, 4069, 9.25039792), (4367966,  257, 7.3435601 ),
       (4426400, 3390, 9.19012117), (4367966,  301, 7.32418416),
       (3919410, 2566, 8.92952842), (4538580,  138, 6.02654709),
       (4214718,  252, 6.89835322), (4426400, 3155, 9.59667276)],
      dtype=[('student', '<i8'), ('point', '<i8'), ('index', '<f8')])

In [49]:
data = np.sort(data, order='point')
[d for d in data]

[(4551109, 94, 5.55772148),
 (4156490, 134, 5.5090355),
 (4538580, 138, 6.02654709),
 (4214718, 252, 6.89835322),
 (4367966, 257, 7.3435601),
 (4367966, 301, 7.32418416),
 (3919410, 2566, 8.92952842),
 (4426400, 3155, 9.59667276),
 (4426400, 3390, 9.19012117),
 (4822166, 4069, 9.25039792)]

## 拼接（`stack` 和 `concatenating`）

- 使用 `np.concatenate` 沿着已有的轴拼接数组

In [37]:
data = np.arange(4).reshape(2, 2)

print('axis=0: \n', np.concatenate([data, data], axis=0))
print('axis=1: \n', np.concatenate([data, data], axis=1))

axis=0: 
 [[0 1]
 [2 3]
 [0 1]
 [2 3]]
axis=1: 
 [[0 1 0 1]
 [2 3 2 3]]


- 使用 `numpy.stack(arrays, axis=0)`，沿着`新轴`拼接数组序列。

`numpy.stack(arrays, axis=0)`
- 参数：`arrays`：序列中每个数组必须具有相同的形状。
- 参数 `axis` 指定新轴在结果尺寸中的索引。例如，`axis=0`，新增第一个维度，如果 `axis=-1`，则新增最后一个维度。
- 返回：堆叠数组比输入数组多一个轴。

In [41]:
x = np.array([2, 3, 4])
y = np.array([3, 4, 5])
x, y

(array([2, 3, 4]), array([3, 4, 5]))

In [54]:
# 下面代码将 x y 都增加一个轴，shape 都变成 [1,3] [1,3]，再沿着新增的 0-轴组合成新的数组。
xy = np.stack((x, y))
xy

array([[2, 3, 4],
       [3, 4, 5]])

In [43]:
xy[0,:]

array([2, 3, 4])

In [44]:
xy = np.stack((x, y), axis=-1)
xy

array([[2, 3],
       [3, 4],
       [4, 5]])

In [45]:
xy2 = np.stack((xy,xy), axis=-1)
xy2

array([[[2, 2],
        [3, 3]],

       [[3, 3],
        [4, 4]],

       [[4, 4],
        [5, 5]]])

In [49]:
print(xy2[:,:,0])
print(xy2[:,:,1])

[[2 3]
 [3 4]
 [4 5]]
[[2 3]
 [3 4]
 [4 5]]


In [50]:
x1 = np.arange(9).reshape((3,3))
x2 = np.arange(10,19,1).reshape((3,3))

print(x1)
print(x2)

y2 = np.stack((x1,x2),axis=0)
y2

[[0 1 2]
 [3 4 5]
 [6 7 8]]
[[10 11 12]
 [13 14 15]
 [16 17 18]]


array([[[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8]],

       [[10, 11, 12],
        [13, 14, 15],
        [16, 17, 18]]])

In [60]:
arrays = [np.random.randn(3, 4) for _ in range(10)]
np.stack(arrays, axis=0).shape

(10, 3, 4)

In [61]:
np.stack(arrays, axis=1).shape

(3, 10, 4)

In [62]:
np.stack(arrays, axis=2).shape

(3, 4, 10)

上面的代码相当于，先将 `shape`: `(3, 4)` 改成 `(3, 1, 4)`，再沿着中间的轴堆叠，从而将 `shape` 中间的 `1` 变成了 `10`。 

In [63]:
data

array([[0, 1],
       [2, 3]])

- 如果想 `np.concatenate` 像 `np.stack` 那样增加一个维度，则需要先对数组增加一个轴，然后再使用 `np.concatenate` 沿着那个轴连接。

In [64]:
dd = np.concatenate([data[np.newaxis,...], data[np.newaxis,...]])
dd

array([[[0, 1],
        [2, 3]],

       [[0, 1],
        [2, 3]]])

- 拆分数组

In [57]:
data = np.array([[[1, 2, 3],[4, 5, 6],[7, 8, 9]],[[-1, -2, -3],[-4, -5, -6],[-7, -8, -9]]])
data

array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9]],

       [[-1, -2, -3],
        [-4, -5, -6],
        [-7, -8, -9]]])

In [58]:
x, y = data[0, ...], data[1, ...]

print(x)
print(y)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[-1 -2 -3]
 [-4 -5 -6]
 [-7 -8 -9]]


- 数组展开，`numpy.ravel() vs numpy.flatten()`。

![ravel: 解开线圈](attachment:u=2699172430,3058368257&fm=26&gp=0.jpg)

In [92]:
data = np.arange(12).reshape((3, 4))
data

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [93]:
# 按行展开 C 风格
data_flatten = data.flatten(order="C") 
data_flatten

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [94]:
# 按列展开， F 风格
data_flatten = data.flatten(order="F")
data_flatten

array([ 0,  4,  8,  1,  5,  9,  2,  6, 10,  3,  7, 11])

In [95]:
data_flatten[0] = 110
data

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [96]:
 # 按行展开 C 风格
data_ravel = data.ravel()
data_ravel

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [97]:
data_ravel[0] = 110
data

array([[110,   1,   2,   3],
       [  4,   5,   6,   7],
       [  8,   9,  10,  11]])

In [98]:
# 按行展开 F 风格
data[0] = 0
data_ravel = data.ravel(order='F')
data_ravel

array([ 0,  4,  8,  0,  5,  9,  0,  6, 10,  0,  7, 11])

In [99]:
data_ravel[0] = 110
data

array([[ 0,  0,  0,  0],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

- `ravel()` 和 `flatten()` 两者实现的功能是一致的（将多维数组降到一维），两者的区别在于返回拷贝（copy）还是返回视图（view），`numpy.flatten()` 返回一份拷贝，对拷贝所做的修改不会影响原始矩阵，而 `numpy.ravel()` 一般情况下返回的是视图（`view`），修改会影响原始矩阵。但是当数组不是 `C` 连续（`contiguous`）时，`numpy.ravel()` 返回的也会是拷贝。

In [91]:
# 查看是否连续
data.flags

  C_CONTIGUOUS : True
  F_CONTIGUOUS : False
  OWNDATA : False
  WRITEABLE : True
  ALIGNED : True
  WRITEBACKIFCOPY : False
  UPDATEIFCOPY : False

上面例子中的 `data` 数组如下，

![image.png](attachment:image.png)

但是它的数据在内存中实际上是下面这样的，

![image.png](attachment:image.png)

`data` 数据在内存中是连续的，但是当以 `order='F'` 展开时，是按 `[0,4,8,1,5,9,2,6,10,3,7,11]` 这个顺序，它这个顺序从内存地址上看就不是连续了，因此返回的是拷贝。

## NumPy 的广播机制

首先需要清楚的一点是，`NumPy` 的两个数组之间的相加、相减以及相乘都是对应元素之间的操作。

- 当参与运算的两个数组维度（形状）完全相同时，直接运算，不需要广播。
- 当两个数组的形状并不相同的时候，可以通过扩展数组的方法来实现相加、相减、相乘等操作，这种机制叫做广播（`broadcasting`）。

In [101]:
a = np.array([1,2,3,4])

b = np.array([10,20,30,40])

c = a * b

c

array([ 10,  40,  90, 160])

In [102]:
a = np.array([[ 0, 0, 0],
              [10,10,10],
              [20,20,20],
              [30,30,30]])

b = np.array([1,2,3])

a + b

array([[ 1,  2,  3],
       [11, 12, 13],
       [21, 22, 23],
       [31, 32, 33]])

In [68]:
# 相当于
a = np.array([[ 0, 0, 0],
              [10,10,10],
              [20,20,20],
              [30,30,30]])

b = np.array([1,2,3])

bb = np.tile(b, (4, 1))

print(a + bb)

[[ 1  2  3]
 [11 12 13]
 [21 22 23]
 [31 32 33]]


#### 图例

In [None]:
x = np.zeros((3, 5))
y = np.zeros(8)
# 直接相加是不合法的
z = x + y

In [71]:
# x 是 3 行 5 列的二维数组
# y 是 8 个元素的一维数组
# 直接加 x+y 是不合法的

In [104]:
# 将x 在最右边增加一个轴（维度）
z = x[..., None] + y
z, z.shape

(array([[[0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.]],
 
        [[0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.]],
 
        [[0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 0.]]]), (3, 5, 8))

![array_3x5x8.png](attachment:array_3x5x8.png)

In [73]:
# 相当于 x.shape (3,5,1)
#       y.shape     (8,)
# 此时符合广播规则

In [74]:
# ( ,)      (3, 4)    (3, 5, 1)     (3, 5, 2)
# (3,)      (3, 1)    (      8)     (      8)
# ----      ------    ----------    ---------
# (3,)      (3, 4)    (3, 5, 8)     不能广播

### 最后，回顾下 `reshape()` 函数

- 图解函数 `reshape()`

![image.png](attachment:image.png)

### 课堂练习

#### 用 NumPy 计算矩阵行列式

- 矩阵行列式的定义为

![image.png](attachment:image.png)