In [None]:
import numpy as np
import matplotlib.pyplot as plt
np.__version__

# Chapter 1 -- Numpy 基础

华东师范大学 数学科学学院 陈久宁 2019年9月25日

参考材料：

* [快速入门教程](https://numpy.org/doc/1.17/user/quickstart.html)
* [针对Matlab用户的说明](https://numpy.org/doc/1.17/user/numpy-for-matlab-users.html)

## 1. 矩阵创建

* `array`
* `zeros`, `zeros_like`
* `ones`, `ones_like`
* `empty`, `empty_like`
* `full`, `full_like`
* `fromfunction`
* `arange`, `linspace`, `geomspace`
* `random.rand`, `random.randn`

### 1.1. 构造函数

In [None]:
x = np.array([1, 2, 3]) #1行3列数组
x

In [None]:
x.shape # 数组的形状

In [None]:
x.size # 数组的元素个数

In [None]:
x.dtype # 数组的数据类型

In [None]:
x.ndim # 数组的维数

In [None]:
x = np.array([ # 2行3列数组
    [1, 2, 3],
    [4, 5, 6]
])
x

In [None]:
x.shape # 数组的形状

In [None]:
x.size # 数组的形状

In [None]:
len(x) # x.shape[0]

In [None]:
x.ndim # 数组的维数

## 1.2. 利用常用方法构造数组

> 在Python中一般用tuple作为size/shape

创建全0数组

```python
np.zeros(shape, dtype=float, order='C')
```

* shape: 数组形状
* dtype: data type，元素的数据类型
* order: 元素在内存中的存储顺序（逐行或逐列存储）-- ⚠️ 高级话题

In [None]:
np.zeros((2, 3)) # 2行3列

In [None]:
np.zeros((2, 3), dtype=int)

创建全1数组

```python
np.ones(shape, dtype=float, order='C')
```

In [None]:
np.ones((2, 3)) # 2行3列

In [None]:
np.ones((2, 3), dtype=int)

创建一个用特定值初始化的数组

```python
np.full(shape, fill_value, dtype=None, order='C')
```

In [None]:
np.full((2, 3), 4) # 2行3列，用4进行初始化

`full(shape, fill_value)` 与 `fill_value * ones(shape)` 的差异：

* 前者直接在内存中进行初始化
* 后者通过矩阵运算进行初始化

⚠️ 性能建议：

* ✅ `zeros(shape)` vs ❌`1. * ones(shape)`
* ✅ `full(shape, fill_value)` vs ❌ `fill_value * ones(shape)`

In [None]:
# Performance Benchmark

# ~2x speed-up
%timeit np.zeros((5000, 500)) # :)
%timeit 1. * np.ones((5000, 500)) # :(

# ~2x speed-up
%timeit np.full((5000, 500), 3.) # :)
%timeit 3. * np.ones((5000, 500)) # :(

创建一个不进行初始化的数组

```python
empty(shape, dtype=float, order='C')
```

In [None]:
np.empty((2, 3)) # 2行3列，不进行初始化

通过函数来初始化矩阵

```python
np.fromfunction(function, shape, **kwargs)
```

以二维数组为例：

1. 首先通过构造一个下标数组
2. 然后对于每一对下标`(i, j)`, 调用`function(i,j)`

In [None]:
def foo(x, y):
    return 10*x + y

np.fromfunction(foo, (3, 3))

In [None]:
def foo(x, y, z):
    return 100*x + 10*y + z
np.fromfunction(foo, (3, 3, 3))

In [None]:
np.fromfunction(lambda x,y : x==y, (3, 3))

以range的方式创建数组

```python
np.arange([start,] stop[, step,], dtype=None)
```

* arange <--> array range
* `[]`表示该参数可选
* 通过`?np.arange`即可查到详细的使用文档

In [None]:
# np.arange(stop)
np.arange(10) # 从0到9

In [None]:
# np.arange(start, stop)
np.arange(4, 10) # 从4到9

In [None]:
# np.arange(start, stop, step)
np.arange(4, 10, 2) # 从4到9，间隔为2

等间距生成矩阵
```python
np.linspace(start,
    stop,
    num=50,
    endpoint=True,
    retstep=False,
    dtype=None,
    axis=0,
)
```

In [None]:
np.linspace(0, 1, num=5) # 包含最后一个值

In [None]:
np.geomspace(1, 10, num=5) # 对数间隔生成

In [None]:
np.logspace(0, 1, num=5) # 对数间隔生成

In [None]:
# np.logspace等价于以下形式
np.geomspace(10**0, 10**1, num=5) # a**b := a^b

##### 随机数

In [None]:
np.random.randn(3) # 1行3列高斯随机数

In [None]:
np.random.randn(3, 3) # 3行3列高斯随机数

In [None]:
np.random.randint(10, size=(2, 3)) # 2行3列的0-9之间的数

In [None]:
np.random.randint(5, 10, size=(2, 3)) # 2行3列的5-9之间的数

## 2. 矩阵基本运算

### 2.1. 基本算术运算

In [None]:
x = np.arange(1, 5).reshape(2, 2)
y = np.arange(9, 5, -1).reshape(2, 2)
print("x is:")
print(x)
print("y is:")
print(y)

In [None]:
x + y # 加

In [None]:
x - y # 减

逐元素乘法 (element-wise product)

In [None]:
x * y # 逐元素乘法

逐元素幂

In [None]:
x ** y # 逐元素幂

逐元素除法

In [None]:
y / x # 逐元素除法

In [None]:
y // x # 逐元素截断除法

In [None]:
x @ y # 矩阵乘法

In [None]:
# Python 3.5 之前采用 x.dot(y)
x.dot(y)

大部分一元运算都可以写成方法的形式，例如：

In [None]:
assert x.sum() == np.sum(x)
assert x.prod() == np.prod(x)
assert x.mean() == np.mean(x)
assert x.max() == np.max(x)
assert x.min() == np.min(x)

### 2.2 尺寸变化

矩阵转置

```python
np.transpose(a, axes=None)
```

维度变换规则：(recall: 代数里的变换)
```
(0,  1,  2,  3,  4 )
(x0, x1, x2, x3, x4)
```

In [None]:
x = np.arange(24).reshape(1, 2, 3, 4)
x.shape

In [None]:
y = x.transpose(1, 2, 3, 0)
y.shape

In [None]:
z = y.transpose(3, 0, 1, 2)
z.shape

In [None]:
np.all(z == x)

调整尺寸

```python
np.reshape(a, newshape, order='C')
```

In [None]:
x = np.arange(16)
x

In [None]:
x.reshape(4, 4)

In [None]:
x.shape = 2, 8 # 直接修改shape
x

维数压缩(squeeze)

```python
np.squeeze(a, axis=None)
```

In [None]:
x = np.arange(16).reshape(1, 1, 4, 1, 4, 1, 1)
xs = x.squeeze() # 等价于 np.squeeze(x)
xs.shape

In [None]:
xs = x.squeeze((0, 1, -1))
xs.shape

维数拓宽（unsqueeze)

```python
np.expand_dims(a, axis)
```

In [None]:
x0 = np.expand_dims(x, 0)
print(f"x0.shape = {x0.shape}")
x1 = np.expand_dims(x, 1)
print(f"x1.shape = {x1.shape}")
x2 = np.expand_dims(x, 2)
print(f"x2.shape = {x2.shape}")

维度占位符：

* `-1`用来自动推断维度
* `np.newaxis`用来拓宽新的维度

In [None]:
np.arange(16).reshape(2, -1, 2).shape # -1 被推断为 4

In [None]:
x = np.arange(16).reshape(2, -1, 2)
x[:, np.newaxis, :, np.newaxis, :].shape

In [None]:
assert np.newaxis is None # 实际上就是None
x = np.arange(16).reshape(2, -1, 2)
x[:, None, :, None, :].shape

性能评估

`newaxis`/`None` < `reshape` < `expand_dims`

In [None]:
x = np.random.randn(10, 10, 10)
%timeit x[..., None]
%timeit x[None, ...]
%timeit x.reshape(10, 10, 10, 1)
%timeit x.reshape(1, 10, 10, 10)
%timeit np.expand_dims(x, -1)
%timeit np.expand_dims(x, 0)

## 3 高级话题1: 广播（broadcasting）

遇到尺寸不相同的逐元素操作时，广播可以让其中一部分操作变得可行

参考材料：

* [广播概念](https://numpy.org/doc/1.17/user/theory.broadcasting.html#array-broadcasting-in-numpy)
* [广播基础](https://numpy.org/doc/1.17/user/basics.broadcasting.html)

广播规则：

1. 拓展维度：如果矩阵的维数不相同，在小矩阵维数的**前面**填上"1"
2. 拓展尺寸：对于长度为"1"的维度，其尺寸被拓宽为对应的大矩阵的长度，并且每一个元素的值都相同
3. 维度与尺寸拓展后：矩阵的shape必须相同

1. 拓展维度

In [None]:
x = np.arange(4).reshape(2, 2)
y = np.arange(4).reshape(1, 2, 2)

# original:    (2, 2)    * (1, 2, 2)
# expand_dims: (1, 2, 2) * (1, 2, 2)
x * y # 等价于: np.expand_dims(x, 0) * y

In [None]:
np.expand_dims(x, 0) * y

2. 拓展尺寸：对于长度为"1"的维度，其尺寸被拓宽为对应的大矩阵的长度，并且每一个元素的值都相同

In [None]:
x = np.arange(9).reshape(3, 3, 1)
y = np.arange(6).reshape(1, 3, 2)

# original: (3, 3, 1) * (1, 3, 2)
# repeat:   (3, 3, 2) * (3, 3, 2)
x * y # 等价于 x.repeat(2, axis=2) * y.repeat(3, axis=0)

In [None]:
X = x.repeat(2, axis=2)
Y = y.repeat(3, axis=0)
X * Y

3. 维度与尺寸拓展后：矩阵的shape必须相同

In [None]:
x = np.arange(6).reshape(2, 3, 1)
y = np.arange(6).reshape(3, 2)
# ✅ 
# original:    (2, 3, 1) * (3, 2)
# expand_dims: (2, 3, 1) * (1, 3, 2)
# repeat:      (2, 3, 2) * (2, 3, 2)
x * y

In [None]:
x = np.arange(6).reshape(2, 3, 1)
y = np.arange(6).reshape(2, 3)
# ❌
# original: (2, 3, 1) * (1, 2, 3)
# repeat:   (2, 3, 3) * (2, 2, 3)
x * y

例：利用广播来高效实现`meshgrid`

In [None]:
x = np.array([1, 2])
y = np.array([4, 5])
X, Y= np.meshgrid(x, y)
print(f"X.shape={X.shape}")
print(f"Y.shape={Y.shape}")
print("X is:")
print(X)
X * Y

In [None]:
X = x.reshape(-1, 1)
Y = y.reshape(1, -1)
X * Y

In [None]:
X, Y = np.ix_(x, y) # 自动对x,y进行reshape
X * Y

In [None]:
# benchmark

x = np.arange(1, 1000)
y = np.arange(1, 1000)

# 返回两个1000*1000矩阵
%timeit X, Y = np.meshgrid(x, y)
%timeit X * Y

# 返回两个1000*1矩阵 :D
# --> 较小的内存开销带来的是更快的计算速度
%timeit X, Y = np.ix_(x, y)
%timeit X * Y

## 4. 数组元素选取、切片与组合

基本规则：

1. 通过`[i, j, k]`进行元素选取
2. 通过`[start]:[stop]:[step]`进行切片
3. 通过`...`来省略中间的`:` （如果是需要省略后面所有的`:`则不需要`...`)

### 4.1. 元素选取

In [None]:
x = np.arange(16).reshape(4, 4)
x

In [None]:
x[0, 0] # 第 (0,0) 个元素

In [None]:
x[-1, -1] # 最后一行的最后一个元素

In [None]:
x[0, -2] # 第0行的倒数第二个元素

In [None]:
x[0] # 第 0 行 # 等价于 x[0, :]

In [None]:
x[-1] # 最后一行

In [None]:
x[:, 0] # 第 0 列 ⚠️ 维度为(4, )而不是(1, 4)

In [None]:
x[:, 0].shape

In [None]:
x[(0, 3)] # 第0行的第3个元素

In [None]:
x[0][3] # 第0行的第三个元素

* `x[0,3]`与`x[(0,3)]`直接取出第(0,3)个元素
* `x[0][3]`先取出第0行，然后再取出第3个元素

⚠️性能建议：除非必要，使用前者

In [None]:
# 1~2x speedup
z = np.random.randn(5000, 5000)
%timeit z[(0, 3)] # :)
%timeit z[0, 3]   # :)
%timeit z[0][3]   # :(

In [None]:
# grid-like indexing
x[(0, 1, 3), (0, 2, 1)] # 第(0, 0), (1, 2) 和 (3,1)个元素

In [None]:
x[(0, 1, 3), 0] # 第 (0,0), (1,0), (3,0) 个元素 ! broadcasting is powerful

In [None]:
# 利用bool值作索引
x = np.arange(4).reshape(2, 2)
idx = np.array([
    [True, True],
    [False, True]
])
x[idx]

In [None]:
x[(x>2)&(x<7)] # 大于2小于7的元素

### 4.2. 切片

In [None]:
x = np.arange(16).reshape(4, 4)
x

In [None]:
x[:] # 全部内容

In [None]:
x[0:2] # 第0至2行 （不包含第22）

In [None]:
x[0:4:2] # 第0至4行，间隔为2 即:第0,2行

In [None]:
x[0:2, 2:4]

In [None]:
x[0:2, -2:-1] # ⚠️ 左闭右开：取不到 -1

In [None]:
x[0:2, -2:]

In [None]:
x = np.arange(16).reshape(2, 2, 2, 2)
x

In [None]:
x[1, 1, :, 0] # : 占位符表示该维度元素全部选取

In [None]:
x[1, :, :, 0]

In [None]:
x[1, ..., 0] # ... 用于省略中间的 :

批量赋值 = 切片+广播

In [None]:
x = np.zeros((3, 3))
x[:] = 1
x

In [None]:
x = np.zeros((3, 3))
# original:    (3, 2) = (1, 2)
# repeat:      (3, 2) = (2, 2)
x[:,0:2] = np.array([[1, 2]])
x

### 4.3 组合

In [None]:
x = np.arange(16).reshape(4, 4)
y = np.arange(16, 0, -1).reshape(4, 4)

In [None]:
np.hstack([x, y]) # horizontal stack 水平堆叠 aka np.column_stack

In [None]:
np.vstack([x, y]) # vertical stack 垂直堆叠 aka np.row_stack

In [None]:
z = np.stack([x, y], 0) # 在第0维堆叠 ⚠️不等于vstack
print(z.shape)
z

In [None]:
z = np.concatenate([x, y], 0) # 在第0维相接
print(z.shape)
z

### 4.4. 进阶内容2: `reference`, `view`, and `copy`

* 赋值操作时不会进行任何对象的复制 -- 类似于C++的引用/指针

In [None]:
x = np.arange(8)
y = x
y is x # 说明y与x在python中为相同对象的不同名称

In [None]:
y[0] = 100 # x与y共享同一数据
x

In [None]:
y.shape = 2, 4 # x与y为同一矩阵
x

* `view`为浅拷贝，创建新矩阵，但与原矩阵共享内部数据

In [None]:
x = np.arange(8)
y = x.view()
y is x # x与y不是同一对象

In [None]:
y[0] = 100 # x与y共享同一数据
x

In [None]:
y.shape = 2, 4 # x与y为不同矩阵，因此不会影响x的形状
x

* `copy`为深拷贝 -- 复制矩阵的内部数据

In [None]:
x = np.arange(8)
y = x.copy()
y is x # x与y不是同一对象

In [None]:
y[0] = 100 # x与y不共享同一份数据
x

In [None]:
y.shape = 2, 4 # x与y为不同矩阵，因此不会影响x的形状
x

## 随堂作业

* 找到下述图像`img_idx`的真实值并打印它

In [None]:
RGB_palette = np.array([
    [0., 0., 0.], # Black
    [1., 0., 0.], # Red
    [0., 1., 0.], # Green
    [0., 0., 1.], # Blue
    [1., 1., 1.], # White
]) # RGB调色盘

img_idx = np.array([ # 每个元素i表示调色盘中的第i个色彩
    [0, 1, 2, 3, 4], # 0 --> black
    [1, 2, 3, 4, 0], # 1 --> red
    [2, 3, 4, 0, 1], # 2 --> green
    [3, 4, 0, 1, 2], # 3 --> blue
    [4, 0, 1, 2, 3]  # 4 --> white
])

In [None]:
img = np.zeros_like(img_idx) # find the true color !
# e.g., img[1, 1] = [1., 0., 0.,]
plt.imshow(img)

* `X`与`Y`分别代表两个2维矩阵:计算`X[0]+Y[0]`, `X[0]+Y[1]`, `X[1]+Y[0]`, `X[1]+Y[1]`并将它们组合成`(4, 2, 3)`矩阵

In [None]:
X = np.arange(12).reshape(2, 2, 3)
Y = np.arange(12, 0, -1).reshape(2, 2, 3)
# e.g., Z[0] = X[0]+Y[0]

* `X`与`Y`分别代表一堆坐标对：（X[0], Y[0]), (X[1], Y[1]), ..., (X[100], Y[100]), 试构造它们的meshgrid并返回`(100, 2, 8, 8)`矩阵`Z`，其中`Z[5, 0, 8, 8]`表示`meshgrid(X[5], Y[5])[0]`

In [None]:
X = np.arange(800).reshape(100, 8)
Y = np.arange(800, 0, -1).reshape(100, 8)
# e.g., Z[0] = np.meshgrid(X[0], Y[0])

* 矩阵的下标顺序速度会严重影响程序的计算性能，试用三重`for`循环来手写不同下标顺序的二维矩阵乘法，并利用`%timeit`来测试它们 -- 一切以benchmark为准