# 数组

首先, 导入 Numpy 模块

In [120]:
import numpy as np

from display import aprint
from array_ import arange_by_shape

## 1. 创建数组

### 1.1. 通过 Python 数组创建

In [121]:
# 通过一维 Python 数组创建 NumPy 数组
data = np.array([1, 2, 3, 4])
print(f"一维数组内容:\n{data}")

# 通过二维 Python 数组创建 NumPy 数组
data = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])
print(f"\n二维数组内容:\n{data}")

# 通过三维 Python 列表创建 NumPy 数组
data = np.array(
    [
        [
            [1, 2, 3, 4],
            [5, 6, 7, 8],
            [9, 10, 11, 12],
        ],
        [
            [13, 14, 15, 16],
            [17, 18, 19, 20],
            [21, 22, 23, 24],
        ],
    ]
)
print(f"\n三维数组内容:\n{data}")

一维数组内容:
[1 2 3 4]

二维数组内容:
[[1 2 3 4]
 [5 6 7 8]]

三维数组内容:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]]


### 1.2. 创建元素值为 `0` 的数组

In [122]:
# 创建元素值为 0 的一维数组
data = np.zeros(shape=(4))
print(f"一维数组内容:\n{data}")

# 创建元素值为 0 的二维数组
data = np.zeros(shape=(3, 4))
print(f"\n二维数组内容:\n{data}")

# 创建元素值为 0 的三维数组
data = np.zeros(shape=(2, 3, 4))
print(f"\n三维数组内容:\n{data}")

一维数组内容:
[0. 0. 0. 0.]

二维数组内容:
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]

三维数组内容:
[[[0. 0. 0. 0.]
  [0. 0. 0. 0.]
  [0. 0. 0. 0.]]

 [[0. 0. 0. 0.]
  [0. 0. 0. 0.]
  [0. 0. 0. 0.]]]


In [123]:
# 创建元素值为 1 的一维数组
data = np.ones(shape=(4))
print(f"一维数组内容:\n{data}")

# 创建元素值为 1 的二维数组
data = np.ones(shape=(3, 4))
print(f"\n二维数组内容:\n{data}")

# 创建元素值为 1 的三维数组
data = np.ones(shape=(2, 3, 4))
print(f"\n三维数组内容:\n{data}")

一维数组内容:
[1. 1. 1. 1.]

二维数组内容:
[[1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]]

三维数组内容:
[[[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]

 [[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]]


### 1.3. 创建元素值为 "空" 的数组

通过 `np.empty` 函数创建一个元素值为 "空" 的数组

注意: 所谓元素值为 "空" 的数组，指的是直接分配内存, 且不会对元素所用内存进行初始化操作, 所以所分配内存中的内容是未知的 (或保留上次该区域内存使用的值)

所以创建了元素值为 "空" 的数组后, 必须对数组元素值全部进行初始化

对于已确定会对数组元素值进行全部初始化的场景, 通过 `np.empty` 函数创建数组可以提升程序效率

In [124]:
# 创建元素值未知的一维数组
data = np.empty(shape=(4))
print(f"一维数组内容:\n{data}")

# 创建元素值未知的二维数组
data = np.empty(shape=(3, 4))
print(f"\n二维数组内容:\n{data}")

# 创建元素值未知的三维数组
data = np.empty(shape=(2, 3, 4))
print(f"\n三维数组内容:\n{data}")

一维数组内容:
[1. 1. 1. 1.]

二维数组内容:
[[1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]]

三维数组内容:
[[[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]

 [[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]]


### 1.4. 创建元素值为连续序列的数组

In [125]:
data = np.linspace(1, 10, 10)
print(f"数组内容:\n{data}")

data = np.linspace(1, 10, 20)
print(f"\n数组内容:\n{data}")

数组内容:
[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]

数组内容:
[ 1.          1.47368421  1.94736842  2.42105263  2.89473684  3.36842105
  3.84210526  4.31578947  4.78947368  5.26315789  5.73684211  6.21052632
  6.68421053  7.15789474  7.63157895  8.10526316  8.57894737  9.05263158
  9.52631579 10.        ]


### 1.5. 创建元素值为 `0`~`1` 随机数的数组

In [126]:
# 创建随机元素值的一维数组
data = np.random.rand(4)
print(f"数组内容:\n{data}")

# 创建随机元素值的二维数组
data = np.random.rand(3, 4)
print(f"\n数组内容:\n{data}")

# 创建随机元素值的三维数组
data = np.random.rand(2, 3, 4)
print(f"\n数组内容:\n{data}")

# `np.random.rand` 函数不能指定随机数范围, 只能生成 `0`~`1` 之间的随机数
# 要指定随机数范围, 可通过下面的计算方法
min_, max_ = 5, 10
data = min_ + (max_ - min_) * (np.random.rand(2, 3, 4))
print(f"\n数组内容:\n{data}")

数组内容:
[0.59761081 0.45392685 0.72934189 0.93232879]

数组内容:
[[0.91237895 0.1709705  0.2071843  0.48486076]
 [0.49491339 0.29747114 0.12467047 0.80566314]
 [0.35136902 0.33063717 0.11659532 0.21141294]]

数组内容:
[[[0.74492917 0.00674001 0.64704759 0.3661052 ]
  [0.18260291 0.91733424 0.6570834  0.31977046]
  [0.11471854 0.79064175 0.36417901 0.60499232]]

 [[0.48757083 0.55628221 0.84214689 0.96737843]
  [0.57883764 0.11895173 0.84289102 0.78106137]
  [0.12062706 0.68964694 0.46013117 0.62330372]]]

数组内容:
[[[5.3585618  8.77795795 6.96608474 5.3996792 ]
  [7.51824129 9.93847242 9.92933374 6.19485335]
  [6.22969159 8.18577209 6.36136818 7.34051743]]

 [[5.28484135 8.26991606 9.80726713 9.76154698]
  [9.60464809 6.97737419 8.77935426 6.69617165]
  [8.56586472 5.2537608  5.97001061 8.29423001]]]


### 1.6. 创建元素值随机整数的数组

In [127]:
# 创建元素值为 `1`~`10` 之间随机数的一维数组
data = np.random.randint(1, 10, size=(4,))
print(f"数组内容:\n{data}")

# 创建元素值为 `1`~`10` 之间随机数的二维数组
data = np.random.randint(1, 10, size=(3, 4))
print(f"\n数组内容:\n{data}")

# 创建元素值为 `1`~`10` 之间随机数的三维数组
data = np.random.randint(1, 10, size=(2, 3, 4))
print(f"\n数组内容:\n{data}")

数组内容:
[7 6 8 3]

数组内容:
[[9 7 8 5]
 [6 5 1 6]
 [9 6 5 3]]

数组内容:
[[[8 6 4 8]
  [1 3 8 2]
  [5 4 5 2]]

 [[4 7 1 8]
  [8 1 4 3]
  [6 1 3 2]]]


## 2. 数组属性

### 2.1. 数组维度 (`ndim`)

可以获取到一个数组包含的维度数

In [128]:
# 一维数组的 dim 总为 `1`
data = np.arange(1, 25)  # 创建一个包含 1 到 24 的一维数组
print(f"一维数组:\n{data}, dim={data.ndim}")

# 二维数组的 dim 总为 `2`
data = data.reshape(2, -1)
print(f"\n二维数组:\n{data}, dim={data.ndim}")

# 三维数组的 dim 总为 `3`
data = data.reshape(2, 3, -1)
print(f"\n三维数组:\n{data}, dim={data.ndim}")

一维数组:
[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24], dim=1

二维数组:
[[ 1  2  3  4  5  6  7  8  9 10 11 12]
 [13 14 15 16 17 18 19 20 21 22 23 24]], dim=2

三维数组:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]], dim=3


### 2.2. 数组形状 (`shape`)

数组的形状即数组在每个维度的长度, 例如 shape 为 `(2, 3)` 的数组, 表示一个有 `2` 行 `3` 列的二维数组

In [129]:
# 获取一维数组的形状, 结果为一个包含一个值的元组
data = np.array([1, 2, 3, 4])
print(f"一维数组:\n{data}, shape={data.shape}")

# 获取二维数组的形状, 结果为一个包含两个值的元组, 表示数组的两个维度
data = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(f"\n二维数组:\n{data}, shape={data.shape}")

# 获取三维数组的形状, 结果为一个包含三个值的元组, 描述数组的三个维度
data = np.array(
    [
        [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]],
        [[13, 14, 15, 16], [17, 18, 19, 20], [21, 22, 23, 24]],
    ]
)
print(f"\n三维数组:\n{data}, shape={data.shape}")

一维数组:
[1 2 3 4], shape=(4,)

二维数组:
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]], shape=(3, 4)

三维数组:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]], shape=(2, 3, 4)


### 2.3. 数组长度 (`size`)

数组长度即数组包含的元素总数, 和数组的维度或数组的形状无关

In [130]:
data = np.array([1, 2, 3, 4])
print(f"一维数组:\n{data}, size={data.size}")

data = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(f"\n二维数组:\n{data}, size={data.size}")

data = np.array(
    [
        [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]],
        [[13, 14, 15, 16], [17, 18, 19, 20], [21, 22, 23, 24]],
    ]
)
print(f"\n三维数组:\n{data}, size={data.size}")

一维数组:
[1 2 3 4], size=4

二维数组:
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]], size=12

三维数组:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]], size=24


### 2.4. 数组元素类型 (`dtype`)

数组中的元素具备统一的数据类型, 可通过 `np.dtype` 查看, 可能的类型包括:

- `np.int8`: 8 位有符号整数
- `np.int16`: 16 位有符号整数
- `np.int32`: 32 位有符号整数
- `np.int64`: 64 位有符号整数
- `np.uint8`: 8 位无符号整数
- `np.uint16`: 16 位无符号整数
- `np.uint32`: 32 位无符号整数
- `np.uint64`: 64 位无符号整数
- `np.float16`: 16 位浮点数
- `np.float32`: 32 位浮点数
- `np.float64`: 64 位浮点数
- `np.complex64`: 64 位复数
- `np.complex128`: 128 位复数
- `np.bool_`: 布尔值

In [131]:
data = np.array([[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]])
print(f"数组:\n{data}, dtype={data.dtype}")

data = data * np.array([0.01])
print(f"\n数组:\n{data}, dtype={data.dtype}")

data = np.array([n >= 0.1 for n in data.flat]).reshape(data.shape)
print(f"\n数组:\n{data}, dtype={data.dtype}")

数组:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]], dtype=int64

数组:
[[[0.01 0.02 0.03 0.04]
  [0.05 0.06 0.07 0.08]
  [0.09 0.1  0.11 0.12]]], dtype=float64

数组:
[[[False False False False]
  [False False False False]
  [False  True  True  True]]], dtype=bool


## 3. 改变数组的形状

In [132]:
# 定义一个 24 个元素的一维数组
data = np.arange(1, 25)
print(f"数组内容:\n{data}, shape={data.shape}")

# 改变数组的形状, 将一维数组改为二维数组
# `-1` 表示自动计算维度, 只有最后一个维度可以为 `-1`
data = data.reshape(2, -1)
print(f"\n数组内容:\n{data}, shape={data.shape}")

# 改变数组的形状, 将二维数组改为三维数组
# `-1` 表示自动计算维度, 只有最后一个维度可以为 `-1`
data = data.reshape(2, 3, -1)
print(f"\n数组内容:\n{data}, shape={data.shape}")

# 改变数组的形状, 将三维数组改为一维数组
data = data.reshape(-1)
print(f"\n数组内容:\n{data}, shape={data.shape}")

# 如果目标形状无法达成 (及元素个数无法满足目标形状要求), 则操作失败
# data = data.reshape(2, 5, -1)

数组内容:
[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24], shape=(24,)

数组内容:
[[ 1  2  3  4  5  6  7  8  9 10 11 12]
 [13 14 15 16 17 18 19 20 21 22 23 24]], shape=(2, 12)

数组内容:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]], shape=(2, 3, 4)

数组内容:
[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24], shape=(24,)


## 4. 数组转置

转置是线性代数的一个概念, 及将 $m \times n$ 矩阵转置为 $n \times m$ 矩阵, 矩阵中元素的位置关系不变, 例如:

对于矩阵
$
A=
\begin{bmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
\end{bmatrix}
$, 其转置矩阵为
$
A^T=
\begin{bmatrix}
1 & 4 \\
2 & 5 \\
3 & 6 \\
\end{bmatrix}
$

Numpy 支持多维数组 (多维矩阵), 故可对多维数组进行转置, 例如对于三维数组, 可将 $m \times n \times k$ 矩阵转置为 $k \times n \times m$

In [133]:
data = np.arange(1, 25).reshape(2, 3, 4)
print(f"数组内容:\n{data}, shape={data.shape}")

data = data.T
print(f"\n转置后数组内容:\n{data}, shape={data.shape}")

数组内容:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]], shape=(2, 3, 4)

转置后数组内容:
[[[ 1 13]
  [ 5 17]
  [ 9 21]]

 [[ 2 14]
  [ 6 18]
  [10 22]]

 [[ 3 15]
  [ 7 19]
  [11 23]]

 [[ 4 16]
  [ 8 20]
  [12 24]]], shape=(4, 3, 2)


## 5. 切片

数组的切片用于从数组中切割出一个新数组, 可以通过 Python 元素的 `slice` 对象进行切片, 也可以通过 Numpy 特有的 `:` 语法进行切片 (由于 Numpy 对数组索引做了特殊定义, 所以通过 `:` 语法取代 Python 元素的切片语法)

### 5.1. 一维数组切片

一维数组可以通过 Python 本身的 Slice (切片) 对象进行切片

In [134]:
# 定义一个一维数组
a = np.arange(1, 5, step=1)

# 定义一个切片对象
s = slice(1, 3, 1)

# 通过切片对象获取数组内容进行截取
print(f"对于数组 a = {a}, shape={a.shape}, 则:")
print(f"通过 s = {slice(1, 2, 1)} 对 a 切片结果为: a[s] = {a[s]}, shape={a[s].shape}")

对于数组 a = [1 2 3 4], shape=(4,), 则:
通过 s = slice(1, 2, 1) 对 a 切片结果为: a[s] = [2 3], shape=(2,)


一维数组也可以通过 Numpy 的切片语法 (`:`) 来进行切片, 语法为 `[起始索引:结束索引:步长]`, 将截取 $\small \left(起始索引, 结束索引\right]$ 之间的元素

In [135]:
a = np.arange(1, 5, step=1)

print(f"对于数组 a = {a}, shape={a.shape}, 则:")
print(f"通过 [1:3:1] 对 a 切片结果为: a[1:3:1] = {a[1:3:1]}, shape={a[1:3:1].shape}")

对于数组 a = [1 2 3 4], shape=(4,), 则:
通过 [1:3:1] 对 a 切片结果为: a[1:3:1] = [2 3], shape=(2,)


如果省略切片的 "起始索引", 即 (:结束索引:步长), 则默认为 "起始索引为 `0`"; 如果省略切片的 "结束索引", 即 (开始索引::步长), 则默认为 "结束索引为 `-1`", 即最后一个索引; 如果省略切片的 "步长", 即 (开始索引:结束索引), 则默认为 "步长为 `1`"

如果切片步长为负数 (例如 `-1`), 则结果数组为元素住的逆序, 例如 `[::-1]` 表示切片结果为从数组的最后一个元素开始到第一个元素的逆序, `[-2::-2]` 表示切片结果为从数组倒数第二个元素开始到第一个元素的逆序, 间隔两个元素, 而 `[-2:0:-1]` 表示切片结果为从数组倒数第二个元素开始到第二个元素的逆序, 间隔一个元素

In [136]:
a = np.arange(1, 10, step=1)

aprint(
    "一维数组切片:",
    {
        "a": a,
        "a[1]": a[1],
        "a[1:3]": a[1:6],
        "a[1:3:2]": a[1:6:2],
        "a[1:]": a[1:],
        "a[:6]": a[:6],
        "a[::2]": a[::2],
        "a[2:-1]": a[2:-1],
        "a[::-1]": a[::-1],
        "a[-2::-1]": a[-2::-1],
        "a[-2:0:-1]": a[-2:0:-1],
    },
)

一维数组切片:
● a:
[1 2 3 4 5 6 7 8 9], shape=(9,)
● a[1]:
2
● a[1:3]:
[2 3 4 5 6], shape=(5,)
● a[1:3:2]:
[2 4 6], shape=(3,)
● a[1:]:
[2 3 4 5 6 7 8 9], shape=(8,)
● a[:6]:
[1 2 3 4 5 6], shape=(6,)
● a[::2]:
[1 3 5 7 9], shape=(5,)
● a[2:-1]:
[3 4 5 6 7 8], shape=(6,)
● a[::-1]:
[9 8 7 6 5 4 3 2 1], shape=(9,)
● a[-2::-1]:
[8 7 6 5 4 3 2 1], shape=(8,)
● a[-2:0:-1]:
[8 7 6 5 4 3 2], shape=(7,)


### 5.2. 多维数组切片

对于多维数组, 主要是通过 Numpy 提供的 `:` 切片语法进行, 可以用 `,` 分隔来表示对特定维度的部分进行切片, 例如对于 shape=`(2, 3, 4)` 的数组, 可以有如下切片:
- 通过 `[1:2:1]` 表示对第一个维进行切片, 即将三维数组看作是一个长度为 `2` 的一维数组, 取其中第二个元素;
- 通过 `[:, 1:2:1]` 来表示对第二个维进行切片, 即将三维数组看作是一个两行两列的二维数组, 第一维全部保留, 第二维取第二个元素;

In [137]:
a = arange_by_shape((2, 3, 4), 1)

aprint(
    "多维数组切片:",
    {
        "a": a,
        "a[1:2:1]": a[1:2:1],  # 对第一维度进行切片
        "a[:, 1:2:1]": a[:, 1:2:3],  # 对第二维度进行切片
        "a[:, :, 1:2:1]": a[:, :, 1:2:1],  # 对第三维度进行切片
        "a[1:2:1, 1:2:1]": a[1:2:1, 1:2:1],  # 对第一, 二维度进行切片
        "a[1:2:1, :, 1:2:1]": a[1:2:1, :, 1:2:1],  # 对第一, 三维度进行切片
        "a[1:2:1, 1:2:1, 1:2:1]": a[1:2:1, 1:2:1, 1:2:1],  # 对第一, 二, 三维度进行切片
    },
)

多维数组切片:
● a:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]], shape=(2, 3, 4)
● a[1:2:1]:
[[[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]], shape=(1, 3, 4)
● a[:, 1:2:1]:
[[[ 5  6  7  8]]

 [[17 18 19 20]]], shape=(2, 1, 4)
● a[:, :, 1:2:1]:
[[[ 2]
  [ 6]
  [10]]

 [[14]
  [18]
  [22]]], shape=(2, 3, 1)
● a[1:2:1, 1:2:1]:
[[[17 18 19 20]]], shape=(1, 1, 4)
● a[1:2:1, :, 1:2:1]:
[[[14]
  [18]
  [22]]], shape=(1, 3, 1)
● a[1:2:1, 1:2:1, 1:2:1]:
[[[18]]], shape=(1, 1, 1)


### 5.3. 切片占位符

通过 `...` 符号可以在 Numpy 切片中作为占位符, 其作用表示 "选择所有剩余维度", 而无需使用多个 `:` 符号, 例如:

- `a[:, :, 1]` 和 `a[..., 1]` 等价
- `a[1, :, :]` 和 `a[1, ...]` 等价
- `a[1, :, :, 1]` 和 `a[1, ..., 1]` 等价

In [138]:
a = arange_by_shape((2, 3, 4), 1)

aprint(
    "多维数组切片:",
    {
        "a": a,
        "a[1, ...]": a[1, ...],  # 相当于 `a[1, :, :]`
        "a[0:1:1, ...]": a[0:1:1, ...],  # 相当于 `a[0:1:1, :, :]`
        "a[..., 2]": a[..., 2],  # 相当于 `a[:, :, 2]`
        "a[..., 2:3]": a[..., 2:3],  # 相当于 `a[:, :, 2:3]`
        "a[1, ..., 2]": a[1, ..., 2],  # 相当于 `a[1, :, 2]`
    },
)

多维数组切片:
● a:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]], shape=(2, 3, 4)
● a[1, ...]:
[[13 14 15 16]
 [17 18 19 20]
 [21 22 23 24]], shape=(3, 4)
● a[0:1:1, ...]:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]], shape=(1, 3, 4)
● a[..., 2]:
[[ 3  7 11]
 [15 19 23]], shape=(2, 3)
● a[..., 2:3]:
[[[ 3]
  [ 7]
  [11]]

 [[15]
  [19]
  [23]]], shape=(2, 3, 1)
● a[1, ..., 2]:
[15 19 23], shape=(3,)


## 6. 索引

索引用于获取 Numpy 数组中的某个元素, 根据数组维度和索引维度的不同, 该元素可以是一个值或一个数组

### 6.1. 一维数组索引

Numpy 一维数组的索引类似于 Python 数组的索引, 获取索引指定位置的数组元素值

In [139]:
a = np.arange(10, dtype=np.int32)

aprint(
    "一维数组索引:",
    {
        "a": a,
        "a[0]": a[0],  # 返回数组元素
        "a[5]": a[5],
        "a[-1]": a[-1],  # 返回数组最后一个元素
    },
)

一维数组索引:
● a:
[0 1 2 3 4 5 6 7 8 9], shape=(10,)
● a[0]:
0
● a[5]:
5
● a[-1]:
9


### 6.2. 二维数组索引

二维数组相当于多个一维数组的集合, 所以通过一维索引结果为一维数组, 通过二维索引结果为元素, 即:

- 一维索引: `a[i]`
- 二维索引: `a[i, j]`

In [140]:
a = arange_by_shape((3, 5), 1)

aprint(
    "一维数组索引:",
    {
        "a": a,
        "a[0]": a[0],  # 返回第二维的数组
        "a[-1]": a[-1],  # 返回第二维最后一个数组
        "a[1, 2]": a[1, 2],  # 返回元素值
        "a[0, -1]": a[0, -1],
    },
)

一维数组索引:
● a:
[[ 1  2  3  4  5]
 [ 6  7  8  9 10]
 [11 12 13 14 15]], shape=(3, 5)
● a[0]:
[1 2 3 4 5], shape=(5,)
● a[-1]:
[11 12 13 14 15], shape=(5,)
● a[1, 2]:
8
● a[0, -1]:
5


### 6.3. 多维数组索引

多维数组相当于二维数组的一个延申, 通过指定维度的索引可以访问数组中对应维度的元素

In [141]:
a = arange_by_shape((3, 4, 5), 1)

aprint(
    "多维数组索引:",
    {
        "a": a,
        "a[0]": a[0],  # 返回第二维的数组
        "a[-1]": a[-1],
        "a[1, 2]": a[1, 2],  # 返回第三维的数组
        "a[0, -1]": a[0, -1],
        "a[1, 2, 3]": a[1, 2, 3],  # 返回元素值
        "a[1, -1, 3]": a[1, -1, 3],
    },
)

多维数组索引:
● a:
[[[ 1  2  3  4  5]
  [ 6  7  8  9 10]
  [11 12 13 14 15]
  [16 17 18 19 20]]

 [[21 22 23 24 25]
  [26 27 28 29 30]
  [31 32 33 34 35]
  [36 37 38 39 40]]

 [[41 42 43 44 45]
  [46 47 48 49 50]
  [51 52 53 54 55]
  [56 57 58 59 60]]], shape=(3, 4, 5)
● a[0]:
[[ 1  2  3  4  5]
 [ 6  7  8  9 10]
 [11 12 13 14 15]
 [16 17 18 19 20]], shape=(4, 5)
● a[-1]:
[[41 42 43 44 45]
 [46 47 48 49 50]
 [51 52 53 54 55]
 [56 57 58 59 60]], shape=(4, 5)
● a[1, 2]:
[31 32 33 34 35], shape=(5,)
● a[0, -1]:
[16 17 18 19 20], shape=(5,)
● a[1, 2, 3]:
34
● a[1, -1, 3]:
39


### 6.4. 过滤条件索引

Numpy 索引可以为一个 "布尔" 值, 索引结果中会包含所有索引值为 `True` 的元素, 所以可以在索引中包含一个值为 "布尔" 值的表达式, 对数组进行过滤, 类似 `a[a > 0]`

过滤条件索引会对数组中的**所有维度**的元素进行计算, 如果该维度的元素可满足条件索引表达式的计算, 且满足条件索引表达式的计算结果为 `True`, 则该元素会被包含在结果数组中

In [142]:
a = np.arange(10, dtype=np.int32)
aprint(
    "一维数组过滤结果:",
    {
        "a": a,
        "a[a > 5]": a[a > 5],  # 过滤所有值大于 `5 的元素
        "a[~(a > 5)]": a[~(a > 5)],  # 逻辑求反, 即过滤所有值小于等于 `5` 的元素
        "a[a % 2 == 0]": a[a % 2 == 0],  # 过滤所有值为偶数的元素
    },
)

a = arange_by_shape((4, 5), 1)
aprint(
    "\n多维数组过滤结果:",
    {
        "a": a,
        "a[a > 5]": a[a > 5],  # 过滤所有值大于 `5` 的元素, 返回一个数组, 包含所有维度中值大于 `5` 的元素
        "a[~(a > 5)]": a[~(a > 5)],  # 逻辑求反, 即过滤所有维度中值小于等于 `5` 的元素
        "a[a % 2 == 0]": a[a % 2 == 0],  # 过滤所有维度中值为偶数的元素
        "a[np.sum(a, axis=1) > 50]": a[
            np.sum(a, axis=1) > 50  # 过滤数组元素求和值大于 `50` 的数组元素, 如果数组元素不满足 `np.sum` 计算要求, 则返回 `False`
        ],
    },
)

一维数组过滤结果:
● a:
[0 1 2 3 4 5 6 7 8 9], shape=(10,)
● a[a > 5]:
[6 7 8 9], shape=(4,)
● a[~(a > 5)]:
[0 1 2 3 4 5], shape=(6,)
● a[a % 2 == 0]:
[0 2 4 6 8], shape=(5,)

多维数组过滤结果:
● a:
[[ 1  2  3  4  5]
 [ 6  7  8  9 10]
 [11 12 13 14 15]
 [16 17 18 19 20]], shape=(4, 5)
● a[a > 5]:
[ 6  7  8  9 10 11 12 13 14 15 16 17 18 19 20], shape=(15,)
● a[~(a > 5)]:
[1 2 3 4 5], shape=(5,)
● a[a % 2 == 0]:
[ 2  4  6  8 10 12 14 16 18 20], shape=(10,)
● a[np.sum(a, axis=1) > 50]:
[[11 12 13 14 15]
 [16 17 18 19 20]], shape=(2, 5)


### 6.5. 数组索引 (花式索引)

Numpy 允许使用数组作为索引, 用于一次性批量获取对应数组多个索引对应的元素

例如: `a[[1, 3]]` 表示获取数组 `a` 索引为 `1` 和 `3` 的元素, 其中:

- 如果数组 `a` 是一维数组, 则返回 `1` 和 `3` 对应的元素值, 结果为一个一维数组
- 如果数组 `a` 是多维数组, 则返回 `1` 和 `3` 行的全部元素值, 结果为一个多维数组

当 $A = \begin{bmatrix}
a_{0} & a_{1} & a_{2} & a_{3} & a_{4} & a_{5}
\end{bmatrix}$, 则 $A[[1, 3, 5]] = \begin{bmatrix}
a_{1} & a_{3} & a_{5}
\end{bmatrix}$, 其中 $a_{n}$ 可以为一个元素值, 或者一个多维数组

可以通过多个数组索引来对应多维数组的各个维度, 例如对于一个三维数组, 则可通过如下索引方式获取各个维度元素:

- `a[[1, 3]]`: 获取第一维度索引为 `1` 和 `3` 的两个二维数组;
- `a[[1, 3], [2, 4]]`: 获取第一维度索引为 `1` 和 `3` 的两项, 以及索引为 `1` 项中索引为 `2` 和索引为 `3` 项中索引为 `4` 的子项;
- `a[[1, 3], [2, 4], [3]]`: 获取第一维度索引为 `1` 和 `3` 的两项, 在此基础上获取索引为 `1` 项中索引为 `2` 和索引为 `3` 项中索引为 `4` 的子项, 以及索引为 `2` 和索引为 `4` 项中索引为 `3` 的子项;

In [143]:
a = np.arange(100, step=10, dtype=np.int32)
aprint(
    "一维数组索引结果:",
    {
        "a": a,
        "a[[1, 3, 5]]": a[[1, 3, 5]],  # 获取数组中索引为 `1, 3, 5` 的元素
        "a[[-1, -3, -5]]": a[[-1, -3, -5]],  # 获取数组中索引为 `-1, -3, -5` 的元素 (反向索引)
    },
)

a = arange_by_shape((3, 3, 3), 1)
aprint(
    "\n多维数组索引结果:",
    {
        "a": a,
        "a[[0, 1]]": a[[0, 1]],  # 获取数组中索引为 `0`, `1` 的元素, 即数组第一维的前两项
        "a[[0, 1], [1, 2]]": a[
            [0, 1],
            [1, 2],
        ],  # 在数组第一维的前两项基础上, 获取第 `1` 项中索引为 `1` 的项以及 第 `2` 项中索引为 `2` 的项
        "a[[0, 1], [1, 2], [0, 1]]": a[
            [0, 1],
            [1, 2],
            [0, 1],
        ],  # 在上述索引的基础上, 获取第 `1` 项中索引为 `0` 的项以及 第 `2` 项中索引为 `1` 的项
    },
)

一维数组索引结果:
● a:
[ 0 10 20 30 40 50 60 70 80 90], shape=(10,)
● a[[1, 3, 5]]:
[10 30 50], shape=(3,)
● a[[-1, -3, -5]]:
[90 70 50], shape=(3,)

多维数组索引结果:
● a:
[[[ 1  2  3]
  [ 4  5  6]
  [ 7  8  9]]

 [[10 11 12]
  [13 14 15]
  [16 17 18]]

 [[19 20 21]
  [22 23 24]
  [25 26 27]]], shape=(3, 3, 3)
● a[[0, 1]]:
[[[ 1  2  3]
  [ 4  5  6]
  [ 7  8  9]]

 [[10 11 12]
  [13 14 15]
  [16 17 18]]], shape=(2, 3, 3)
● a[[0, 1], [1, 2]]:
[[ 4  5  6]
 [16 17 18]], shape=(2, 3)
● a[[0, 1], [1, 2], [0, 1]]:
[ 4 17], shape=(2,)


可以通过 `np.ix_` 函数来构建一个行和列交叉索引, 从而获取到集合的一个笛卡尔积

例如对于一个 shape=`(5, 5)` 的二位数组, 通过 `np.ix_([0, 2, 4], [1, 3, 4])` 可以获取到 `(0, 1)`, `(0, 3)`, `(0, 4)`, `(2, 1)`, `(2, 3)`, `(2, 4)`, `(4, 1)`, `(4, 3)`, `(4, 4)` 这一系列索引, 根据索引的形状 ($3 \times 3$), 可以得到如下结果：

$设: A = \begin{bmatrix}
    \begin{bmatrix}
        1 & 2 & 3 & 4 & 5
    \end{bmatrix} \\
    \begin{bmatrix}
        6 & 7 & 8 & 9 & 10
    \end{bmatrix} \\
    \begin{bmatrix}
        11 & 12 & 13 & 14 & 15
    \end{bmatrix} \\
    \begin{bmatrix}
        16 & 17 & 18 & 19 & 20
    \end{bmatrix} \\
    \begin{bmatrix}
        21 & 22 & 23 & 24 & 25
    \end{bmatrix}
\end{bmatrix}, 则：A[np.ix\_([0, 2, 4], [1, 3, 4])] = \begin{bmatrix}
    \begin{bmatrix}
        A[[0, 1]] & A[[0, 3]] & A[[0, 4]]
    \end{bmatrix} \\
    \begin{bmatrix}
        A[[2, 1]] & A[[2, 3]] & A[[2, 4]]
    \end{bmatrix} \\
    \begin{bmatrix}
        A[[4, 1]] & A[[4, 3]] & A[[4, 4]]
    \end{bmatrix}
\end{bmatrix} = \begin{bmatrix}
    \begin{bmatrix}
        2 & 4 & 5
    \end{bmatrix} \\
    \begin{bmatrix}
        12 & 14 & 15
    \end{bmatrix} \\
    \begin{bmatrix}
        22 & 24 & 25
    \end{bmatrix}
\end{bmatrix}$

#### 6.5.1 对于二维数组

In [144]:
a = arange_by_shape((5, 5), 1)
idx = np.ix_([0, 2, 4], [1, 3, 4])  # 构建行和列交叉索引, 该索引的结果为 3x3 数组

aprint(
    "二维数组笛卡尔积索引为:",
    {
        "a": a,
        "idx": idx,
        "a[idx]": a[idx],
    },
)

二维数组笛卡尔积索引为:
● a:
[[ 1  2  3  4  5]
 [ 6  7  8  9 10]
 [11 12 13 14 15]
 [16 17 18 19 20]
 [21 22 23 24 25]], shape=(5, 5)
● idx:
(array([[0],
       [2],
       [4]]), array([[1, 3, 4]]))
● a[idx]:
[[ 2  4  5]
 [12 14 15]
 [22 24 25]], shape=(3, 3)


#### 6.5.2 对于多维数组

In [150]:
a = arange_by_shape((3, 3, 3), 1)
idx = np.ix_([0, 1], [1, 2], [1, 0, 2])  # 构建行和列交叉索引, 该索引的结果为 2x2x3 数组

aprint(
    "多维数组笛卡尔积索引为:",
    {
        "a": a,
        "idx": idx,
        "a[idx]": a[idx],
    },
)

多维数组笛卡尔积索引为:
● a:
[[[ 1  2  3]
  [ 4  5  6]
  [ 7  8  9]]

 [[10 11 12]
  [13 14 15]
  [16 17 18]]

 [[19 20 21]
  [22 23 24]
  [25 26 27]]], shape=(3, 3, 3)
● idx:
(array([[[0]],

       [[1]]]), array([[[1],
        [2]]]), array([[[1, 0, 2]]]))
● a[idx]:
[[[ 5  4  6]
  [ 8  7  9]]

 [[14 13 15]
  [17 16 18]]], shape=(2, 2, 3)
