# 数组创建

In [None]:
import numpy as np

## 等差序列

类似于Python的`range()`，`NumPy`也能创建一个等间隔的数组。

### `np.arange()`

`np.arange(start, stop, step=1, dtype=None)`

| 参数 | 说明 |
| --- | --- |
| start | 起始值，默认为0 |
| stop | 终止值，不包含终止值 |
| step | 步长，默认为1 |
| dtype | 数据类型，不提供则自动推断 |

In [None]:
np.arange(0, 100, 10, dtype=np.int32)

通常会结合`reshape()`一起使用。

In [None]:
np.arange(0, 100, 5, dtype=np.int32).reshape((5, 4))

【例】生成4行4列的二维数组$ [[40, 38, 36, 34], [32, 30, 28, 26], [24, 22, 20, 18], [16, 14, 12, 10]] $

In [None]:
np.arange(40, 8, -2, dtype=np.int32).reshape((4, 4))

### `np.linspace()`

`np.linspace()`用于生成在某一确定区间内的一维数组，功能相较于`np.arange()`更加强大。

`np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)`

| 参数 | 说明 |
| --- | --- |
| start | 起始值，默认为0 |
| stop | 终止值，如果`endpoint`为`True`，则包含终止值 |
| num | 生成等步长的样本数量，默认为50 |
| endpoint | 是否包含`stop` |
| retstep | 若为`True`，函数同时返回步长 |
| dtype | 数据类型，省略则自动推断 |

In [None]:
np.linspace(0, 10, endpoint=False, num=10, dtype=np.int32)

In [None]:
np.linspace(0, 9, endpoint=True, num=10, retstep=True, dtype=np.int32)

【例】生成一个范围在$ [0.6, 96.6] $的16等分数组

In [None]:
np.linspace(0.6, 96.6, endpoint=True, num=16, retstep=True, dtype=np.float64)

## 等比序列

### `np.logspace()`

`np.logspace()`通过指定基数、基数的起始指数、基数的终止指数、样本数量等元素，来定义一个等比数列。

`np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)`

| 参数 | 说明 |
| --- | --- |
| start | 幂的起始值 |
| stop | 幂的终止值，如果`endpoint`为`True`，则包含终止值 |
| num | 生成的样本数量，默认为50 |
| endpoint | 是否包含`stop` |
| base | 基数 |
| dtype | 数据类型，省略则自动推断 |

In [None]:
np.logspace(1, 10, num=10, endpoint=True, base=2, dtype=np.int32)

【例】生成一个$ 3^0 \sim 3^{10} $的序列

In [None]:
np.logspace(0, 10, num=11, endpoint=True, base=3, dtype=np.int32)

## 随机数

`np.random`模块对Python内置的`random`进行了补充，增加了一些用于高效生成符合多种概率分布的样本值的函数。

### 均匀分布

#### `np.random.rand()`

`np.random.rand()`用于创建一个$ [0,1) $均匀分布的随机浮点数（组）。

`np.random.rand(d0, d1, ..., dn)`

| 参数 | 说明 |
| --- | --- |
| d0, d1, ..., dn | 生成数组的维度，不指定返回一个浮点数 |

In [None]:
np.random.rand()

In [None]:
np.random.rand(3, 2)

#### `np.random.uniform()`

`np.random.uniform()`用于创建一个在指定区间内符合均匀分布的随机数（组）。

`np.random.uniform(low=0.0, high=1.0, size=None)`

| 参数 | 说明 |
| --- | --- |
| low | 下界，默认为0 |
| high | 上界，默认为1 |
| size | 样本维数 |

在无任何参数的时候，`np.random.uniform()`与`np.random.rand()`功能相同。

In [None]:
np.random.uniform()

【例】创建一个$ [0, 10] $之间均匀采样的$ 4 \times 4 $数组。

In [None]:
np.random.uniform(0, 10, size=(4, 4))

#### `np.random.randint()`

`np.random.randint()`用于创建一个在指定区间内符合均匀分布的随机整数（数组）。

`np.random.randint(low, high=None, size=None, dtype='int')`

| 参数 | 说明 |
| --- | --- |
| low | 下界，当`high`不指定时，采样区间为$ [0, low) $ |
| high | 上界，指定时，采样区间为$ [low, high) $ |
| size | 样本维数 |
| dtype | 数据类型 |

In [None]:
np.random.randint(10)

【例】生成10个在$ [0, 100) $区间的随机整数

In [None]:
np.random.randint(low=0, high=100, size=10, dtype=np.int32)

### 正态分布

#### `np.random.randn()`

`np.random.randn()`用于创建一个指定维度的、符合标准正态分布（**以0为均值、1为标准差**）的浮点数（数组）。

`np.random.randn(d0, d1, ..., dn)`

| 参数 | 说明 |
| --- | --- |
| d0, d1, ..., dn | 生成数组的维度，不指定返回一个浮点数 |

In [None]:
np.random.randn()

![](./img/normal_distribution.png)

In [None]:
np.random.randn(3, 2)

#### `np.random.normal()`

`np.random.normal()`用于创建一个指定维度的、符合指定正态分布（**以`loc`为均值、`scale`为标准差**）的浮点数（数组）。

`np.random.normal(loc=0.0, scale=1.0, size=None)`

| 参数 | 说明 |
| --- | --- |
| loc | 采样样本分布的均值 |
| scale | 采样样本分布的标准差 |
| size | 样本维数 |

在无任何参数的时候，`np.random.normal()`与`np.random.randn()`功能相同。

【例】生成一个$ 3 \times 2 $的数组，符合均值为5、标准差为10的正态分布。

In [None]:
np.random.normal(5, 10, (3, 2))

在均值为5、标准差为10的正态分布下，大约68%的数据会分布在$ [5-10, 5+10] $之间。

【例】生成一个$ 3 \times 4 \times 5 $的三维数组，符合均值为171.4、标准差为11.3的正态分布。

In [None]:
np.random.normal(171.4, 11.3, size=(3, 4, 5))