`numpy.random` 这个公式在前面已经出现很多次了，这里详细说说；相比于 Python 内置的 `random` 来说（每次只给出一个值），`numpy.random`快多了

In [1]:
import numpy as np

In [2]:
samples = np.random.normal(size=(4, 4))

In [3]:
samples

array([[ 0.28096838,  0.50169904, -0.23349407, -1.21470333],
       [-1.0743989 ,  2.42302096, -0.30942088,  0.51077086],
       [-0.51061873, -0.31369679,  0.19314623,  1.89576107],
       [ 0.50435082,  0.57083584,  1.01040025, -1.49428608]])

In [4]:
from random import normalvariate

In [5]:
N = 1000000

In [6]:
%timeit samples = [normalvariate(0, 1) for _ in range(N)]

924 ms ± 19.9 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [7]:
%timeit np.random.normal(size = N)

32.7 ms ± 210 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


通过`np.random.seed`来确立你所需要的 seed

In [8]:
np.random.seed(1234)

`numpy.random`中的数据生成函数会使用 global random seed
为了避免 global 状态，可以使用`numpy.random.RandomState`创建一个与其他隔离的随机数生成器：

In [9]:
rng = np.random.RandomState(1234)

In [10]:
rng.randn(10)

array([ 0.47143516, -1.19097569,  1.43270697, -0.3126519 , -0.72058873,
        0.88716294,  0.85958841, -0.6365235 ,  0.01569637, -2.24268495])

下面是一些常用的`numpy.random`公式：

Function | Description
:- | :-
`seed` | 规定随机生成的种子
`permutation` | 返回随机排列的一个序列，或返回排列范围
`shuffle` | 就地随机排列序列（打乱）
`rand` | 从均匀分布中生成样本
`randint` | 从给定的低到高范围生成随机整数
`randn` | 从平均值为0，标准差为1的正态分布中生成样本（类似于MATLAB的界面）
`binomial` | 从二项分布中生成样本
`normal` | 从正态（高斯）分布中生成样本
`beta` | 从Beta分布中生成样本
`chisquare` | 从卡方分布中生成样本
`gamma` | 从Gamma分布中生成样本
`uniform` | 从均匀的`[0，1）`分布中生成样本