In [1]:
import numpy as np
# numpy.random模块填补了python内建的random模块的不足，可以高效的生成多种概率分布下的完整样本值数组。

In [2]:
samples = np.random.normal(size=(4, 4))  # normal()可以获得正态分布样本数组
samples

array([[ 0.17502539,  0.81362641,  0.59023091,  1.08290087],
       [ 0.64830084, -0.12736397, -1.6949538 , -1.89623281],
       [ 1.28442788, -0.49172639,  0.57404493,  0.1701702 ],
       [ 0.2076913 ,  0.68371451,  0.07396311,  0.75639273]])

In [3]:
# 与python内建的random对比一下性能
# 可以看到在生成大型样本时，numpy.random比python内建的版本快了一个数量级
from random import normalvariate
N = 1000000
%timeit samples = [normalvariate(0, 1) for _ in range(N)]

1.22 s ± 7.19 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [4]:
%timeit np.random.normal(size=N)

68.3 ms ± 352 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [5]:
np.random.seed(1234)  # 设置numpy的随机数种子

In [6]:
rng = np.random.RandomState(1234)  # 创建一个随机数生成器，规避全局状态（种子）
rng.randn(10)

array([ 0.47143516, -1.19097569,  1.43270697, -0.3126519 , -0.72058873,
        0.88716294,  0.85958841, -0.6365235 ,  0.01569637, -2.24268495])

In [7]:
# numpy.random中部分函数列表
"""
函数           说明                                 
seed         确定随机数生成器的种子
permutation  返回一个序列的随机排列或返回一个随机排列的范围
shuffle      对一个序列就地随机排列
rand         产生均匀分布的样本值
randint      从给定的上下限范围内随机选取整数
randn        产生正态分布（平均值为0,标准差为1）的样本值，类似于MATLAB接口
binomial     产生二项分布的样本值
normal       产生正态（高斯）分布的样本值
beta         产生Beta分布的样本值
chisquare    产生卡方分布的样本值
gamma        产生Gamma分布的样本值
uniform      产生在［0,1）中均匀分布的样本值
"""

'\n函数           说明                                 \nseed         确定随机数生成器的种子\npermutation  返回一个序列的随机排列或返回一个随机排列的范围\nshuffle      对一个序列就地随机排列\nrand         产生均匀分布的样本值\nrandint      从给定的上下限范围内随机选取整数\nrandn        产生正态分布（平均值为0,标准差为1）的样本值，类似于MATLAB接口\nbinomial     产生二项分布的样本值\nnormal       产生正态（高斯）分布的样本值\nbeta         产生Beta分布的样本值\nchisquare    产生卡方分布的样本值\ngamma        产生Gamma分布的样本值\nuniform      产生在［0,1）中均匀分布的样本值\n'