# 随机取样

In [1]:
import numpy as np

In [2]:
np.__version__

'1.15.0'

In [3]:
__author__ = 'kyubyong. longinglove@nate.com'

## 直接随机数据

 1. [ ] 建立一个形状为`(3, 2)`的阵列后用随机取样获得一个`[0, 1)`范围的统一分布取样结果。

In [4]:
np.random.rand(3, 2)
# np.random.random((3,2))

array([[0.98152943, 0.5725797 ],
       [0.01110044, 0.48626556],
       [0.95284688, 0.99781487]])

 2. [ ] 建立一个形状为`(1000, 1000)`的阵列后随机取样一个正态分布取样结果。接着验证均值和标准方差是否分别足够接近`0`和`1`。

In [5]:
out1 = np.random.randn(1000, 1000)
out2 = np.random.standard_normal((1000, 1000))
out3 = np.random.normal(loc=0.0, scale=1.0, size=(1000, 1000))
assert np.allclose(np.mean(out1), np.mean(out2), atol=0.1)
assert np.allclose(np.mean(out1), np.mean(out3), atol=0.1)
assert np.allclose(np.std(out1), np.std(out2), atol=0.1)
assert np.allclose(np.std(out1), np.std(out3), atol=0.1)
print(np.mean(out3))
print(np.std(out1))

0.0007229932644523419
0.999747553772026


 3. [ ] 建立一个形状为`(3, 2)`的阵列后随机整合成`0`到`3`范围的离散统一分布取样。（包含`3`）

In [6]:
np.random.randint(0, 4, (3, 2))

array([[1, 1],
       [0, 0],
       [2, 2]])

 4. [ ] 从`x`中随机提取一个元素，每个提取出来的元素概率会与`.3, .5, .2`有关。然后输出10次提取结果。

In [7]:
x = ['3 out of 10', '5 out of 10', '2 out of 10']
for _ in range(10):
    print(np.random.choice(x, p=[.3, .5, .2]))

5 out of 10
5 out of 10
5 out of 10
5 out of 10
2 out of 10
5 out of 10
2 out of 10
3 out of 10
5 out of 10
5 out of 10


 5. [ ] 从`0`到`9`随机提取3个不同整数，所含概率都相同。

In [8]:
np.random.choice(10, 3, replace=False)

array([2, 0, 7])

## 排列

 1. [ ] 对`0`到`9`（包含`9`）的数列进行随机排列，俗称洗牌。

In [9]:
x = np.arange(10)
np.random.shuffle(x)
x

array([7, 0, 9, 2, 5, 4, 3, 6, 8, 1])

In [10]:
# 随机排列函数
np.random.permutation(10)

array([3, 4, 7, 0, 9, 5, 2, 8, 1, 6])

## 随机生成器

 1. [ ] 把一个数字`10`分配给随机生成器，这样你可以在下一次获得同样的随机值。

In [11]:
np.random.seed(10)

In [12]:
np.random.permutation(10)

array([8, 2, 5, 6, 3, 1, 0, 7, 4, 9])

In [13]:
np.random.seed(10)
np.random.permutation(10)

array([8, 2, 5, 6, 3, 1, 0, 7, 4, 9])

In [14]:
np.random.permutation(10)

array([5, 3, 4, 7, 6, 8, 9, 2, 1, 0])