In [None]:
import numpy as np
import scipy.stats as scs
import matplotlib.pyplot as plt

# 大数定律和中心极限定理
---

**scipy.stats 常用函数：**

- `rvs`：产生服从指定分布的随机数
- `pmf`：概率质量函数
- `pdf`：概率密度函数
- `cdf`：累积分布函数
- `sf`：1-cdf
- `ppf`：分位点函数（CDF的逆）
- `isf`：sf的逆
- `fit`：极大似然估计拟合

### 二项分布

In [None]:
# 大数定律（样本均值收敛于总体均值）
data = scs.binom.rvs(n=50, p=0.5, size=100000)     # 生成服从二项分布的随机变量
data.mean()

In [None]:
# 中心极限定理（样本均值服从正态分布）
means = []
for i in range(100):
    data = scs.binom.rvs(n=50, p=0.5, size=100)   # 生成服从二项分布的随机变量
    means.append(data.mean())                     # 计算样本均值
means = np.array(means)
plt.hist(means, bins=30, density=1)

In [None]:
# 正态分布拟合
mu, sigma = scs.norm.fit(means)
x = np.linspace(means.min(), means.max(), 100)
plt.hist(means, bins=30, density=1)
plt.plot(x, scs.norm.pdf(x, loc=mu, scale=sigma), lw=3)
plt.xlim(means.min(), means.max())

### 泊松分布

In [None]:
# 大数定律（样本均值收敛于总体均值）
data = scs.poisson.rvs(mu=3, size=100000)     # 生成服从泊松分布的随机变量
data.mean()

In [None]:
# 中心极限定理（样本均值服从正态分布）
means = []
for i in range(100):
    data = scs.poisson.rvs(mu=3, size=100)   # 生成服从泊松分布的随机变量
    means.append(data.mean())                # 计算样本均值
means = np.array(means)
plt.hist(means, bins=30, density=1)

# 正态分布拟合
mu, sigma = scs.norm.fit(means)
x = np.linspace(means.min(), means.max(), 100)
plt.plot(x, scs.norm.pdf(x, loc=mu, scale=sigma), lw=3)
plt.xlim(means.min(), means.max())

### 指数分布

In [None]:
# 大数定律（样本均值收敛于总体均值）
data = scs.expon.rvs(scale=0.5, size=100000)      # 生成服从指数分布的随机变量
data.mean()

In [None]:
# 中心极限定理（样本均值服从正态分布）
means = []
for i in range(100):
    data = scs.expon.rvs(scale=0.5, size=100)     # 生成服从指数分布的随机变量
    means.append(data.mean())                     # 计算样本均值
means = np.array(means)
plt.hist(means, bins=30, density=1)

# 正态分布拟合
mu, sigma = scs.norm.fit(means)
x = np.linspace(means.min(), means.max(), 100)
plt.plot(x, scs.norm.pdf(x, loc=mu, scale=sigma), lw=3)
plt.xlim(means.min(), means.max())

### 正态分布

In [None]:
# 大数定律（样本均值收敛于总体均值）
data = scs.norm.rvs(loc=0, scale=1, size=100000)      # 生成服从正态分布的随机变量
data.mean()

In [None]:
# 中心极限定理（样本均值服从正态分布）
means = []
for i in range(100):
    data = scs.norm.rvs(loc=0, scale=1, size=100)     # 生成服从正态分布的随机变量
    means.append(data.mean())                         # 计算样本均值
means = np.array(means)
plt.hist(means, bins=30, density=1)

# 正态分布拟合
mu, sigma = scs.norm.fit(means)
x = np.linspace(means.min(), means.max(), 100)
plt.plot(x, scs.norm.pdf(x, loc=mu, scale=sigma), lw=3)
plt.xlim(means.min(), means.max())

声明：本资料仅限内部研究和交流使用，切勿外传。