## 重要性采样和有偏重要性采样的Python实现  
本文将使用Python来实现重要性采样（Importance Sampling）和有偏重要性采样（Biased Importance Sampling）  
我们将实现这些技术来估计目标分布下函数的期望值，并将结果与真实值进行比较

### 简介  
重要性采样是一种在蒙特卡洛方法中使用的技术，通过从不同的分布 𝑞(𝑥) 采样来估计目标分布 𝑝(𝑥) 下的函数期望值。  
核心思想是通过适当的权重调整 𝑝(𝑥) 和 𝑞(𝑥) 之间的差异。重要性采样估计器定义为：  

$$
\hat{s}_q = \frac{1}{n} \sum_{i=1}^{n} \frac{p(x^{(i)}) f(x^{(i)})}{q(x^{(i)})}, x^{(i)} \sim q
$$

有偏重要性采样修改了这个估计器，以避免需要归一化的分布，从而得到一个有偏但随着样本量 𝑛 趋于无穷大时渐进无偏的估计器：

$$
\hat{s}_{BIS} = \frac{\sum_{i=1}^{n} \frac{p(x^{(i)})}{q(x^{(i)})} f(x^{(i)})}{\sum_{i=1}^{n} \frac{p(x^{(i)})}{q(x^{(i)})}}
$$

目录如下：

1. 实现上述两个估计器。
2. 使用不同的采样分布 𝑞(𝑥) 来观察对方差的影响。
3. 将估计器与真实期望值进行比较。


### 实现步骤

1. **定义目标分布** $𝑝(𝑥)$、采样分布 $𝑞(𝑥)$ 和函数 $𝑓(𝑥)$：  
   - 目标分布 $𝑝(𝑥)$：标准正态分布 $𝑁(0,1)$。  
   - 采样分布 $𝑞(𝑥)$：具有不同方差的正态分布。  
   - 函数 $𝑓(𝑥)$：我们将使用 $𝑓(𝑥) = 𝑥^2$，其在 $𝑁(0,1)$ 下的期望值已知（$𝐸[𝑋^2] = 1$）。

2. **从 $𝑞(𝑥)$ 生成样本**。

3. **计算权重**：  
   对于每个样本 $𝑥𝑖$，计算权重：
   $$
   w_i = \frac{p(x_i)}{q(x_i)}
   $$

4. **计算重要性采样估计器和有偏重要性采样估计器**：  
   - 重要性采样估计器：
     $$
     \hat{s}_q = \frac{1}{n} \sum_{i=1}^{n} \frac{p(x^{(i)}) f(x^{(i)})}{q(x^{(i)})}
     $$
   - 有偏重要性采样估计器：
     $$
     \hat{s}_{BIS} = \frac{\sum_{i=1}^{n} \frac{p(x^{(i)})}{q(x^{(i)})} f(x^{(i)})}{\sum_{i=1}^{n} \frac{p(x^{(i)})}{q(x^{(i)})}}
     $$

5. **计算方差和标准误差**。

6. **将估计器与真实值进行比较并分析方差**。


### 代码实现  
首先，导入必要的库并定义分布和函数 $f(x)$

In [1]:
import numpy as np
import matplotlib.pyplot as plt

# 目标分布 p(x)：标准正态分布 N(0, 1)
def p(x):
    return (1 / np.sqrt(2 * np.pi)) * np.exp(-x**2 / 2)

# 采样分布 q(x)：正态分布 N(0, σ^2)
def q(x, sigma):
    return (1 / (np.sqrt(2 * np.pi) * sigma)) * np.exp(-x**2 / (2 * sigma**2))

# 函数 f(x)
def f(x):
    return x**2

### 计算权重

我们为每个样本计算权重，使用比率：

$$
w_i = \frac{p(x_i)}{q(x_i)}
$$


In [2]:
def compute_weights(x_samples, sigma):
    p_vals = p(x_samples)
    q_vals = q(x_samples, sigma)
    weights = p_vals / q_vals
    return weights

### 估计器
重要性采样估计器

In [3]:
def importance_sampling_estimator(x_samples, weights):
    f_vals = f(x_samples)
    estimator = np.mean(weights * f_vals)
    return estimator

有偏重要性采样估计器

In [4]:
def biased_importance_sampling_estimator(x_samples, weights):
    f_vals = f(x_samples)
    numerator = np.sum(weights * f_vals)
    denominator = np.sum(weights)
    estimator = numerator / denominator
    return estimator

### 方差计算
计算重要性采样估计器的方差

In [5]:
def compute_variance(weights, f_vals, n):
    wf = weights * f_vals
    variance = np.var(wf, ddof=1) / n
    return variance

### 主程序执行
针对不同的采样分布执行估计器并分析结果

In [6]:
# 真实的期望值
true_s = 1.0

# 样本量
n = 10000

# 不同的 q(x) 方差
sigma_values = [0.5, 1.0, 2.0, 5.0]

# 存储结果以便分析
results = []

for sigma in sigma_values:
    print(f"\n采样分布 q(x) 的方差 σ^2 = {sigma**2}")
    
    # 从 q(x) 采样
    x_samples = np.random.normal(loc=0, scale=sigma, size=n)
    
    # 计算权重
    weights = compute_weights(x_samples, sigma)
    
    # 计算估计器
    s_hat_q = importance_sampling_estimator(x_samples, weights)
    s_hat_bis = biased_importance_sampling_estimator(x_samples, weights)
    
    # 计算方差和标准误差
    f_vals = f(x_samples)
    variance_is = compute_variance(weights, f_vals, n)
    std_error_is = np.sqrt(variance_is)
    
    # 存储结果
    results.append({
        'sigma_squared': sigma**2,
        'importance_sampling_estimator': s_hat_q,
        'biased_importance_sampling_estimator': s_hat_bis,
        'variance': variance_is,
        'std_error': std_error_is
    })
    
    # 输出结果
    print(f"真实值 s = {true_s:.6f}")
    print(f"重要性采样估计器 = {s_hat_q:.6f}")
    print(f"有偏重要性采样估计器 = {s_hat_bis:.6f}")
    print(f"重要性采样估计器的方差 = {variance_is:.6f}")
    print(f"重要性采样估计器的标准误差 = {std_error_is:.6f}")


采样分布 q(x) 的方差 σ^2 = 0.25
真实值 s = 1.000000
重要性采样估计器 = 0.694828
有偏重要性采样估计器 = 0.735654
重要性采样估计器的方差 = 0.003652
重要性采样估计器的标准误差 = 0.060432

采样分布 q(x) 的方差 σ^2 = 1.0
真实值 s = 1.000000
重要性采样估计器 = 1.000577
有偏重要性采样估计器 = 1.000577
重要性采样估计器的方差 = 0.000191
重要性采样估计器的标准误差 = 0.013825

采样分布 q(x) 的方差 σ^2 = 4.0
真实值 s = 1.000000
重要性采样估计器 = 1.000607
有偏重要性采样估计器 = 1.011281
重要性采样估计器的方差 = 0.000048
重要性采样估计器的标准误差 = 0.006915

采样分布 q(x) 的方差 σ^2 = 25.0
真实值 s = 1.000000
重要性采样估计器 = 1.010328
有偏重要性采样估计器 = 1.002995
重要性采样估计器的方差 = 0.000181
重要性采样估计器的标准误差 = 0.013447


## 结果与分析  
将结果制成表格以可视化

In [12]:
import pandas as pd

df_results = pd.DataFrame(results)
df_results = df_results[['sigma_squared', 'importance_sampling_estimator', 'biased_importance_sampling_estimator', 'variance', 'std_error']]
df_results

Unnamed: 0,sigma_squared,importance_sampling_estimator,biased_importance_sampling_estimator,variance,std_error
0,0.25,0.694828,0.735654,0.003652,0.060432
1,1.0,1.000577,1.000577,0.000191,0.013825
2,4.0,1.000607,1.011281,4.8e-05,0.006915
3,25.0,1.010328,1.002995,0.000181,0.013447


### 结果对比

- **估计器值**：在不同的采样分布下，重要性采样估计器和有偏重要性采样估计器都接近真实值 $s = 1$。
- **方差**：当采样分布 𝑞(𝑥) 的方差远离目标分布 𝑝(𝑥) 时，估计器的方差增加。
- **标准误差**：同样地，标准误差随着 𝑞(𝑥) 的方差增大而增大。

### 结论

本文利用python实现了重要性采样和有偏重要性采样

- **采样分布的影响**：选择与目标分布 𝑝(𝑥) 接近的采样分布 𝑞(𝑥) 可以降低估计器的方差。
- **估计器性能**：两个估计器都提供了无偏（或渐进无偏）的期望值估计，但其效率取决于 𝑞(𝑥) 的选择。
- **实践考虑**：在高维空间或当 𝑞(𝑥) 与 𝑝(𝑥) 匹配不佳时，方差可能会变得很大，导致估计器效率低下。

重要性采样是一种强大的蒙特卡洛方法技术，在机器学习中有实际应用，包括加速神经网络的训练和估计分区函数。


#### 参考文献：

Goodfellow, I., Bengio, Y., & Courville, A. (2016).  *Deep Learning* . MIT Press.  
Bishop, C. M. (2006).  *Pattern Recognition and Machine Learning* . Springer.