In [1]:
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(114514)

# 参数估计

- 生成测试数据(一维正态分布)

In [2]:
mu, sigma, size = 114, 0.514, 10000
X = np.random.normal(mu, sigma, size)

print(mu, sigma)

114 0.514


- 最大似然估计

    $\mu_{ML} = \frac{1}{N} \displaystyle\sum_{n=1}^{N}{x_n}$

    $\sigma_{ML}^{2} = \frac{1}{N} \displaystyle\sum_{n=1}^{N}{(x_n-\mu_{ML})^2}$

In [3]:
mu_mle = np.mean(X)
sigma_mle = np.std(X)

print(mu_mle, sigma_mle)

114.00783796154118 0.5118032889036019


- 最大后验估计

    假设$\sigma^2$已知，考虑从$N$个观测量中推断均值$\mu$。

    对于一个特定的$\mu$，其观测数据的概率的似然函数应当为：

    $p(X|\mu) = \displaystyle\prod_{n=1}^{N}{p(x_n|\mu)}
    = \frac{1}{(2\pi\sigma^2)^{N/2}} e^{ -\frac{1}{2\sigma^2} \displaystyle\sum_{n=1}^{N}{(x_n-\mu)^2}}$。

    首先，选择先验分布$p(\mu) = \mathcal{N}(\mu|\mu_0, \sigma_0^2)$。

    那么，考虑到后验分布满足$p(\mu|X) \propto p(X|\mu)p(\mu)$。

    因此，可以推导出后验分布为$p(\mu|X) = \mathcal{N}(\mu|\mu_N, \sigma_N^2)$

    其中，

    $\mu_N = \frac{\sigma^2}{N\sigma_0^2 + \sigma^2} \mu_0 + \frac{N\sigma_0^2}{N\sigma_0^2 + \sigma^2}\mu_{ML}$

    $\frac{1}{\sigma_N^2} = \frac{1}{\sigma_0^2} + \frac{N}{\sigma^2}$

In [4]:
mu_0, sigma_0 = 0, 1

v, v_0 = sigma**2, sigma_0 **2
mu_map = v / (size*v_0 + v) * mu_0 + size * v_0 / (size * v_0 + v) * mu_mle

print(mu_map)

114.0048259996402
