## EM 算法简介

如果有一个分布密度（质量）函数$p(x;\theta)$，这里的$x={x_i}$为数据，而$\theta$为参数，这时，参数$\theta $的最大似然估计$(MLE)\hat \theta^{MLE}$应该使得对数似然函数$l(x;\theta)=\sum_i log p(x_i;\theta)$最大：
$$
\theta^{MLE}=argmax_{\theta}l(x_i;\theta)=argmax_{\theta}\{{\sum_{i}logp(x_i;\theta)}\}
$$
如果除了已知数据外，还存在一些不可观测的变量$z={z_{j}}$，这时候对数似然函数为：
$$
l(x,z;\theta)=\sum_{i}log\sum_{j}p(x_{i},z_{j};\theta)
$$
这种在对数之后还有和号的情况使得无法通过常用的诸如梯度下降法等优化算法来求最大似然估计。针对这种情况，发明了EM算法，主要步骤为：

**E步骤**：给定当前第n步的$\theta^{(n)}$和数据$x$，求期望值：
$$
Q(\theta;\theta^{(n)})=E[l(x,z;\theta)|x,\theta^{(n)}]=\sum_{j}l(x,z_{j};\theta)p(x,z_{j},\theta)
$$
**M步骤**：寻求$\theta$，把E步骤得到的期望最大化：
$$
\theta^{n+1}=argmax_{\theta}Q(\theta;\theta^{(n)})
$$
然后回到E步骤继续迭代，直到收敛或$n$达到最大限定步数。

## 案例练习

在这里仅考虑两种不公平硬币的投掷数据，比较MLE和EM的结果。

In [7]:
import numpy as np
n = 10000
coin = [1,2,1,2,2,1,1,2,1,2]
heads = [55,20,57,14,13,57,56,10,49,16]

heads = np.array(heads).astype(float)
coin = np.array(coin)

p1MLE = heads[coin==1].sum()/(sum(coin==1)*n)
p2MLE = heads[coin==2].sum()/(sum(coin==2)*n)

print(p1MLE,p2MLE)

# EM 算法
np.random.seed(523)
p1ME = np.random.uniform(0,1,1) # 用均匀分布猜测p1
p2ME = np.random.uniform(0,1,1) # 用均匀分布猜测p2
P1 = 0
P2 = 0

from scipy.stats import binom
while (np.abs(p1ME-P1)>10**-15)&(np.abs(p2ME-P2)>10**-15):
    P1 = p1ME
    P2 = p2ME

    den1 = binom.pmf(heads,n,p1ME)
    den2 = binom.pmf(heads,n,p2ME)

    # E 步骤
    h1 = den1/(den1+den2)*heads
    h2 = den2/(den1+den2)*heads

    t1 = den1/(den1+den2)*(n-heads)
    t2 = den2/(den1+den2)*(n-heads)
    # M 步骤
    p1ME = np.sum(h1)/np.sum((h1,t1))
    p2ME = np.sum(h2)/np.sum((h2,t2))
print(p1MLE,p2MLE)
print(p1ME,p2ME)

0.00548 0.00146
0.00548 0.00146
0.0014599998908460029 0.005479999293084045
