# 4.5.1 Ejemplo: estimación MAP para la Bernoulli

**Ejemplo de la moneda:** $\;\hat{\theta}_{\text{mle}}=1$ si solo observamos caras, por lo que necesitamos penalizar valores extremos de $\theta\in[0,1]$

**Prior:** $\;p(\theta)=\operatorname*{Beta}(\theta\mid a,b)\,$ con $\,a,b>1\,$ para favorecer que $\,\theta\,$ se aproxime a $\,a/(a+b)$

**NLL penalizada con neg-log prior y $\lambda=1$:** $\quad\mathcal{D}=\{y_1,\ldots,y_N\},\quad p(y_n\mid\theta)=\operatorname{Ber}(y\mid\theta)$
$$\begin{align*}
\mathcal{L}(\theta)&=-\log\prod_{n=1}^N p(y_n\mid\theta)-\log p(\theta)\\%
&=-\log\prod_{n=1}^N \theta^{\mathbb{I}(y_n=1)}(1-\theta)^{\mathbb{I}(y_n=0)}-\log\left[\frac{1}{B(a,b)}\theta^{a-1}(1-\theta)^{b-1}\right]\\
&=-[N_1\log\theta+N_0\log(1-\theta)]-[(a-1)\log(\theta)+(b-1)\log(1-\theta)]+\operatorname{const}
\end{align*}$$

**Derivada de la NLL penalizada:**
$$\frac{d}{d\theta}\operatorname{NLL}(\theta)=\frac{-N_1}{\theta}+\frac{N_0}{1-\theta}-\frac{a-1}{\theta}+\frac{b-1}{1-\theta}$$

**Estimación MAP:**
$$\hat{\boldsymbol{\theta}}_{\text{map}}=\frac{N_1+a-1}{N_1+N_0+a+b-2}$$

**Suavizado add-one:** $\;$ tomando $\,a=b=2$
$$\hat{\boldsymbol{\theta}}_{\text{map}}=\frac{N_1+1}{N_1+N_0+2}$$

**Ejemplo:** $\;$ MLE y MAP (add-one) de $\,\theta\,$ con $\,N=3\,$ datos iid según una $\,\operatorname{Ber}(y\mid\theta=0.20)$

In [1]:
import numpy as np; from scipy.stats import bernoulli
t, N = 0.20, 3; Y = bernoulli(t).rvs(N); print(f'Y = {Y}')
mle = Y.mean(); print(f'mle = {mle:.2f}')
a = b = 2; N1 = np.count_nonzero(Y); N0 = N - N1
map = (N1+a-1)/(N+a+b-2); print(f'map = {map:.2f}')

Y = [0 0 1]
mle = 0.33
map = 0.40
