#Teorema de Bayes para estimación de parámetros



Se tiene una moneda para la cual no se conoce la probabilidad $p$ de que salga cara. A priori podemos considerar a $p$ como una variable aleatoria que toma valores entre $0$ y $1$, con una distribución $P(p)$.  Por ejemplo, si no tenemos ninguna expectativa sobre el valor de $p$, $P(p)$ podría ser una distribución uniforme.

Realizamos $M$ tiradas de la moneda y obtenemos $C$ caras y $M-C$ cecas. Queremos actualizar nuestras expectativas sobre el valor de $p$ usando esos datos y el teorema de Bayes
$$
P(p | \mathcal{D}) = \frac{P(\mathcal{D} | p) P(p)}{P(\mathcal{D})}
$$

donde $P(p|\mathcal{D})$ es la distribución de $p$ actualizada por el resultado de las tiradas $\mathcal{D}$ y $P(\mathcal{D}|p)$ es la probabilidad del resultado $\mathcal{D}$ dado un valor de $p$. Aunque no conocemos $P(\mathcal{D})$, podemos tomar su valor de manera de que $P(p|\mathcal{D})$ quede normalizada.

- Seleccionar para $p$ la distribución beta:
$$
   P(p)=\text{Beta}(p; \alpha, \beta) = \frac{p^{\alpha-1} (1-p)^{\beta-1}}{B(\alpha, \beta)}
$$
donde $B(\alpha,\beta)$ es una normalización que se puede escribir en términos de la función gama: $B(\alpha,\beta)=\frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}$.

- Demostrar que la distribución de $p$ actualizada por la medición es una distribución $\text{Beta}(p;\alpha+C, \beta + M-C )$.

- Comenzar con una distribución beta para $p$ (por ejemplo uniforme $\alpha=\beta=1$) y analizar cómo se modifica al incorporar el resultado de 20 tiradas de una moneda.

- Explorar diferentes elecciones de $\alpha$ y $\beta$ para la distribución inicial esperada.

### Analizo como se modifica la distribución para 20 tiradas

In [7]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import beta
from math import gamma

# parámetros iniciales
alfa_inicial = 1.0
beta_inicial = 1.0

# Resultados de las tiradas
Caras = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
labels = ["0 caras","1 cara","2 caras","3 caras","4 caras","5 caras","6 caras","7 caras","8 caras","9 caras","10 caras","11 caras","12 caras","13 caras","14 caras","15 caras","16 caras","17 caras","18 caras","19 caras","20 caras"]
Cecas = [20,19,18,17,16,15,14,13,12,11,10,9,8,7,6,5,4,3,2,1,0]

def betadistribution(p,alfa_inicial,beta_inicial):
    B=np.array(gamma(alfa_inicial)*gamma(beta_inicial)/gamma(alfa_inicial+beta_inicial))
    return p**(alfa_inicial-1)*(1-p)**(beta_inicial-1)/B

p = np.linspace(0, 1, 100)

plt.plot(p,betadistribution(p,alfa_inicial,beta_inicial), label="Incial")

for i in range(21):
    new_alfa=alfa_inicial+Caras[i]
    new_beta=beta_inicial+Cecas[i]
    plt.plot(p,beta.pdf(p,new_alfa,new_beta, loc=0, scale=1), label=labels[i])

plt.title(r'Distribución de probabilidad de $p$ al conocer el resultado de 20 tiradas de la moneda', fontsize=16)
plt.xlabel('p', fontsize=16)
plt.ylabel(r'$P(p|\mathcal{D})$', fontsize=16)
plt.legend(fontsize=16, bbox_to_anchor=(1, 1), loc='upper left')
plt.grid(True)
plt.xticks(fontsize=14)
plt.yticks(fontsize=14)

plt.show()


### Analizo diferentes alfas y betas inciales

In [6]:
# Resultados de las tiradas
Caras = [2,10,15]
labels = ["2 caras","10 caras","15 caras"]
Cecas = [18,10,5]
# parámetros iniciales
alfa = [1,1.5,2,2.5,3,3.5,4,4.5]
beta = 2
fig, axes = plt.subplots(nrows=2, ncols=len(Caras), figsize=(16, 16), sharex=True, sharey=True, gridspec_kw={'hspace': 0.1, 'wspace': 0.1})

# Primer bucle para la primera fila
for j in range(len(Caras)):
    ax1 = axes[0, j]  # Usar el subplot de la primera fila
    for i in range(len(alfa)):
        ax1.set_title(labels[j], fontsize=20)
        ax1.plot(p, betadistribution(p, alfa[i], beta), label=f'Alfa = {alfa[i]}')
        #ax1.set_xticklabels([])
    ax1.grid(True)
    if j == 0:
        ax1.set_ylabel(r'$P(p|\mathcal{D})$', fontsize=14)
    if j == len(Caras) - 1:
        ax1.legend(bbox_to_anchor=(1, 1), loc="upper left", fontsize=14)

# Segundo bucle para la segunda fila
for j in range(len(Caras)):
    ax2 = axes[1, j]  # Usar el subplot de la segunda fila
    for i in range(len(alfa)):
        new_alfa = alfa[i] + Caras[j]
        new_beta = beta + Cecas[j]
        ax2.plot(p, betadistribution(p, new_alfa, new_beta), label=f'Alfa = {alfa[i]}')
    ax2.set_xticks([0, 0.2, 0.4, 0.6, 0.8, 1])
    ax2.set_xlabel('$p$', fontsize=14)
    ax2.grid(True)
    if j == 0:
        ax2.set_ylabel(r'$P(p|\mathcal{D})$', fontsize=14)
    if j == len(Caras) - 1:
        ax2.legend(bbox_to_anchor=(1, 1), loc="upper left", fontsize=14)
    if i == 0:
        ax2.set_xlabel('$p$', fontsize=14)
    

plt.show()
