# Bayes-Faktor für Münzwurf

Wir haben eine Münze, von der wir wissen, dass sie nicht fair ist, aber nicht, ob sie zu viele $ K $ oder zu viele $ Z $ zeigt.  Wir versuchen es einmal mit den beiden Prior-Verteilungen $ \text{Beta}(\theta | a=4, b=8) $ und $ \text{Beta}(\theta | a=8, b=4) $.

Die Münze wird 30 mal geworfen und wir erhalten 9 $ K $. Somit passt die erste Prior-Verteilung sicher besser zu den Daten. 

Wir wollen nun überprüfen, ob dies mit dem Bayes-Faktor auch zum Ausdruck kommt.  

In [13]:
%matplotlib inline
import pymc as pm
import matplotlib.pyplot as plt
import scipy.stats as st
import arviz as az
import metropolis_commands as mc
import numpy as np
import warnings
warnings.filterwarnings("ignore")
plt.rcParams['figure.figsize'] = [10, 3]

In [14]:
trials = 30
head = 9 

data = np.zeros(trials)
data[np.arange(head)]  = 1
y_d = data

alpha_1 = 4
beta_1 = 8

alpha_2 = 8
beta_2 = 4

with pm.Model() as model_BF_0:
   θ = pm.Beta('θ', alpha_1, beta_1)
   y = pm.Bernoulli('y', θ, observed=y_d)
   trace_smc_0 = pm.sample_smc(chains=2)

with pm.Model() as model_BF_1:
   θ = pm.Beta('θ', alpha_2, beta_2)
   y = pm.Bernoulli('y', θ, observed=y_d)
   trace_smc_1 = pm.sample_smc(chains=2)

Initializing SMC sampler...
Sampling 2 chains in 2 jobs


We recommend running at least 4 chains for robust computation of convergence diagnostics
Initializing SMC sampler...
Sampling 2 chains in 2 jobs


We recommend running at least 4 chains for robust computation of convergence diagnostics


In [12]:
BF_smc = np.exp(trace_smc_0.sample_stats["log_marginal_likelihood"].mean() - trace_smc_1.sample_stats["log_marginal_likelihood"].mean())
print(np.round(BF_smc.item(),2))

11.16


Der Bayes-Faktor ist etwa 11 (es wurden 2 Simulationen (chains)  erzeugt). Der BF is somit grösser als 3, woraus wir schliessen, dass die erste Prior-Verteilung besser zu den Daten passt, was hier keine \"Uberraschung ist. 


- Wir verwenden `pm.sample_smc()` anstatt `pm.sample()`.
- Per default werden 8 Simulationen durchgeführt. Mit der Option `chains=...` kann dies geändert werden.
- `pymc` kennt nur die log-Marginal-Verteilung, da diese bessere numerische Eigenschaften hat.


In [15]:
trials = 30
head = 14 

data = np.zeros(trials)
data[np.arange(head)]  = 1
y_d = data

with pm.Model() as model_BF_0:
   θ = pm.Beta('θ', 10, 10)
   y = pm.Bernoulli('y', θ, observed=y_d)
   trace_BF_0 = pm.sample_smc(chains=2)

with pm.Model() as model_BF_1:
   θ = pm.Beta('θ', 200, 200)
   y = pm.Bernoulli('y', θ, observed=y_d)
   trace_BF_1 = pm.sample_smc(chains=2)

Initializing SMC sampler...
Sampling 2 chains in 2 jobs


We recommend running at least 4 chains for robust computation of convergence diagnostics
Initializing SMC sampler...
Sampling 2 chains in 2 jobs


We recommend running at least 4 chains for robust computation of convergence diagnostics


In [16]:
BF_smc = np.exp(trace_smc_0.sample_stats["log_marginal_likelihood"].mean() - trace_smc_1.sample_stats["log_marginal_likelihood"].mean())
print(np.round(BF_smc.item(),2))

11.21
