Un cercetător măsoară nivelul de zgomot ambiental în diferite locaţii dintr-un oraş. El suspectează că nivelul de zgomot, notat $X$, urmează o distribuţie normală, dar atât media $\mu$, cât şi deviaţia standard $\sigma$ sunt necunoscute.
Cercetătorul are 10 observaţii ale nivelului de zgomot (în decibeli, dB):
$56, 60, 58, 55, 57, 59, 61, 56, 58, 60$.
Scopul este să folosim inferenţa Bayesiană pentru a estima pe $\mu$ şi pe $\sigma$.
a) Definiţi un model în PyMC pentru această problemă. Puteţi alege ca distribuţii a priori $\mu ∼ \mathcal{N} (𝑥, 10^2)$ şi $\sigma ∼ \text{HalfNormal}(10)$. Cât ar trebui să fie 𝑥?

In [23]:
import pymc
import numpy as np
import arviz as az

observatii = np.array([56, 60, 58, 55, 57, 59, 61, 56, 58, 60])
x = observatii.mean()

with pymc.Model() as model:
    mu = pymc.Normal("mu", mu=x, sigma=10)
    sigma = pymc.HalfNormal("sigma", sigma=10)
    
    X_obs = pymc.Normal("X_obs", mu=mu, sigma=sigma, observed=observatii)
    sample = pymc.sample()

sample

Auto-assigning NUTS sampler...
Initializing NUTS using jitter+adapt_diag...
Multiprocess sampling (4 chains in 4 jobs)
NUTS: [mu, sigma]


Output()

Sampling 4 chains for 1_000 tune and 1_000 draw iterations (4_000 + 4_000 draws total) took 60 seconds.


b) Inferaţi asupra lui 𝜇 şi 𝜎. Care este intervalul de încredere (HDI 95%) pentru 𝜇 şi 𝜎?

In [24]:
mu_hdi = az.hdi(sample, hdi_prob=0.95)

print(mu_hdi)

<xarray.Dataset> Size: 80B
Dimensions:  (hdi: 2)
Coordinates:
  * hdi      (hdi) <U6 48B 'lower' 'higher'
Data variables:
    mu       (hdi) float64 16B 56.61 59.53
    sigma    (hdi) float64 16B 1.317 3.663
