# Estadística bayesiana con Stan - 01 Modelo Poisson-Gamma

En este notebook se presenta el uso de cmdstanpy para simular muestras de la distribución predictiva de un modelo simple Poisson-Gamma.

$$
y_i \sim Poisson(\lambda), i, i = 1\ldots, n,
$$

$$
 \lambda \sim Gamma(\alpha, \beta),
$$

con $\alpha$ y $\beta$ conocidos.

# Setup

In [None]:
# Cargamos los módulos para el análisis
## Manejo de datos y simulación de variable aleatorias
import numpy as np
import pandas as pd

## Gráficas
import matplotlib.pyplot as plt
import seaborn as sns
import arviz as az

## Simulación bayesiana
from cmdstanpy import CmdStanModel

# Definición del modelo en Stan

El primer paso es definir el modelo en un archivo independiente y guardarlo en con extensión `'.stan'`.

El script contiene 3 partes: `data`, `parameters` y `model`.

```
data {
    int<lower=0> N;                   // Número de observaciones
    array[N] int<lower=0> y;          // Datos de conteo
    real<lower=1e-3> alpha;           // Parámetro de la gamma
    real<lower=1e-3> beta;            // Parámetro de la gamma
}
parameters {
    real<lower=1e-3> lambda;          // Parámetro latente
}
model {
    lambda ~ gamma(alpha, beta);       // Prior
    y ~ poisson(lambda);               // Likelihood
}
```

# Datos

Para este ejemplo, consideremos que el valor verdadero (?) de $\lambda$ es 5. Simulemos $N=150$ valores de una distribución $Poisson(5)$.

En este ejemplo sencillo, vamos a declarar $\alpha$ y $\beta$ para la distriución inicial (prior) de $\lambda$, de manera uqe sea poco informativa.

Al final creamos un diccionario que usaremos como input para ajustar el modelo con Stan.

In [None]:
np.random.seed(42)
N = 150  # Número de observaciones
lambda_real = 5 # lambda verdadero
y_obs = np.random.poisson(lambda_real, N)  # Datos Poisson

alpha, beta = 1, 0.01  # Parámetros de la distribución gamma

# Input del modelo
data = {
    "N": N,
    "y": y_obs.tolist(),
    "alpha": alpha,
    "beta": beta
}

# Compilación del modelo y ajuste (simulación)

Instanciamos el modelo proporcionando la ruta del archivo `.stan`.

In [None]:
model = CmdStanModel(stan_file="poisson_gamma.stan")

fit = model.sample(
    data=data,
    iter_sampling=2000,
    iter_warmup=1000,
    chains=4,
    parallel_chains=4
)

Podemos imprimir un resumen de la simulación y correr un diágnostico de la simulación.

En este caso podemos observar que hubo problemas en la simulación.

In [None]:
print(fit.summary())

print(fit.diagnose())

Finalmente podemos utilizar arviz para 

In [None]:
# Convertir la salida de cmdstanpy a un objeto InferenceData
idata = az.from_cmdstanpy(fit)

az.plot_trace(idata, var_names=["lambda"], figsize=(8,3))
plt.show()

# Graficar el posterior de lambda
az.plot_posterior(idata, var_names=["lambda"], figsize=(5,3))
plt.show()