<h1 align='center'> Curso de Estadística Bayesiana<br> Introducción a Stan</h1> 

<h3>Autor</h3>

1. Alvaro Mauricio Montenegro Díaz, ammontenegrod@unal.edu.co
2. Daniel Mauricio Montenegro Reyes, dextronomo@gmail.com 

<h3>Fork</h3>

<h3>Referencias</h3>


1. Gelman, A., Carlin, J., Stern, H., and Rubin, D. *Bayesian Data Analysis*, Chapman & Hall/CRC, 2000


<h2>1. Stan: Help</h2>


1.  User Guide: https://mc-stan.org/users/documentation/
2.  Homepage: http://mc-stan.org
3.  Stan Users group: https://groups.google.com/d/forum/stan-users


<h3>Stanislaw Ulam </h3>


(1909–1984), co-inventor del método de Monte Carlo. [Biografía](https://es.wikipedia.org/wiki/Stanis%C5%82aw_Ulam)

<h2>2. Motivación para Stan y la Programación Probabilística</h2>

1. **Ajustar modelos estadísticos Bayesianos poderosos** 
2. **El Porceso**: *A)Crea un modelo estadistico; B) Corre la inferencia del modelo; C) Evalua;*
3. **Dificultades con las herramientas existentes para abordar los modelos de interés actuales** 
4. **Usabilidad**: *proósito general, Lenguaje de modelamiento claro, integración*
5. **Escalabilidad**: *Complejidad del modelo, número de parámetros, tamaño de los datos*
6. **Eficiencia**: *Tamaños de muestra altamente efectivos, iteraciones rápidas, baja memoria*
7. **Robustez**: *estructura del modelo (por ejemplo goemetría posterior), rutinas numéricas*

<h2>3. ¿Qué es Stan?</h2>

**Lenguaje para especificación de modelos  estadísticos**: 

– high level, probabilistic programming language

– user specifies statistical model

– easy to create statistical models

**Interfaces de usuario para distintas plataformas**: 

- CmdStan - command line
- RStan - Integración con R
- PyStan - Integración con Python
- MStan - Integración con Matlab (user contributed)

<h2>4. Inferencia. Lo que hay en el transfondo de Stan</h2>

**Hamiltonian Monte Carlo (HMC)**

- *La distribución del parámetro es muestreada en un espacio sin restricciones*. La base teórica es el muestreador Monte Carlo Hamiltoniano, que permite escanear el espacio del parámetro de manera mucho más eficiente que lo que hacen los muestreadores clásicos Metrópolis- Hastings o Gibbs y sus derivados.
- *Transformaciones del parámetro*: ajuste automático del Jacobiano aosciado a las  transformaciones.
- *Diferenciación automática*: Gradientes del modelo con respecto a los parámetros usando diferenciación automática.

**No-U-Turn Sampler (NUTS)**

- *Ajuste (tunning)* automático de los parámetros del muestreador. 
- *Calentamiento*: Estimación de la matriz de masa y tamaño del paso del muestreador.
- *Muestreo*: Número adaptativo de pasos.
- *Mantiene el balance detallado*. Que asegura tener cadenas de Mrkov reversibles.

**Optimización: estimación modal**

- Métodos BFGS y Newton.

<h2>5. Stan to científicos y más...</h2>

- Lenguaje probabilístico flexible, el lenguaje sigue creciendo

- Enfoque en la ciencia: el modelado y los supuestos.

- Acceso a múltiples algoritmos (el valor predeterminado es bastante bueno)

- Más rápido y menos propenso a errores que la implementación desde cero

- Implementación eficiente

- Mucha ayuda de modelado (gratis) en la lista de usuarios

- Desarrolladores receptivos, soporte continuo para Stan

- No solo por inferencia

- Muestreo de avance rápido; muchas distribuciones

- Gradientes para funciones arbitrarias

<h2>6. El lenguaje Stan </h2>

**Tipos de datos**

– básicos: real, int, vector, row_vector, matrix

– restringidos: simplex, unit_vector, ordered, positive_ordered, corr_matrix, cov_matrix

- arrays

**Variables acotadas**

- Aplica a datos o parámetros de tipo  int, real, matrix.

- Ejemplo de lower: real<lower=0> sigma;

- Ejemplo de upper: real<upper=100> x;


<h2>7. El lenguaje Stan</h2>

**Bloques de un programa**

- data (opcional)

- transformed data (opcional)

- parameters (opcional)

- transformed parameters (opcional)

- model

- generated quantities (opcional)


<h2> 8. Un primer ejemplo.</h2>

Introducimos un primer ejemplo general. [El desarrollo completo de este ejemplo encontrarlo en este cuaderno](./Stan_Ejemplo_1_eight_schools.ipynb)

<h3> Modelo estadístico</h3>

Supongamos que tenemos observaciones $[y_n |x_n], n=1,\ldots,N$, y asumamos el modelo Bayesiano

$$
\begin{align}
y_n &\sim \mathcal{N}(\alpha + \beta x_n, \sigma^2),\quad n=1,\ldots,N\\
\alpha &\sim \mathcal{N}(0, 100)\\
\beta &\sim \mathcal{N}(0, 100)\\
\sigma &\sim \mathcal{C}auchy(0, 25) 1_{\sigma>0}\\
\end{align}
$$


Discuta con sus compañeros las distribuciones a priori.

<h3> Posible implementación en Stan</h3>

Entonces, el modelo  se escribe es Stan de la siguiente manera (en Stan no debe dar las varianzas sino las desviaciones estándar):

data { <br>
int<lower=0> N;<br>
vector[N] y;<br>
vector[N] x;<br>
}<br>


parameters {<br>
real alpha;<br>
real beta;<br>
real<lower=0> sigma;<br>
}<br>


model {<br>
alpha ~ normal(0,10);<br>
beta ~ normal(0,10);<br>
sigma ~ cauchy(0,5);<br>
for (n in 1:N)<br>
   y[n] ~ normal(alpha + beta * x[n], sigma);<br>
}<br>

El código anterior no corre directamente, porque es necesario pasar a Stan los datos y además usar la interface  desde donde se 'lanza' el código STAN. Para los detalles de implementación [vaya a.](./Stan_Ejemplo_1_eight_schools.ipynb)