In [None]:
import holoviews as hv
hv.extension('bokeh')

In [None]:
import numpy as np
import scipy.stats

# Método de Monte Carlo

## Introducción

Los métodos de Monte Carlo son una clase de métodos para resolver problemas matemáticos **usando muestras aleatorias** (o más bien pseudoaleatorias)

Los métodos de Monte Carlo se usan para predecir el comportamiento de un sistema en un escenario incierto (aleatorio). Por ejemplo en la siguiente figura se predice el **valor esperado** del Producto Interno Bruto (PIB, GDP en inglés) per capita a un cierto horizonte de tiempo.

:::{note}

Note como el método predice una distribución de futuros posibles

:::

<img src="images/montecarlo1.png" width="500">

Los métodos de Monte Carlo también pueden usarse en casos completamente determinísticos. Por ejemplo en el problema de [estimación de iluminación](https://en.wikipedia.org/wiki/Global_illumination), la solución analítica puede resultar infactible de calcular. 

En lugar de eso se puede aproximar usando una [muestra aleatoria de rayos](https://en.wikipedia.org/wiki/Path_tracing) lanzados desde la fuente de iluminación como muestre la siguiente figura. Si lanzamos "suficientes" rayos al azar entonces podemos modelar con bastante exactitud la iluminación real

<img src="images/montecarlo2.png" width="400">

## Breve historia de los métodos de Monte Carlo

En los años 40s [Stanislaw Ulam](https://en.wikipedia.org/wiki/Stanislaw_Ulam), matemático polaco-américano, estaba en cama recuperandose de una enfermedad y pasaba el tiempo jugando solitario. Empezó a interesarse en calcular la probabilidad de ganar el juego de solitario. Trató de desarrollar las combinatorias sin éxito, pues era demasiado complicado.

Luego pensó

> Supongamos que juego muchas manos, cuento las veces que gano y divido por la cantidad de manos jugadas

Sin embargo el había jugado muchas manos sin ganar. Posiblemente le tomaría años hacer este conteo.

Ulam pensó entonces en simular el juego usando un computador, por lo que recurrió a [John von Neumann](https://en.wikipedia.org/wiki/John_von_Neumann), quien implementó el algoritmo propuesto por Ulam en el [ENIAC](https://en.wikipedia.org/wiki/ENIAC).

Más adelante este algoritmo fue central en las simulaciones realizadas en el [proyecto Manhattan](https://es.wikipedia.org/wiki/Proyecto_Manhattan). En aquel entonces [Nicholas Metropolis](https://en.wikipedia.org/wiki/Nicholas_Metropolis), colega de von Neumann y Ulam sugirió el nombre de Monte Carlo, haciendo alusión al famoso [casino de Monte Carlo](https://es.wikipedia.org/wiki/Casino_de_Montecarlo) que se encuentra en principado de Monaco en Europa.


## Esquema general  de un método de Monte Carlo

El método de Monte Carlo es bastante sencillo y puede resumirse en los tres pasos siguientes. 

Sea una variable aleatoria $X$ con distribución $f(x)$ y una función $g(x)$

1. Se muestrean $N$ valores de la distribución de $X$: $x_i \sim f(x), i=1,\ldots, N$
1. Se calcula una "cantidad de interés" en base a los valores muestreados: $y_i = g(x_i), i=1,\ldots,N$
1. Se reduce el resultando usando estadísticos, por ejemplo el promedio de la variable de salida $\bar y$ o la desviación estándar de la variable de salida $\sigma_y$

La cantidad de interés (variable de salida) es también una variable aleatoria. Es conveniente que las variables de entrada sigan una distribución sencilla (e.g. uniforme o normal estándar)

A continuación veremos una aplicación particular del método de Monte Carlo

## Integración por Monte Carlo

El valor esperado de una función $g(x)$ se define como

$$
\mathbb{E}[g] = \int g(x) f(x) \,dx
$$

donde $f(x)$ es la densidad de probabilidad de $x$.

Si la función y/o la integral son muy complicadas de calcular analíticamente podemos en lugar de eso realizar una "Integración por Monte Carlo"

El algoritmo es

1. Muestrar aleatoriamente $N$ valores $x_i \sim f(x)$
1. Evaluar $y_i = g(x_i)$
1. aproximar el valor esperado como 

$$
\mathbb{E}[g]  \approx \frac{V}{N} \sum_{i=1}^N y_i
$$

donde $V = \int f(x) \,dx$ es el volumen de integración.

A continuación veremos en acción este método con un ejemplo

## Calculando el valor de $\pi$ usando integración por Monte Carlo

El área es la integral de la función en su dominio

- La fórmula analítica del área de un cuadrado de lado $a$ es $A_{cuadrado}=a^2$
- La fórmula analítica del área de un circulo de radio $a$ es $A_{circulo}=\pi a^2$

Por lo tanto podemos estimar el valor de $\pi$ como el cociente entre las dos áreas

$$
\pi = \frac{A_{circulo}}{A_{cuadrado}}
$$ 

En este ejemplo estimaremos el área del circulo utilizando integración por Monte Carlo. Para esto generaremos $N$ muestras aleatorias en un cuadrado unitario y luego dividiremos las que están "adentro del circulo" por el total.

In [None]:
np.random.seed(12345)

def g(x: np.ndarray) -> bool:
    """
    Verificar si la coordenada pertenece o no al círculo
    """
    return (x[:, 0] - 0)**2 + (x[:, 1] - 0)**2 - 1. <= 0.


N = 100_000
x = np.random.rand(N, 2) # Nota: El volumen de integración es 1

print(4*np.sum(g(x))/N) 

No es exactamente $\pi$ pero se aproxima bastante

:::{note}

La multiplicación por cuatro se debe a que estamos considerando un cuarto del circulo.

:::

La siguiente figura muestra graficamente el área de simulación (cuadrado) y las muestras simuladas (puntos negros). 

In [None]:
x_plot = np.linspace(0, 1, num=1000)
X1, X2 = np.meshgrid(x_plot, x_plot)
X = np.stack((X1.ravel(), X2.ravel())).T
circle = hv.Image((x_plot, x_plot, g(X).reshape(len(x_plot), len(x_plot))), 
                  kdims=['x[:, 0]', 'x[:, 1]']).opts(cmap='Set1', width=320, height=300)
dots = hv.Points((x[:, 0], x[:, 1])).opts(color='k', size=0.1)
hv.Overlay([circle, dots])

En este momento es interesante preguntar

> ¿Cómo cambia el resultado si utilizo más o menos muestras aleatorias?

El siguiente gráfico muestra la estimación por Monte Carlo de $\pi$ en función de $N$ (línea azul). La línea roja tenue marca el valor real de $\pi$. 

In [None]:
np.random.seed(12345)
logN = np.arange(0, 7, step=0.1)
pi = np.zeros_like(logN)

for i, logn in enumerate(logN):
    x = np.random.rand(int(10**logn), 2)
    pi[i] = 4.*np.mean(g(x)) 

In [None]:
plot_estimation = hv.Curve((logN, pi), 'logaritmo de N', 'Estimación de PI').opts(width=500)
plot_real = hv.HLine(np.pi).opts(alpha=0.25, color='r', line_width=4)
(plot_estimation * plot_real)

El siguiente gráfica muestra el error absoluto en escala logarítmica en función de $N$

In [None]:
plot_error = hv.Curve((logN, np.abs(pi-np.pi)), 'logaritmo de N', 'Error absoluto').opts(width=500, logy=True)
plot_error

De las figuras podemos notar que

:::{important}

La estimación por Monte Carlo converge al valor real a medida que $N$ aumenta

:::

¿En qué crees que se sustenta este resultado? En una lección futura lo explicaremos en detalle

### Ejercicio formativo: Experimento de lanzar una moneda

¿Cuál es la probabilidad de que el próximo lanzamiento sea cara?

- Si lancé la moneda una vez y salió cara
- Si lancé la moneda dos veces y en ambas salió cara
- Si lancé la moneda 100 veces y en todas salió cara
- Si lancé la moneda 100 veces y en 52 salió cara y 48 sello

¿Cómo es la varianza en cada caso? ¿Qué relación tiene que ver nuestra confianza sobre el resultado?