<a href="https://colab.research.google.com/github/jugernaut/Prometeo/blob/desarrollo/06_AnalisisNumerico/07_MonteCarlo/01_MonteCarlo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<font color="Teal" face="Comic Sans MS,arial">
  <h1 align="center"><i>Monte Carlo</i></h1>
  </font>
  <font color="Black" face="Comic Sans MS,arial">
  <h5 align="center"><i>Profesora: 	Ursula Xiomara Iturrarán Viveros</i></h5>
    <h5 align="center"><i>Ayudante: Juan Pablo Cordero Santiago</i></h5>
  <h5 align="center"><i>Materia: Análisis Numérico</i></h5>
  </font>

#**Introducción**


Son un conjunto de métodos y técnicas para analizar fenómenos por medio de algoritmos computacionales que dependen fundamentalmente de números aleatorios.

Estos métodos son relativamente nuevos y fueron empleados para el desarrollo de la bomba atómica, en la segunda guerra mundial. Particularmente en este tema fueron empleados para la simulación de problemas probabilísticos de hidrodinámica concernientes a la difusión de neutrones en el material de fisión.

Los pioneros en el desarrollo de estos métodos son John von Neumann y Stanislaw Ulam. Ambos trabajando para el **proyecto Manhattan** emplearon una versión temprana de los métodos de Monte Carlo para realizar simulaciones concernientes al choque de partículas que se lleva a cabo al momento de una reacción nuclear.

Los métodos de Monte Carlo proporcionan aproximaciones a una gran variedad de problemas matemáticos en los cuales llegar a una solución analítica es muy costoso. Son aplicables a cualquier tipo de problema, ya sea estocástico o determinista.

A diferencia de los métodos numéricos que se basan en evaluaciones de $N-puntos$ en un espacio $M-dimensional$ para producir una solución aproximada, los métodos de Monte Carlo tiene un error absoluto con respecto a la aproximación, que decrece conforme N aumenta. Para ser mas exactos decrece a razón de 

$$\frac{1}{\sqrt{N}}$$

En **teoría** todo método de Monte Carlo converge a la solución exacta, en la **práctica** se consigue una precisión modesta.

#**Números aleatorios**

Las computadoras generan números aleatorios muy amenudo, estan presentes desde la seguridad de tu computadora hasta videojuegos. En la computación se tiene dos tipos de números aleatorios, los números aleatorios "verdaderos" y los pseudo aleatorios.

* **Los números aleatorrios "verdaderos"**: Son generados por medio datos externo, más especificamente de la entropia, se pueden generar del movimiento del mouse, hasta por la ventilación de la computadora. 

* **Los números aleatorrios pseudoaleatorios**: Se generan apartir de algortimos para que los resultados parezcan aleatorios.

# **Generar números aletorios**

Cada lenguaje de programación cuentan con maneras de generar números aleatorios desde bibliotecas.

En python la mayoría de los datos aleatorios generados no son completamente aleatorios. Más bien, es pseudoaleatorio : generado con un generador de números pseudoaleatorios (PRNG), que es esencialmente cualquier algoritmo para generar datos aparentemente aleatorios pero aún reproducibles.

Los números aleatorios "verdaderos" pueden ser generados por un generador de números aleatorios verdaderos (TRNG). Un ejemplo es levantar repetidamente un dado del suelo, lanzarlo al aire y dejar que caiga como pueda.

Cuando piensa en números aleatorios en Python se piensa en $random$, esta libreria funiona de la siguiente manera:

Para enteros, hay una selección uniforme de un rango. Para las secuencias, hay una selección uniforme de un elemento aleatorio, una función para generar una permutación aleatoria de una lista en el lugar y una función para el muestreo aleatorio sin reemplazo.

En la línea real, hay funciones para calcular distribuciones uniformes, normales (gaussianas), logarítmicas normales, exponenciales negativas, gamma y beta. Para generar distribuciones de ángulos, está disponible la distribución de von Mises.

Casi todas las funciones del módulo dependen de la función básica $random()$, que genera un flotador aleatorio uniformemente en el rango semiabierto [0.0, 1.0). Python usa Mersenne Twister como generador central. Produce flotantes de precisión de 53 bits y tiene un período de $2^{19937-1}$. La implementación subyacente en C es rápida y segura para subprocesos. El Mersenne Twister es uno de los generadores de números aleatorios más ampliamente probados que existen. Sin embargo, al ser completamente determinista, no es adecuado para todos los propósitos y es completamente inadecuado para fines criptográficos. 

Para los algoritmos empleados dentro de los métodos de Monte Carlo es fundamental emplear una rutina para generar una sucesión números aleatorios uniformemente distribuida en algún rango determinado.

Lo números generados por una computadora no pueden ser verdaderamente aleatorios, por que la forma en la que se producen es totalmente determinista. Sin embargo las sucesiones generadas por rutinas de computadora, pasan ciertas pruebas de aleatoriedad. Es por esto que algunos autores prefieren darle el adjetivo de pseudoaleatorias a estas sucesiones. 

# **# Aproximación de $\pi$**

El ejemplo más usado en Monte Carlo es la aproximación de $\pi$.

La idea básica de esta aproximación es generar pares de números aleatorios dentro de un dominio y calcular la probabilidad de que estos números aleatorios pertenezcan a un subconjunto del dominio.

Ejemplo:


Consideremos la circunferencia unitaria, circunscrita dentro de un cuadrado de lado 2.

Imaginemos nuestra circunferencia como si se jugara dardos, queremos ingresar dardos dentro del circulo donde nos daran puntos, el circulo esta dentro de un cuadro de madera para sostenerlo, los dardos que den al cuadrado fuera de la circunferencia no tiene valor, los lanzamientos lo veremos  **distribuidos de manera uniforme**.

El marco teórico de los métodos de Monte Carlo indica que podemos aproximar el valor de $\pi$ a partir de calcular la probabilidad de que los dardos lanzados caigan dentro de la circunferencia unitaria circunscrita dentro del cuadrado de lado 2. 

De manera tal que $P(x^{2}+y^{2} < 1)$ sera la probabilidad de que los dardos caigan dentro de la circunferencia y para calcular esta probabilidad basta con realizar el siguiente calculo. 

$$P(x^{2}+y^{2} < 1)=\frac{Area\ Circunferencia}{Area\ Cuadrado}$$

Recordando un poco de cálculo.
Para calcular el area de la circunferencia tendremos
$$Area\ Circunferencia = \int_{-1}^{1} dx \int_{-\sqrt{1-x^{2}}}^{\sqrt{1-x^{2}}}dy = 2 \int_{-\sqrt{1-x^{2}}}^{\sqrt{1-x^{2}}}dy = 2\int_{-1}^{1} \sqrt{1-x^{2}}dy =\pi$$
Por otro lado para calcular el área del cuadrado como:
$$Area\ Cuadrado \int_{-1}^{1}dx\int_{-1}^{1}dy=2\int_{-1}^{1}dy = 2(2) =4$$

Por lo tanto:
$$P(x^{2}+y^{2} < 1)=\frac{\pi}{4}$$

Podemos verlo también como

$$ \pi=4*P(x^{2}+y^{2} < 1)$$

Queremos valores aleatorios $(x,y)$ que cumplan $x^{2}+y^{2} < 1$, si escogemos puntos al azar $N$, entonces para tener mejor nuestra aproximación dividimos entre el número de lanzamientos. 

$$\pi\approx\frac{4*P_{dardos}}{N}$$


A mayor numero de lanzamientos (experimentos, muestras, etc.) la aproximación encontrada sera mas cercana al valor real.

##Ejemplo

In [13]:
import matplotlib.pyplot as plt
import numpy as np
from IPython.html.widgets import interact
import ipywidgets as widgets

def mc_pi_aprox(n):
    #Para nuestro circulo
    theta = np.linspace(0, 2*np.pi, 100)
    radius = 1
    a = radius*np.cos(theta)
    b = radius*np.sin(theta)
    # tamano de la imagen
    plt.figure(figsize=(10,10))
    # se generan valores de x,y de manera uniforme
    x, y = np.random.uniform(-1, 1, size=(2, n))
    # interior contiene la cantidad de dardos
    # que calleron en la circunferencia
    interior = (x**2 + y**2) <= 1
    # se calcula el valor aproximado de pi
    pi = interior.sum() * 4 / float(n)
    # se calcula el error abs
    error = abs((pi - np.pi) / pi) * 100
    # dardos que calleron fuera
    exterior = np.invert(interior)
    # seccion de graficas
    figure, axes = plt.subplots(1)
    axes.plot(a, b)
    plt.plot(x[interior], y[interior], 'b.')
    plt.plot(x[exterior], y[exterior], 'r.')
    plt.plot(3, 2, label='$\hat \pi$ = {:4.4f}\nerror = {:4.4f}%'
             .format(pi,error), alpha=0)
    plt.legend(frameon=True, framealpha=0.9, fontsize=16)

interact(mc_pi_aprox,n=widgets.IntSlider(min=0,max=10000,step=1000,value=10))

interactive(children=(IntSlider(value=10, description='n', max=10000, step=1000), Output()), _dom_classes=('wi…

<function __main__.mc_pi_aprox>

# **Teorema fundamental de Monte Carlo**

Consideremos la variable aleatoria $G_{N}$, promedio de una función $g\left(X_{i}\right)$ es decir 

$$G_{N}=\frac{1}{N}\sum_{i=1}^{N}g\left(X_{i}\right) \tag{1}$$

Cuya esperanza y varianza son respectivamente

$$E\left[G_{N}\right]=E\left[g\left(X\right)\right],\quad var\left(G_{N}\right)=\frac{var\left(g\left(X\right)\right)}{N} \tag{2}$$

Al promedio $G_{N}$ se le llama estimador de $E\left[g\left(X\right)\right]$, pues su esperanza vale

$$E\left[G_{N}\right]=E\left[g\left(X\right)\right]=\int_{-\infty}^{\infty}g\left(x\right)f\left(x\right)dx \tag{3}$$

Donde $X_{i}\sim f$. Es decir que podemos evaluar la integral anterior generando un conjunto de $N$ variables aleatorias $X_{i}$ según $f\left(x\right)$ y evaluando $g\left(x\right)$ para cada una de ellas. 

El estimador (1) (la media aritmética de los $g\left(x\right)$ generados) nos da el valor de la integral (3). 

Ademas podemos ver que la varianza del estimador disminuye al crecer $N$. De hecho, aplicando la desigualdad de Chebyshev a la variable aleatoria $G_{N}$ con $\sigma^{2}=var\left(G_{N}\right),\,x^{2}=\frac{\sigma^{2}}{\delta}\,y\,\delta>0$,

$$P\left(\left|G_{N}-E\left[G_{N}\right]\right|\geq\left[\frac{var\left(G_{N}\right)}{\delta}\right]^{\frac{1}{2}}\right)\leq\delta \tag{4}$$

Lo que significa que generando una muestra suficientemente grande $\left(N\gg\frac{1}{\delta}\right)$ la probabilidad de que el estimador se aleje del valor esperado $g\left(X\right)$ es tan pequeña como se desee.


# Integración Numérica mediante Monte Carlo

**Cálculo de áreas y volúmenes**

Una de las principales aplicaciones de los métodos de Monte Carlo es la aproximación de una integral definida. Si seleccionamos los primeros $n$ elementos $x_{1},x_{2},\ldots,x_{n}$ de una sucesión aleatoria en el intervalo $\left(0,1\right)$, entonces,

$$\int_{0}^{1}f\left(x\right)dx\approx\frac{1}{n}\sum_{i=1}^{n}f\left(x_{i}\right)$$

Es decir, que la integral definida se aproxima mediante el promedio de los $n$ números $f\left(x_{1}\right),f\left(x_{2}\right),\ldots,f\left(x_{n}\right)$. Y como ya se menciono previamente, al hacerlo de esta forma, el error de aproximación es de orden $\frac{1}{\sqrt{n}}$, lo cual podría parecer pobre y sin posibilidad de competir con los métodos numéricos tradicionales.

La ventaja de la metodología de Monte Carlo radica en su simplicidad y el que su base es tomar una muestra representativa del comportamiento de un fenómeno $\left(f\left(x\right)\right)$ para poder determinar propiedades del mismo.


Pero al evaluar integrales múltiples, este método cobra gran importancia, por ejemplo

$$\int_{0}^{1}\int_{0}^{1}\int_{0}^{1}f\left(x,y,z\right)dxdydz\approx\frac{1}{n}\sum_{i=1}^{n}f\left(x_{i},y_{i},z_{i}\right)$$

Donde $\left(x_{i},y_{i},z_{i}\right)$ es una sucesión aleatoria de $n$ puntos en el cubo unitario $0\leq x\leq1,\,0\leq y\leq1 \quad$ y $\quad0\leq z\leq1$ 

Si el intervalo (en una integral unidimensional) no es de longitud 1, pero por ejemplo es el caso general $\left(a,b\right)$, entonces el promedio de $f$ en $n$ puntos aleatorios en $\left(a,b\right)$ no es simplemente una aproximación a la integral, en realidad es

$$\frac{1}{b-a}\int_{a}^{b}f\left(x\right)dx \Rightarrow \int_{a}^{b}f\left(x\right)dx\approx\frac{b-a}{n}\sum_{i=1}^{n}f\left(x_{i}\right)$$

Que concuerda con la intención de que la función $f\left(x\right)=1$ tiene un promedio de 1.

Y sucede lo mismo al evaluar integrales múltiples, es decir que el promedio de $f$ se obtiene integrando y dividiendo entre el área. el volumen o una medida de esa región.

De manera general podemos enunciar el método de Monte Carlo para aproximar integrales de la siguiente forma

$$\int_{A}f\approx\left(medida\,de\,A\right)\times\left(promedio\,de\,f\,en\,n\,puntos\,aleatorios\,en\,A\right)$$

En este caso estamos usando el hecho de que el promedio de una función en un conjunto es igual a la integral de la función en el conjunto, dividido entre la media del conjunto.

## Ejemplo

Supongamos que se busca aproximar la integral definida de $f(x)$ de $0$ a $5$, entonces la aproximación mediante Monte Carlo se calcula de la siguiente manera.

$$\int_{0}^{5}f\left(x\right)dx\approx\frac{5}{n}\sum_{i=1}^{n}f\left(x_{i}\times\left(5-0\right)+0\right)$$

Por otro lado, si se busca aproximar la integral doble definida de $2$ a $5$ y de $1$ a $6$, entonces la aproximación esta dada por.

$$\int_{2}^{5}\int_{1}^{6}f\left(x,y\right)dxdy\approx\frac{15}{n}\sum_{i=1}^{n}f\left(x_{i}\times\left(5-2\right)+2,y_{i}\times\left(6-1\right)+1\right)$$

In [14]:
import numpy as np 

'''Integracion numerica de Monte Carlo
f: funcion a integrar
N: numero de valores aleatorios
a,b,c,d: limites de integracion
'''
def MonteCarloDoble(f,N,a,b,c,d):
    # area a integrar
    dim = (b-a)*(d-c)	
    # valores aleatorios para								
    a1 = np.random.uniform(size=N)						
    a2 = np.random.uniform(size=N)
    # version alternativa
    #a1 = np.random.uniform(a,b,size=N)
    #a2 = np.random.uniform(c,d,size=N)
    # acumulador temporal
    temp = 0
    # ciclo para realizar la suma de MC											
    for i in range(N):
        # valores recorridos
        xr = a1[i]*(b-a)+a
        yr = a2[i]*(d-c)+c
        # version alternativa
        #temp += fun(a1[i],a2[i])
        # evaluacion
        temp += f(xr,yr)								
    # aproximacion mediante MC
    return dim*temp/N

integral1 = lambda x,y : x-2*y
integral2 = lambda x,y : (x**2)*y

print(MonteCarloDoble(integral1, 1000, 0, 3, -1, 1))
#print(MonteCarloDoble(integral2, 1000, 0, 3, -1, 1))

9.336368744336571
