# Métodos Montecarlo Fing 2022 - Entrega 3 

**Autor**: Carlos M. Martinez, marzo-abril 2022. 

**Email**: carlosm@fing.edu.uy, carlos@cagnazzo.uy

## Ejercicio 6.1

se idealiza una montaña como un cono inscrito en una region cuadrada de lado 1 km. La base de la montaña es circular, con centro en (0.5, 0.5) y radio r = 0.4km, y la altura es H = 8km. La altura de cada punto (x, y) de la montaña está dada por la función:

f (x, y) = H − H/r × sqrt((x − 0.5)2 + (y − 0.5)2), en la zona definida por el círculo, y 0 fuera del círculo.

El volumen total de la montaña (en km cúbicos) puede verse como la integral de la función altura en la región.

**Parte a:**

Escribir un programa para calcular el volúmen por Monte Carlo. Realizar 10^6 replicaciones y estimar el valor de ζ y el error cometido (con nivel de confianza 0.95), utilizando como criterio la aproximación normal.

In [4]:
import random
import math
import tabulate
import time
from IPython.core.display import HTML
random.seed()

import cm2c.fing.mmc.integral as mmci
import cm2c.fing.mmc.utils as mmcutils
reloj_ppal = mmcutils.timeit()
mmci.version()

'Integracion MMC v0.1.2 - Carlos Martinez abril 2022'

In [5]:
# Validacion: integro f(x) = x**2 en (0,1)

import math

r = mmci.integracionMonteCarlo(lambda x: x[0]**2, 1, 10**5, lambda x: random.uniform(0,1))

print("El resultado debe aproximarse a 1/3: ", r[0])

El resultado debe aproximarse a 1/3:  0.3332985227530386


Ahora, para resolver el problema del volumen de la montaña defino una función en R2 que me devuelva la altura de la montaña abstracta:

In [7]:
H = 8.0 # altura en km
r = 0.4 # radio de la base en km
n = 10**6 # cantidad de muestras para la parte (a)
delta = 0.05

import math

def Montana(x):
    """
    x es un vector de dos elementos
    devuelve la altura estimada
    """
    
    # calculo distancia al centro
    d = math.sqrt( (x[0]-0.5)**2 + (x[1]-0.5)**2 )
    
    if d > 0.4:
        return 0.0
    else:
        return H - (H/r)*d
## end def Montana

(estimZ, estimV, _, _) = mmci.integracionMonteCarlo(Montana, 2, n, mmcutils.sortearPuntoRN)

(icn0, icn1) = mmci.intConfianzaAproxNormal(estimZ, estimV, n, delta)

epsilon_est = estimZ-icn0

print(" ")
print("Volumen estimado por MMC {:.5f} km3".format(estimZ))
print("Varianza estimada : {:.5e}".format(estimV))
print("Intervalo de confianza para delta {} : ({:.5f}, {:.5f}) ".format(delta, icn0, icn1))
print("Error estimado: {:.5e}".format(epsilon_est))

 
Volumen estimado por MMC 1.33848 km3
Varianza estimada : 3.55871e-06
Intervalo de confianza para delta 0.05 : (1.33478, 1.34218) 
Error estimado: 3.69738e-03


**Parte b:**

En base al valor estimado en la parte a, calcular el número de
replicaciones necesario para obtener un error absoluto menor a 10^-3
(con nivel de confianza 0.95).

- Paso 1: Realizar un número n' de pruebas preliminares y estimar la varianza.
  
  En este caso ya tenemos una estimación para n' = 10^6

In [None]:
print("Volumen estimado por MMC {:.5f} km3".format(estimZ))
print("Varianza estimada : {:.5e}".format(estimV))

Volumen estimado por MMC 1.34109 km3
Varianza estimada : 3.56573e-06


- Paso 2

  Calcular el tamaño de la muestra requerido según la aproximación normal, el cual se define por:
  
  ```npuntoN(epsilon, delta) = norm.ppf(1-delta/2)**2 * estimV / (epsilon**2)```

In [None]:
from scipy.stats import norm

def npuntoN(delta_, epsilon_, estimV_, n_):
    return (norm.ppf(1-delta_/2)**2)*estimV_*n_/(epsilon_**2)

npuntoN_est = math.ceil ( npuntoN(0.05, 0.001, estimV, n) )

print(f'{estimV} , {n}')
print(f'{npuntoN_est:,}')

3.56573492794628e-06 , 1000000
13,697,624


- Paso 3

  Repetir las simulaciones con N > npuntoN_estimado, asegurando que las semillas son diferentes (para garantizar la independencia de los experimentos)

In [None]:
# tryN = [ 14*10**6, 16*10**6, 20*10**6, 30*10**6]
tryN = [ 14*10**4, 16*10**4, 20*10**4, 30*10**4]

table1 = [ ['N', 'Volumen est. MMC', 'Varianza est.', 'Int. Confianza', 'Error est.', 'Tiempo ejecución'] ]

reloj = mmcutils.timeit()

for n in tryN:
    (estimZ, estimV, _, _) = mmci.integracionMonteCarloParalelo(Montana, 2, n, 8)
    (icn0, icn1) = mmci.intConfianzaAproxNormal(estimZ, estimV, n, delta)
    epsilon_est = estimZ-icn0
    table1.append([f'{n:,}', f'{estimZ:.5f}', f'{estimV:.5e}', f'({icn0:.5f}, {icn1:.5f})', f'{epsilon_est:.5e}', f'{reloj.lap():.3f}'])


In [None]:
tabulate.tabulate(table1, tablefmt='html')

0,1,2,3,4,5
N,Volumen est. MMC,Varianza est.,Int. Confianza,Error est.,Tiempo ejecución
140000,1.33430,2.54087e-05,"(1.32442, 1.34418)",9.87960e-03,0.184
160000,1.34069,2.23490e-05,"(1.33143, 1.34996)",9.26568e-03,0.057
200000,1.34869,1.79430e-05,"(1.34039, 1.35700)",8.30224e-03,0.072
300000,1.34627,1.19661e-05,"(1.33949, 1.35305)",6.77990e-03,0.089


**Conclusión** La formula de estimación de cantidad de muestras nos da una referencia, en este caso unos 13.6x10^6 muestras. Probando con cantidades de muestras levemente mayores ya logramos bajar el error de 10^-3 que era lo pedido. 

## Ejercicio 6.2

#### Problema: 
Se desea estimar la integral de la función ```F5(X) = x1*x2^2*x3^3*x4^4*x5^5``` sobre el
hipercubo J^m de dimensión m = 5.

**Parte a:**

Revisar los códigos preparados para el ejercicio 6.1, elegir uno
de ellos como punto de partida.

Sobre esa base, modificarlo para realizar cálculo por Monte Carlo de la integral planteada en el ejercicio
6.2. Realizar 10^6 replicaciones y estimar el valor de ζ. Calcular analíticamente el valor exacto de la integral.

In [None]:
# Definimos la función

def F5(x):
    """
    x es un vector en R^5
    """
    return x[0] * (x[1]**2) *  (x[2]**3) * (x[3]**4) * (x[4]**5)
# end def

# Calculo la integral con 10^6 replicas
n = 10**6

(estimZ, estimV, _, _) = mmci.integracionMonteCarlo(F5, 5, n)

HTML(f'<h4>estimZ: {estimZ:.7f} - estimV: {estimV:.5e}</h4>')


Cálculo analítico de la integral de la función F5 en J^5:

![Calculo analítico de la integral de F5](integral_analitica.gif "Cálculo analítico del valor de la integral en J^5 de F5")

**Parte b:**

En base al valor estimado en la parte a, calcular el número de
replicaciones necesario para obtener un error menor a 10−4 (con nivel
de confianza 0.95).

In [None]:
npuntoN_est = math.ceil ( npuntoN(0.05, 0.0001, estimV, n) )

print(f'Estimación de cantidad de muestras: {npuntoN_est:,}')

Estimación de cantidad de muestras: 37,176


**Parte c:**

Decimos que un intervalo de confianza cubre el valor exacto
cuando este último pertenece al intervalo.

Realizar L = 500 experimentos con semillas diferentes, cada uno
consistente en estimar por Monte Carlo con el nro. de replicaciones de
la parte b el valor de la integral, así como intervalos de confianza de
nivel 0.9, 0.95 y 0.99.

Para cada nivel de confianza, calcular el nivel de
cobertura empírico (en que porcentaje de los 500 experimentos el
intervalo de confianza calculado cubrió el valor exacto).

Discutir los resultados, comparando la cobertura empírica con la
especificada.

In [None]:
table2 = [ ['L', 'n', '1-delta', '% Experimentos exitosos', 'Tiempo ejecución'] ]
L = 500
delta = 0.10
ZAnalitico = 1.0/720.0
npuntoN_est = math.ceil ( npuntoN(delta, 0.0001, estimV, n) )
reloj = mmcutils.timeit()

def Lexperimentos():
    cobertura = []
    for j in range(0,L):
        random.seed()
        (estimZ_, estimV_, _, _) = mmci.integracionMonteCarloParalelo(F5, 5, npuntoN_est, 8)
        (icn0, icn1) = mmci.intConfianzaAproxNormal(estimZ_, estimV_, npuntoN_est, delta)
        epsilon = ZAnalitico-icn0
        if ZAnalitico>=icn0 and ZAnalitico<=icn1:
            cobertura.append(1)
        else:
            cobertura.append(0)
    # end for
    # La cantidad de unos en el array cobertura es la cantidad de experimentos donde el valor analitico esta contenido
    # en el intervalo de confianza
    exitos = cobertura.count(1)

    table2.append( [L, f'{npuntoN_est:,}', f'{1-delta:.2f}', f'{exitos/L*100:.2f}%', f'{reloj.lap():.3f}' ] )
# end def

Lexperimentos()
print(reloj.lap())


7.439999899361283e-05


In [None]:
delta = 0.05
npuntoN_est = math.ceil ( npuntoN(delta, 0.0001, estimV, n) )
Lexperimentos()

In [None]:
delta = 0.01
npuntoN_est = math.ceil ( npuntoN(delta, 0.0001, estimV, n) )
Lexperimentos()

In [None]:
tabulate.tabulate(table2, tablefmt='html')

0,1,2,3,4
L,n,1-delta,% Experimentos exitosos,Tiempo ejecución
500,26183,0.90,90.00%,7.983
500,37176,0.95,93.80%,10.405
500,64209,0.99,99.00%,16.359


**Discusión de los resultados de cobertura**

Me resulta interesante ver de que la cantidad de muestras que obtenemos de la formula basada en la normal partiendo de la estimación de la varianza obtenida para 10^6 muestras es significativamente más pequeña que 10^6 (del orden de 3.6 * 10^4).

Cuando realizamos los L=500 experimentos partiendo de estas cantidades de muestras calculadas de esta forma (bastante más pequeñas) obtenemos porcentajes de cobertura que parecen bastante buenos.

Al disminuir el tamaño del intervalo de confianza, naturalmente la cantidad de muestras crece. Es interesante ver también que el porcentaje de experimentos exitosos también crece.


## Datos adicionales y referencias

### Información acerca del software y hardware utilizados

**Software:**
 - Python 3.8.10 corriendo en Windows WSL2 (Windows Subsystem for Linux)
 - Jupyter Notebook 
 
**Librerias:** 
 - scipy norm
 - pathos multiprocessing (para parelilizar ejecuciones)
 
**Hardware:**

 - PC Windows 11, con WSL2
 - CPU Intel Core i5 10400F (6 cores)
 - 16 GB de RAM

In [None]:
print(f"%% FIN - tiempo total de ejecución {reloj_ppal.lap():.3f}s")

%% FIN - tiempo total de ejecución 38.740s


## Código de las funciones desarrolladas

Adjunto en el archivo _"integral.py.pdf"_.