# Simulaciones
Se basan en repetir muestras aleatorias para generar multiples resultados.

# Ley de los grandes numeros
La ley de los grandes numeros se basa en eventos estocasticos, de modo que si generas un evento de forma aleatoria a cuantas mas veces se repita el evento el resultado sera mas parecido al de la media matematica(media teorica) del evento.


In [105]:
import random
import statistics

random.seed(43)

dice = [1, 2, 3, 4, 5, 6]

data1 = random.choices(dice, k=100)
data2 = random.choices(dice, k=1000)
data3 = random.choices(dice, k=30000)
data4 = random.choices(dice, k=300000)

print('Matematical mean:', statistics.mean(dice))
print('Simulated data:', statistics.mean(data1), statistics.mean(data2), statistics.mean(data3), statistics.mean(data4))

Matematical mean: 3.5
Simulated data: 3.72 3.417 3.5201333333333333 3.50068


# Ejemplos de simulacion simple
Un ejemplo de simulacion simple es el del juego de los dados, imagina que lanzas dos dados juntos y el objetivo es que los dos dados caigan juntos asi uno puede obtener una victoria en el juego, vamos a jugar 2000 veces.

In [106]:
#@title Juego de los dados
Total = 2000 #@param {type:"integer"}
import random

dice1 = [1, 2, 3, 4, 5, 6]
dice2 = [1, 2, 3, 4, 5, 6]

win = 0

for _ in range(Total):

  if random.choice(dice1) == random.choice(dice2):

    win = win + 1

win_rate = win / Total
print('The win rate is:', win_rate * 100)

The win rate is: 17.4


In [107]:
#@title Juego de loteria - 1
import random

ticket_cost = 10
ticket_num = 1000
prize = 9000

# Probability of winning and lossing
q_winning = 1/ticket_num
p_winning = 1 - q_winning

print('Probability to win:', p_winning, 'Probability to lose:', q_winning)

# Money lost

lost = prize - ticket_cost

# Defining probabilities
gains = [-ticket_cost, lost]
probability = [p_winning, q_winning]

# Defining outcome for just one ticket
outcome = random.choices(gains, weights=probability, k=1)

print("Outcome of one drawing of the lottery is {}".format(outcome))

Probability to win: 0.999 Probability to lose: 0.001
Outcome of one drawing of the lottery is [-10]


In [108]:
#@title Juego de loteria - 2(Ganancia promedio jugando la loteria)
import random
import statistics

games = 2000
payoffs = [-ticket_cost, lost]
probs = [p_winning, q_winning]

outcomes = random.choices(payoffs, weights=probs, k=games)

# Mean of outcomes.
answer = statistics.mean(outcomes)
print("Ganancia promedio: {}, en {} juegos".format(games, answer))

Ganancia promedio: 2000, en -1 juegos


In [109]:
#@title Juego de loteria - 3(hallando punto de equilibrio para el precio de los tickets)
import random
import statistics

simulation_size = 3000 
ticket_cost = 0

while True:
    # Se escogen los elementos de forma que al ser la ganancia 0 o menor a 0 se termina y se asigna el punto de equilibrio
    # Como por ejemplo al ser el precio 3 y vender 2999 voletos a este precio se tendria 8997, siendo el premio 9000
    # Habria una diferencia de 3 de modo que al ser el precio 4 este sobrepasaria el premio siendo el punto de equilibrio
    # De igual modo al trabajar esto de forma invertida al vender los boletos al precio de 3 se tendria 8997.
    outcomes = random.choices([ticket_cost, prize-ticket_cost], weights= probability, k= simulation_size)
    if statistics.mean(outcomes) < 0:
        break
    else:
        ticket_cost -= 1

print("The highest price at which it makes sense to buy the ticket is {}".format(abs(ticket_cost)))

The highest price at which it makes sense to buy the ticket is 3


# Reglas para generar simulaciones
Algo de suma importacia es que las simulaciones no necesitan reglas una vez que se entiende de forma intuitiva la logica detras de ellas, pero como un conocimiento inical antes de empezar a realizar simulaciones es posible guiarse en cinco pasos.

- Construir un espacio muestral o una poblacion.
- Determinar como simular un resultado(asignar probabilidades y otros).
- Determinar una regla para el exito.
- Tomar muestras de forma repetida y contar sucesos.
- Calcular la frecuencia de sucesos como una probabilidad estimada.

## Proceso para construir un espacio muestral
Una vez mas una vez que se entiende de forma intuitiva la logica detras de las simulaciones los pasos no son necesarios pero como guia inicial se podrian dar los siguientes pasos del proceso:

- Variables que influencian la data.
- Fuentes de incertidumbre.
- Relacion.


### Ejemplos simples

A través de los próximos ejercicios, aprenderemos cómo construir un proceso de generación de datos (DGP) a través de ejemplos progresivamente complejos.

En este ejercicio, simulará un DGP muy simple. Suponga que está a punto de tomar un examen de manejo mañana. Según su propia práctica y según los datos que ha recopilado, sabe que la probabilidad de aprobar el examen es del 90 % cuando hace sol y solo del 30 % cuando llueve. Su estación meteorológica local pronostica que hay un 40% de probabilidad de lluvia mañana. Con base en esta información, desea saber cuál es la probabilidad de aprobar el examen de manejo mañana.

Este es un problema simple y se puede resolver analíticamente. Aquí, aprenderá cómo modelar un DGP simple y verá cómo se puede usar para la simulación.

In [110]:
#@title Simulacion prueba de conducir
import random

simulations = 1000
p_rain = 0.4
q_rain = 1 - p_rain
p_pass = {'sun':0.9, 'rain':0.3}

def test_outcome(p_rain):
    # Simulacion para determinar la probabilidad de que llueva o no.
    weather = random.choices(['rain', 'sun'], weights=[p_rain, q_rain], k=1)
    # Obteniendo el primer valor de la lista.
    weather = weather[0]
    # Simulacion para determinar si se pasa o no la prueba.
    test_result = random.choices(['pass', 'fail'], weights=[p_pass[weather], 1-p_pass[weather]], k=1)
    # Obteniendo el primer elemento de la lista
    test_result = test_result[0]
    return test_result

outcomes = []

# Realizando multimples simulaciones para generar la muestra.
for _ in range(simulations):
    outcomes.append(test_outcome(p_rain))

# Calculando la probabilidad de pasar la prueba de manejo
pass_outcomes_frac = sum([x == 'pass' for x in outcomes])/len(outcomes)
print("Probabilidad de pasar la prueba de manejo = {}".format(pass_outcomes_frac))

Probabilidad de pasar la prueba de manejo = 0.682


Modelemos cómo los niveles de actividad afectan la pérdida de peso utilizando rastreadores de actividad física modernos. En los días que vas al gimnasio, das un promedio de alrededor de 15k pasos y alrededor de 5k pasos en caso contrario. Vas al gimnasio el 40% del tiempo. Modelemos el conteo de pasos en un día como una variable aleatoria de Poisson con una media que depende de si vas o no al gimnasio.

Para simplificar, digamos que tiene un 80 % de posibilidades de perder 1 libra y un 20 % de posibilidades de ganar 1 libra cuando da más de 10 000 pasos. Las probabilidades se invierten cuando obtienes menos de 8k pasos. De lo contrario, existe la posibilidad de ganar o perder 1 libra. Con toda esta información, encuentre la probabilidad de perder peso en un mes.

In [111]:
#@title Simulacion para perder peso

import numpy as np

sims = 1000
days= 30

outcomes= []

for _ in range(sims):
    w = []
    for i in range(days):
        lam = np.random.choice([5000, 15000], p=[0.6, 0.4], size=1)
        # En este caso se emplea una distribucion normal para generar la data de forma artificial ya que el tipo de data corresponde
        # a una distribucion de poisson.
        steps = np.random.poisson(lam)
        if steps > 10000: 
            prob = [0.2, 0.8]
        elif steps < 8000: 
            prob = [0.8, 0.2]
        else:
            prob = [0.5, 0.5]
        w.append(np.random.choice([1, -1], p=prob))
    outcomes.append(sum(w))

weight_loss_outcomes_frac = sum([x < 0 for x in outcomes])/len(outcomes)
print("Probability of Weight Loss = {}".format(weight_loss_outcomes_frac))

Probability of Weight Loss = 0.179


In [112]:
#@title Simulacion Black Jack
import numpy as np

cards = [2, 3, 4, 5, 6 ,7, 8, 9, 10, 10, 10, 10, 11]
cards = cards*4

prob_1_card = 1/len(cards)

print(prob_1_card, prob_1_card*52)


exp_val = 0
drawn1 = 2
drawn2 = 6
cards.remove(drawn1)
cards.remove(drawn2)
prob_ace = 0
prob_10 = 0
for c in cards:
    exp_val += c*prob_1_card
    if c == 11:
        prob_ace += 1
    if c == 10:
        prob_10 += 1

prob_ace /= len(cards)
prob_10 /= len(cards)
total = drawn1+drawn2

print(f"Dado que tienes un {drawn1}, {drawn2} para un total de {total}, tus probabilidades de obtener los siguientes valores son:")
print(f"{total+10} : {prob_10*100} %")
print(f"{total+11} : {prob_ace*100} %")
print(exp_val)
print(prob_ace)

0.019230769230769232 1.0
Dado que tienes un 2, 6 para un total de 8, tus probabilidades de obtener los siguientes valores son:
18 : 32.0 %
19 : 8.0 %
7.153846153846157
0.08


### Ejemplo avanzado de proceso para la construccion de un espacio muestral
Esta sera una simulacion para anuncios de ecommerce, primeramente hay que encontrar y separa los pasos:

- Impresion del anuncio.
- Los click's.
- Los ingresos y registros.
- La compra final.
- Valor de la compra final.

El siguiente ejemplo posee los siguientes supuestos:

- En cualquier día, recibimos muchas impresiones de anuncios, que se pueden modelar como variables aleatorias de Poisson (RV). Le dicen que tiene una distribución normal con una media de 100 mil visitantes y una desviación estándar de 2000:

$$mean = 100000$$
$$stdev = 2000$$

- Durante el viaje de registro, el cliente ve un anuncio, decide si hacer clic o no y luego si se registra o no. Por lo tanto, tanto los clics como los registros son binarios, **modelados mediante RV binomiales**. ¿Qué pasa con la probabilidad de éxito? Nuestra opción actual de bajo costo nos brinda una tasa de clics del 1% y una tasa de registro del 20%. Una opción de mayor costo podría aumentar la tasa de clics y registro hasta en un 20 %, pero no estamos seguros del nivel de mejora, por lo que lo modelamos como un RV uniforme.

In [113]:
#@title Signups
import numpy as np

click_low = 0.01
click_plus_20 = 0.01 + (0.01 * 0.2)

signup_low = 0.2
signup_plus_20 = 0.2 + (0.2 * 0.2)

# Puntos altos y bajos de click y signup.
click_rate = {'low':0.01, 'high':np.random.uniform(low= click_low, high= click_plus_20)}
signup_rate = {'low':0.2, 'high':np.random.uniform(low= signup_low, high= signup_plus_20)}

def get_signups(cost, click_rate, signup_rate, sims):
    # Random data para impresiones.
    lam = np.random.normal(loc=100000, scale=2000, size=sims)
    # Simulando impressiones(poisson), clicks(binomial) and signups(binomial)
    impressions = np.random.poisson(lam=lam)
    clicks = np.random.binomial(impressions, p= click_rate[cost])
    signups = np.random.binomial(clicks, p= signup_rate[cost])
    return signups

print("Simulated Signups = {}".format(get_signups('high', click_rate, signup_rate, 1)))

Simulated Signups = [234]


In [114]:
#@title Revenues
def get_revenue(signups):
    rev = []
    np.random.seed(123)
    for s in signups:
        # Compras del modelo como distribucion binomial, valor comprado como distribucion exponencial.
        purchases = np.random.binomial(s, p=0.1)
        purchase_values = np.random.exponential(scale=1000, size=purchases)
        # Añadiendo a la lista revenue la suma de todos los valores comprados.
        rev.append(purchase_values.sum())
    return rev

print("Ingresos simulados = ${}".format(get_revenue(get_signups('low', click_rate, signup_rate, 1))[0]))

Ingresos simulados = $16605.883101873016


In [115]:
#@title Simulaciones
# Iniciando simulaciones
sims = 10000
cost_diff = 3000

# Ingresos cuando el costo sea 'bajo' y cuando el costo sea 'alto'.
rev_low = get_revenue(get_signups('low', click_rate, signup_rate, sims))
rev_high = get_revenue(get_signups('high', click_rate, signup_rate, sims))

frac = []

# calcular fracción de veces rev_high - rev_low es menor que cost_diff
for i in  range(len(rev_low)):

  q = rev_high[i] - rev_low[i] < cost_diff

  frac.append(q)

frac = sum(frac)/len(rev_low)

print("Probabilidad de perder dinero = {}".format(frac))

Probabilidad de perder dinero = 0.4621


# Ejemplo avanzado de simulacion
Suponga que administra una pequeña finca de maíz y está interesado en optimizar sus costos. En este ejercicio ilustrativo, modelaremos la producción de maíz. Nos abstraeremos de detalles como unidades y nos centraremos en el proceso.

Para simplificar, supongamos que la producción de maíz depende solo de dos factores: la lluvia, que no controlas, y el costo, que controlas. La lluvia se distribuye normalmente con una media de 50 y una desviación estándar de 15. Por ahora, fijemos el costo en 5000. Supongamos que el maíz producido en cualquier temporada es una variable aleatoria de Poisson y que la producción promedio de maíz se rige por la ecuación:

$$100 \cdot (cost)^{0.1} \cdot (rain)^{0.2}$$

Modelemos esta función de producción y simulemos un resultado.

In [116]:
import numpy as np

# Inicializando variables.
cost = 5000
rain = np.random.normal(50, 15)

# Modelo de produccion de maiz.
def corn_produced(rain, cost):
  mean_corn = 100*(cost**0.1)*(rain**0.2)
  corn = np.random.poisson(mean_corn)
  return corn

# Simulando e imprimiendo produccion de maiz.
corn_result = corn_produced(rain, cost)
print("Produccion de maiz simulada = {}".format(corn_result))

Produccion de maiz simulada = 495


Desde este punto normalmente no tiene control sobre el precio o la demanda de maíz. Suponga que el precio se distribuye normalmente con una media de 40 y una desviación estándar de 10. Tambien se tiene una función corn_demanded(), que toma el precio y determina la demanda de maíz. Esto es razonable porque la demanda suele estar determinada por el mercado y no está bajo su control.

En este ejercicio, trabajará en una función para calcular la ganancia reuniendo todas las demás variables simuladas. La única entrada para esta función será el costo fijo de producción. Al finalizar, tendrá una función que proporciona un resultado de beneficio simulado para un costo determinado. Esta función se puede utilizar para planificar sus costes.

In [117]:
def corn_demanded(price):

  demand = np.random.normal(1000, 20)

  demanded = demand - (price * np.random.normal(5, 1))

  return demanded

In [118]:
# Funcion para calcular ingresos
def profits(cost):
    rain = np.random.normal(50, 15)
    price = np.random.normal(40, 10)
    supply = corn_produced(rain, cost)
    demand = corn_demanded(price)
    equil_short = supply <= demand
    if equil_short == True:
        tmp = supply*price - cost
        return tmp
    else:
        tmp2 = demand*price - cost
        return tmp2
result = profits(cost)
print("Ganancia simulada = {}".format(result))

Ganancia simulada = 14140.132748388416


Ahora usaremos las funciones creadas para optimizar nuestro costo de producción. Estamos interesados en maximizar las ganancias promedio. Sin embargo, nuestras ganancias dependen de una serie de factores, mientras que solo controlamos los costos. Por lo tanto, podemos simular la incertidumbre en los otros factores y variar el costo para ver cómo se ven afectadas nuestras ganancias.

Dado que administra la pequeña granja de maíz, tiene la posibilidad de elegir su costo, desde $ 100 hasta $ 5,000. Quiere elegir el costo que le da la ganancia promedio máxima. En este ejercicio, simularemos múltiples resultados para cada nivel de costo y calcularemos un promedio. Entonces elegiremos el coste que nos dé la máxima ganancia media. Al finalizar, tendrá un marco para seleccionar las entradas óptimas para las decisiones comerciales.

In [119]:
# Iniciando variables
sims = 1000
results = {}
cost_levels = np.arange(100, 5100, 100)

# Para cada nivel de costo, simular ingresos y gardar las ganancias media
for cost in cost_levels:
    tmp_profits = []
    for i in range(sims):
        tmp_profits.append(profits(cost))
    results[cost] = np.mean(tmp_profits)
    
# Obteniendo el costo que maximice las ganancias

cost_max = 0

for x in results.keys():

  if results[x] == max(results.values()):

    cost_max = x

print("El ingreso promedio es maximizado cuando el costo igual a: {}".format(cost_max))

  # Remove the CWD from sys.path while we load stuff.


El ingreso promedio es maximizado cuando el costo igual a: 1600


# Integracion con simulaciones de montecarlo

Este es un ejercicio simple que introduce el concepto de Integración de Monte Carlo.

Aquí evaluaremos una integral simple:
$$\int_{0}^{1} xe^x dx$$
Sabemos que la respuesta exacta es 1, pero la simulación nos dará una solución aproximada, por lo que podemos esperar una respuesta cercana a 1. Como vimos en el video, es un proceso simple. Para una función de una sola variable $f(x)$:

Obtenga los límites del eje x$(xmin, xmax)$ y el eje y$(max(f(x)),min(min(f(x), 0))$.
Genere un número de puntos uniformemente distribuidos en este cuadro.
Multiplica el área de la caja ($max(f(x))-min(f(x))\cdot{(xmax-xmin)})$ por la fracción de puntos que se encuentran debajo$f(x)$.

Al finalizar, tendrá un marco para manejar integrales definidas utilizando la Integración de Monte Carlo.

In [120]:
# Definiendo simulacion integral.
def sim_integrate(func, xmin, xmax, sims):
    x = np.random.uniform(xmin, xmax, sims)
    y = np.random.uniform(min(min(func(x)), 0), max(func(x)), sims)
    area = (max(y) - min(y))*(xmax-xmin)
    result = area * sum(abs(y) < abs(func(x)))/sims
    return result

result = sim_integrate(func = lambda x: x*np.exp(x), xmin = 0, xmax = 1, sims = 50)
print("Respuesta simulada = {}, Respuesta real = 1".format(result))

Respuesta simulada = 0.9536347195059368, Respuesta real = 1


# Hallando el valor de $\pi$

Ahora trabajaremos con un ejemplo clásico: estimar el valor de $\pi$.

Imagina un cuadrado de lado $2$ con el origen $(0, 0)$ como su centro y las cuatro esquinas teniendo coordenadas $(1, 1), (1, -1), (-1, 1), (-1, -1)$. El área de este cuadrado es $2\cdot{2} = 4$. Ahora imagina un círculo de radio $1$ con su centro en el origen encajando perfectamente dentro de este cuadrado. el area del circulo sera $\pi \cdot radius^2 = \pi$
.

Para estimar $\pi$, muestreamos aleatoriamente múltiples puntos en este cuadrado y obtenemos la fracción de puntos dentro del círculo $(x^2 + y^2<=1)$. Entonces, el área del círculo es $4$ multiplicada por esta fracción, lo que nos da nuestra estimación de $\pi$.

Después de este ejercicio, comprenderá cómo utilizar la simulación para el cálculo.

In [121]:
# Inicializar sims y circle_points
sims= 10000
circle_points = 0 

for i in range(sims):
    # Generando las dos coordenadas de un punto
    point = np.random.uniform(-1, 1, 2)
    # Si el punto se encuentra dentro del círculo unitario, incrementa el contador
    within_circle = point[0]**2 + point[1]**2 <= 1
    if within_circle == True:
        circle_points +=1
        
# Estima pi como 4 veces el número promedio de puntos en el círculo.
pi_sim = 4*circle_points/sims
print("Valor simulado de pi = {}".format(pi_sim))

Valor simulado de pi = 3.1364


# Simulaciones aplicadas a las finanzas
En los próximos ejercicios, calculará los rendimientos esperados de una cartera de acciones y caracterizará su incertidumbre.

Suponga que ha invertido $ 10,000 en su cartera que consta de múltiples acciones. Quiere evaluar el rendimiento de la cartera durante 10 años. Puede modificar su tasa de rendimiento esperada general y su volatilidad (desviación estándar de la tasa de rendimiento). Suponga que la tasa de rendimiento sigue una distribución normal.

Primero, escribamos una función que tome el principal (inversión inicial), el número de años, la tasa de rendimiento esperada y la volatilidad como entradas y devuelva el valor total de la cartera después de 10 años.

Al completar este ejercicio, tendrá una función a la que puede llamar para determinar el rendimiento de la cartera.

In [122]:
def portfolio_return(yrs, avg_return, volatility, principal):
    np.random.seed(123)
    rates = np.random.normal(loc=avg_return, scale=volatility, size=yrs)
    # Calcular la rentabilidad al final del periodo
    end_return = principal
    for x in rates:
        end_return = end_return*(1+x)
    return end_return

result = portfolio_return(yrs = 5, avg_return = 0.07, volatility = 0.15, principal = 1000)
print("Retorno del protafolio despues de 5 años = {}".format(result))

Retorno del protafolio despues de 5 años = 1021.4013412039292


Ahora usaremos la función de simulación que creó para evaluar los rendimientos a 10 años.

Su cartera repleta de acciones tiene una inversión inicial de $10 000, un rendimiento esperado del 7 % y una volatilidad del 30 %. Desea obtener un intervalo de confianza del 95% de lo que valdrá su inversión en 10 años. Simularemos múltiples muestras de rendimientos de 10 años y calcularemos los intervalos de confianza sobre la distribución de los rendimientos.

Al final de este ejercicio, habrá realizado una simulación de cartera completa.

La función portfolio_return() del ejercicio anterior ya está inicializada en el entorno.

In [123]:
sims, rets = 1000, []

for i in range(sims):
    rets.append(portfolio_return(yrs = 10, avg_return = 0.07, 
                                 volatility = 0.3, principal = 10000))

# Calculando el IC del 95%
lower_ci = np.percentile(rets, 2.5) 
upper_ci = np.percentile(rets, 97.5)
print("Intervalo de confianza del 95%: Bajo = {}, Alto = {}".format(lower_ci, upper_ci))

Intervalo de confianza del 95%: Bajo = 3859.345207073691, Alto = 3859.345207073691


Previamente, realizamos una simulación completa para obtener una distribución para rendimientos de 10 años. Ahora usaremos la simulación para la toma de decisiones.

Volvamos a su cartera repleta de acciones con un rendimiento esperado del 7 % y una volatilidad del 30 %. Tiene la opción de reequilibrar su cartera con algunos bonos de modo que el rendimiento esperado sea del 4 % y la volatilidad del 10 %. Tienes un capital de $10,000. Desea seleccionar una estrategia basada en cuánto valdrá su cartera en 10 años. Simulemos los rendimientos de ambas carteras y elijamos en función de la cantidad mínima que puede esperar con un 75 % de probabilidad (percentil 25).

Al finalizar, sabrá cómo utilizar una simulación de cartera para tomar decisiones de inversión.

La función portfolio_return() vuelve a estar precargada en el entorno.

In [124]:
rets_stock = []
rets_bond = []

for i in range(sims):
    rets_stock.append(portfolio_return(yrs = 10, avg_return = 0.07, volatility = 0.3, principal = 10000))
    rets_bond.append(portfolio_return(yrs = 10, avg_return = 0.04, volatility = 0.1, principal = 10000))

# Calculando el percentil 25 de las distribuciones y la cantidad que perdería o ganaría
rets_stock_perc = np.percentile(rets_stock, 25)
rets_bond_perc = np.percentile(rets_bond, 25)
additional_returns = rets_stock_perc - rets_bond_perc
print("Apegarse a las acciones le brinda un rendimiento adicional de {}".format(additional_returns))

Apegarse a las acciones le brinda un rendimiento adicional de -6696.359667655672
