# <font color='blue'> Simulación Monte Carlo del Precio de Acciones

Podemos partir definiendo que el Movimiento Browniano Geométrico sigue la ecuación diferencial estocastica:

$$dS = \mu S dt + \sigma S dW_t$$

donde:

$S$: Precio de la acción

$\mu$: coeficiente de deriva, esto es, el promedio de los rendimientos sobre un periodo o el rendimiento esperado instántaneo.

$\sigma$: coeficiente de difusión, esto es, la volatilidad.

$W_t$: Movimiento browniano
    

Esta ecuación admite una solución, dada por:

$$S(t)=S_0 e^{(\mu -\frac{1}{2}\sigma^2)t+\sigma W_t}$$

donde $S_0=S(0)$ es el precio inicial.

Para fines de la simulación, usamos la fórmula recursiva:
    
$$S(t_{i+1})=S(t_i)exp(\mu - \frac{1}{2}\sigma^2)(t_{i+1}- t_i) + \sigma \sqrt{t_{i+1}-t_i} Z_{i+1}$$

donde $Z_i$ es una variable aleatoria normal estándar e $i=1,2,3,...T$ es el índice de tiempo.

In [1]:
import matplotlib.pyplot as plt
import warnings

plt.style.use('seaborn')
# plt.style.use('seaborn-colorblind') #alternativa
plt.rcParams['figure.figsize'] = [8, 4.5]
plt.rcParams['figure.dpi'] = 300
warnings.simplefilter(action='ignore', category=FutureWarning)

In [2]:
%matplotlib inline
%config InlineBackend.figure_format = 'retina'

Usamos yfinance para descargar datos de yahoo finance

In [None]:
import numpy as np
import pandas as pd
import yfinance as yf

Definimos los parametros de los datos. Usamos acciones de Microsoft.

In [4]:
#RISKY_ASSET = 'MSFT'
#START_DATE = '2019-01-01'
#END_DATE = '2019-07-31'

In [5]:
RISKY_ASSET = 'MSFT'
START_DATE = '2022-01-01'
END_DATE = '2022-05-31'

Los cargamos en un data frame de pandas

In [None]:
df = yf.download(RISKY_ASSET, start=START_DATE, end=END_DATE, adjusted=True)
print(f'Descargados {df.shape[0]} renglones de datos.')

Calculamos los rendimientos diarios

Usamos los métodos: 

dropna(), que filtrar los valores de una estructura de datos pandas para dejar solo aquellos no nulos.

pct_change(), que calcula el porcentaje de cambio entre la entrada actual y la anterior

In [None]:
adj_close = df['Adj Close']
returns = adj_close.pct_change().dropna()   

ax = returns.plot()
ax.set_title(f'{RISKY_ASSET} rendimientos: {START_DATE} - {END_DATE}', 
             fontsize=16)


plt.tight_layout()
#plt.savefig('imagen1.png')
plt.show()

print(f'Rendimiento promedio: {100 * returns.mean():.2f}%')

Graficamos el histograma para darnos una idea de si realmente siguen una distribución normal o no.

In [None]:
plt.hist(x=returns, rwidth=0.85, bins=30)
plt.title('Histograma de los rendimientos')
plt.xlabel('Rendimientos')
plt.ylabel('Frecuencia')

plt.show()

Ahora dividimos el conjunto de datos en dos: un conjunto de entrenamiento y uno de prueba.

In [None]:
train = returns['2021-01-01':'2022-04-30']
test = returns['2022-05-01':'2022-06-07']

Definimos los parámetros de la simulación

In [None]:
T = len(test)   # longitud del periodo de predicción
N = len(test)   # número de incrementos unitarios en el periodo de predicción
S_0 = adj_close[train.index[-1]]  # precio inicial
N_SIM = 100

# Obtenemos los parametros del subconjunto de entrenamiento

mu = train.mean()    
sigma = train.std()

Antes de continuar comparamos gráfica e histograma

In [None]:
mu, sigma

In [None]:
from scipy import stats

In [None]:
x_hat = np.linspace(min(returns), max(returns), num=100)
y_hat = stats.norm.pdf(x_hat, mu, sigma)

fig, ax = plt.subplots(figsize=(7,4))
ax.plot(x_hat, y_hat, linewidth=2, label='normal')
ax.hist(x=returns, density=True, bins=30, color="#3182bd", alpha=0.85)
ax.set_title('Distribución de rendimientos')
ax.set_xlabel('Rendimientos')
ax.set_ylabel('Frecuencia')
ax.legend();

También podemos utilizar una gráfica cuantil-cuantil

In [None]:
import pylab 

In [None]:
stats.probplot(returns, dist="norm", plot=pylab)
pylab.show()

In [None]:
from scipy.stats import kstest

In [None]:
kstest(returns, 'norm', args=(mu, sigma))

Definimos la función para la simulación

In [None]:
def simulate_gbm(s_0, mu, sigma, n_sims, T, N, random_seed=242):

    np.random.seed(random_seed)  # fijamos la semilla
    
    dt = T/N                     # incremento temporal
    dW = np.random.normal(scale = np.sqrt(dt), size=(n_sims, N))
    W = np.cumsum(dW, axis=1)
    
    time_step = np.linspace(dt, T, N)
    time_steps = np.broadcast_to(time_step, (n_sims, N))
    
    S_t = s_0 * np.exp((mu - 0.5 * sigma**2) * time_steps + sigma * W)   # Matriz (n_sim, T+1)
    S_t = np.insert(S_t, 0, s_0, axis=1)                 #Los reglones son trayectorias , columnas son tiempo
    
    return S_t

Corremos la simulación

In [None]:
gbm_simulations = simulate_gbm(S_0, mu, sigma, N_SIM, T, N)

Y graficamos los resultados

In [None]:
last_train_date = train.index[-1].date()
first_test_date = test.index[0].date()
last_test_date = test.index[-1].date()
plot_title = (f'{RISKY_ASSET} Simulation 'f'({first_test_date}:{last_test_date})')

selected_indices = adj_close[last_train_date:last_test_date].index
index = [date.date() for date in selected_indices]

gbm_simulations_df = pd.DataFrame(np.transpose(gbm_simulations),   # se ponen datos simulados en un DF para visualizarlos
                                  index=index)

# Grafica
ax = gbm_simulations_df.plot(alpha=0.2, legend=False) # alpha hace transparentes las lineas
line_1, = ax.plot(index, gbm_simulations_df.mean(axis=1), 
                  color='red')
line_2, = ax.plot(index, adj_close[last_train_date:last_test_date], 
                  color='blue')
ax.set_title(plot_title, fontsize=16)
ax.legend((line_1, line_2), ('media', 'real'))

plt.tight_layout()
#plt.savefig('imagen2.png')
plt.show()

#### Observaciones

* Recordar que, como para cualquier Monte Carlo, entre más muestras, mejor resultado se obtiene.
* El método MC usa un proceso de discretización para simular fenómenos continuos.
* Aquí se trabaja con vectores, lo cual evita bucles tipo for, que pueden ser ineficientes para este tipo de simulaciones.


Podemos revisar el tiempo de simulación:

In [None]:
%timeit gbm_simulations = simulate_gbm(S_0, mu, sigma, N_SIM, T, N)

El módulo timeit cronometra fragmentos pequeños de código

#### Reducción de varianza

Podemos utilizar la técnica de variables antiteticas para reducir la varianza en el código anterior.

Para eso, hay que observar que las trayectorias fueron producidas generando variables aleatorias 
con distribución normal estándar $[ \epsilon_1, ..., \epsilon_t]$.

Así, dividiremos la muestra en dos y a una mitad le asignaremos las variables antitéticas $[ -\epsilon_1, ..., -\epsilon_t]$ y usarmemos el mismo estimador estadistico.

Reescribimos la función, agregando un argumento. 

In [None]:
def simulate_gbm(s_0, mu, sigma, n_sims, T, N, random_seed=42, antithetic_var=False):

    np.random.seed(random_seed)
    
    # incremento de tiempo
    dt = T/N
    
    # Movimiento Browniano con variables antiteticas
    if antithetic_var:
        dW_ant = np.random.normal(scale = np.sqrt(dt), 
                                  size=(int(n_sims/2), N + 1))
        dW = np.concatenate((dW_ant, -dW_ant), axis=0)
    else: 
        dW = np.random.normal(scale = np.sqrt(dt), 
                              size=(n_sims, N + 1))
  
    # evolucion del proceso
    S_t = s_0 * np.exp(np.cumsum((mu - 0.5 * sigma ** 2) * dt + sigma * dW, 
                                 axis=1)) 
    S_t[:, 0] = s_0
    
    return S_t

Ahora comparamos los tiempos

In [None]:
%timeit gbm_simulations = simulate_gbm(S_0, mu, sigma, N_SIM, T, N)  # sin variables antiteticas

In [None]:
%timeit gbm_simulations = simulate_gbm(S_0, mu, sigma, N_SIM, T, N, antithetic_var=True) # con variables antiteticas

# Opciones Europeas

Una opción europea es aquella opción financiera donde el comprador de la misma podrá ejercerla solo cuando llegue el vencimiento del contrato.

Para este caso existen fórmulas analiticas para el precio de las opciones. Nosotros usaremos estas fórmulas para la simulación (revisar):

Call:

$$C(S_t,t)=N(d_1)S_t-N(d_2)Ke^{-r(T-t)}$$

Put:

$$P(S_t,t)=-N(-d_2)Ke^{-r(T-t)} - N(-d_1)S_t$$

donde

$$d_1=\frac{1}{\sigma \sqrt{T-t}}[ln(\frac{S_t}{K})+(r+\frac{\sigma^2}{2})(T-t)]$$


$$d_2=d_1-\sigma \sqrt{T-t}$$

Notación:

* S_0: precio inicial de la acción
* K: precio Strike
* r: tasa libre de riesgo anual
* $\sigma$: volatilidad
* T: Tiempo
* N: número de incrementos de las simulaciones

El precio de la opción es

Call:
    
$$max(S_T-K, 0)$$

Put:

$$max(K-S_T, 0)$$

In [None]:
import numpy as np
from scipy.stats import norm

In [None]:
S_0 = 100
K = 100
r = 0.05
sigma = 0.50
T = 1 # 1 año
N = 252 # 252 días en un año
dt = T / N # paso de tiempo
N_SIMS = 1000000 # numero de simulaciones 
discount_factor = np.exp(-r * T)

In [None]:
def black_scholes_analytical(S_0, K, T, r, sigma, type='call'):
    
    d1 = (np.log(S_0 / K) + (r + 0.5 * sigma ** 2) * T) / (sigma * np.sqrt(T))
    d2 = (np.log(S_0 / K) + (r - 0.5 * sigma ** 2) * T) / (sigma * np.sqrt(T))
    
    if type == 'call':
        val = (S_0 * norm.cdf(d1, 0, 1) - K * np.exp(-r * T) * norm.cdf(d2, 0, 1))
    elif type == 'put':
        val = (K * np.exp(-r * T) * norm.cdf(-d2, 0, 1) - S_0 * norm.cdf(-d1, 0, 1))
    else:
        raise ValueError('Wrong input for type!')
        
    return val

In [None]:
black_scholes_analytical(S_0=S_0, K=K, T=T, r=r, sigma=sigma, type='call')

Simulamos por MC el precio:

In [None]:
gbm_sims = simulate_gbm(s_0=S_0, mu=r, sigma=sigma, n_sims=N_SIMS, T=T, N=N)

Se usa el factor de descuento para calcular el valor presente del payoff

In [None]:
premium = discount_factor * np.mean(np.maximum(0, gbm_sims[:, -1] - K))

In [None]:
premium

Comentar: revisar librería Quantlib

## Opciones americanas

Las opciones americanas se caracterizan porque se pueden ejercer en cualquier momento del periodo $[0, T]$.

Al utilizar el método de Monte Carlo para opciones europeas, el periodo de tiempo se discretizó y se calculó el valor de los precios para el final de cada subperiodo. 

Se puede valuar una opción americana calculando el valor para subperiodos y eligiendo entre ellos el que da el valor óptimo. 

Al proceder así, se dice que la opción americana (que puede ejercerse en cualquier momento) se ha aproximado mediante una Opción Bermuda (que puede ejercerse solo en ciertos valores del tiempo).

In [None]:
import numpy as np
from scipy.stats import norm

Usamos la simulación MC que ya hemos utilizado.

In [None]:
def simulate_gbm(s_0, mu, sigma, n_sims, T, N, random_seed=242):

    np.random.seed(random_seed)  # fijamos la semilla
    
    dt = T/N                     # incremento temporal
    dW = np.random.normal(scale = np.sqrt(dt), size=(n_sims, N))
    W = np.cumsum(dW, axis=1)
    
    time_step = np.linspace(dt, T, N)
    time_steps = np.broadcast_to(time_step, (n_sims, N))
    
    S_t = s_0 * np.exp((mu - 0.5 * sigma**2) * time_steps + sigma * W)   # Matriz (n_sim, T+1)
    S_t = np.insert(S_t, 0, s_0, axis=1)                 #Los reglones son trayectorias , columnas son tiempo
    
    return S_t

Y podemos comparar con el cáluclo analítico

In [None]:
def black_scholes_analytical(S_0, K, T, r, sigma, type='call'):
    
    d1 = (np.log(S_0 / K) + (r + 0.5 * sigma ** 2) * T) / (sigma * np.sqrt(T))
    d2 = (np.log(S_0 / K) + (r - 0.5 * sigma ** 2) * T) / (sigma * np.sqrt(T))
    
    if type == 'call':
        val = (S_0 * norm.cdf(d1, 0, 1) - K * np.exp(-r * T) * norm.cdf(d2, 0, 1))
    elif type == 'put':
        val = (K * np.exp(-r * T) * norm.cdf(-d2, 0, 1) - S_0 * norm.cdf(-d1, 0, 1))
    else:
        raise ValueError('Wrong input for type!')
        
    return val

[Longstaff y Schwartz (2001)](https://people.math.ethz.ch/~hjfurrer/teaching/LongstaffSchwartzAmericanOptionsLeastSquareMonteCarlo.pdf) presentan una manera de aproximar la esperanza condicionada en fragmentos del tiempo total, realizando en cada período una regresión por mínimos cuadrados sobre un conjunto finito de funciones de las variables de estado relevantes. La regresión es posible ya que se cuenta con la información de varios caminos al mismo tiempo (información transversal), por lo que la esperanza se estima realizando una regresión del valor del flujo de fondos que se obtiene por continuar descontado sobre los valores de las variables relevantes para los diferentes caminos de simulación. El valor estimado de la regresión es eficiente e insesgado de la esperanza condicionada y permite estimar con precisión la regla de parada óptima para la opción.

In [None]:
def lsmc_american_option(S_0, K, T, N, r, sigma, n_sims, option_type, poly_degree, random_seed=42):
    dt = T / N
    discount_factor = np.exp(-r * dt)

    gbm_simulations = simulate_gbm(s_0=S_0, mu=r, sigma=sigma, 
                                   n_sims=n_sims, T=T, N=N,
                                   random_seed=random_seed)

    if option_type == 'call':
        payoff_matrix = np.maximum(
            gbm_simulations - K, np.zeros_like(gbm_simulations))
    elif option_type == 'put':
        payoff_matrix = np.maximum(
            K - gbm_simulations, np.zeros_like(gbm_simulations))

    value_matrix = np.zeros_like(payoff_matrix)
    value_matrix[:, -1] = payoff_matrix[:, -1]

    for t in range(N - 1, 0, -1):
        regression = np.polyfit(
            gbm_simulations[:, t], value_matrix[:, t + 1] * discount_factor, poly_degree)
        continuation_value = np.polyval(regression, gbm_simulations[:, t])
        value_matrix[:, t] = np.where(payoff_matrix[:, t] > continuation_value,
                                      payoff_matrix[:, t],
                                      value_matrix[:, t + 1] * discount_factor)

    option_premium = np.mean(value_matrix[:, 1] * discount_factor)
    return option_premium

In [None]:
S_0 = 36
K = 40
r = 0.06
sigma = 0.2
T = 1 # 1 year
N = 50 
dt = T / N 
n_sims = 10 ** 5 
discount_factor = np.exp(-r * dt)
option_type = 'put'
poly_degree = 5 

In [None]:
prima_opcion=lsmc_american_option(S_0, K, T, N, r, sigma, n_sims, option_type, poly_degree)

In [None]:
print(f'La prima de la opcion americana {OPTION_TYPE} es {option_premium:.3f}')

In [None]:
black_scholes_analytical(S_0=S_0, K=K, T=T, r=r, sigma=sigma, 
                         type='put')

In [None]:
european_call_price = black_scholes_analytical(S_0=S_0, K=K, T=T, 
                                               r=r, sigma=sigma)
american_call_price = lsmc_american_option(S_0=S_0, K=K, T=T, N=N, r=r, 
                                           sigma=sigma, n_sims=N_SIMS, 
                                           option_type='call', 
                                           poly_degree=POLY_DEGREE)
print(f"La prima de la call europea es {european_call_price:.3f}, y la de la call americana (usando {N_SIMS} simulaciones) es {american_call_price:.3f}")