# Simulación del Movimiento Browniano y Algunos Procesos Relacionados

In [1]:
import scipy.stats as stats
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Lema de Itô

El Lema de Itô es una herramienta matemática fundamental en el cálculo estocástico que extiende la regla de la cadena a procesos estocásticos. Es esencial para modelar sistemas que involucran incertidumbre, como el movimiento browniano.

Supongamos que $X_t$ es un proceso estocástico y $f(X_t, t)$ es una función diferenciable. El Lema de Itô establece que el diferencial de $f$ es:
$$
df(X_t, t) = \frac{\partial f}{\partial t} dt + \frac{\partial f}{\partial X_t} dX_t + \frac{1}{2} \frac{\partial^2 f}{\partial X_t^2} (dX_t)^2.
$$

Si $X_t$ sigue la dinámica:
$$
dX_t = \mu dt + \sigma dW_t,
$$
donde $dW_t$ es un incremento del movimiento browniano estándar ($N(0, dt)$), entonces:
$$
df(X_t, t) = \frac{\partial f}{\partial t} dt + \frac{\partial f}{\partial X_t} (\mu dt + \sigma dW_t) + \frac{1}{2} \frac{\partial^2 f}{\partial X_t^2} \sigma^2 dt.
$$

### ¿Para qué sirve?

El Lema de Itô es útil para analizar cómo evolucionan las funciones de procesos estocásticos en el tiempo. Por ejemplo:
- En finanzas, se usa para modelar precios de activos que siguen un **movimiento browniano geométrico**.
- Es esencial para derivar la famosa fórmula de **Black-Scholes** para valuar opciones financieras.

### Relación con el Movimiento Browniano Geométrico

El movimiento browniano geométrico es un modelo utilizado para describir la evolución de precios de activos financieros, y su ecuación diferencial es:
$$
dS_t = \mu S_t dt + \sigma S_t dW_t.
$$

Aplicando el Lema de Itô a $S_t$, se puede obtener su solución explícita:
$$
S_t = S_0 \exp\left(\left(\mu - \frac{\sigma^2}{2}\right)t + \sigma W_t\right).
$$

Esta solución muestra cómo los precios de los activos evolucionan bajo incertidumbre, considerando tanto el crecimiento promedio ($\mu$) como la volatilidad ($\sigma$).

---

# Ejemplos Sencillos para Entender el Lema de Itô

## Ejemplo 1: Función lineal

Supongamos que $f(X_t, t) = a X_t + b$, donde $a$ y $b$ son constantes, y $X_t$ sigue la dinámica:
$$
dX_t = \mu dt + \sigma dW_t.
$$

El diferencial de $f$ es:
$$
df(X_t, t) = a dX_t.
$$

Sustituyendo $dX_t$:
$$
df(X_t, t) = a (\mu dt + \sigma dW_t).
$$

Así que:
$$
df(X_t, t) = a \mu dt + a \sigma dW_t.
$$

Este es un caso sencillo donde no hay términos cuadráticos, ya que la segunda derivada de $f$ respecto a $X_t$ es cero.

---

## Ejemplo 2: Función cuadrática

Supongamos que $f(X_t, t) = X_t^2$, y $X_t$ sigue la misma dinámica:
$$
dX_t = \mu dt + \sigma dW_t.
$$

El Lema de Itô dice:
$$
df(X_t, t) = \frac{\partial f}{\partial t} dt + \frac{\partial f}{\partial X_t} dX_t + \frac{1}{2} \frac{\partial^2 f}{\partial X_t^2} (dX_t)^2.
$$

Calculamos las derivadas parciales:
- $\frac{\partial f}{\partial X_t} = 2X_t$,
- $\frac{\partial^2 f}{\partial X_t^2} = 2$,
- $\frac{\partial f}{\partial t} = 0$ (porque $f$ no depende de $t$ directamente).

Entonces:
$$
df(X_t, t) = 2X_t dX_t + \frac{1}{2} \cdot 2 \cdot (\sigma^2 dt).
$$

Sustituyendo $dX_t$:
$$
df(X_t, t) = 2X_t (\mu dt + \sigma dW_t) + \sigma^2 dt.
$$

Simplificando:
$$
df(X_t, t) = 2X_t \mu dt + 2X_t \sigma dW_t + \sigma^2 dt.
$$

---

## Ejemplo 3: Función logarítmica

Supongamos que $f(X_t, t) = \ln(X_t)$, y $X_t$ sigue la dinámica:
$$
dX_t = \mu dt + \sigma dW_t.
$$

Las derivadas son:
- $\frac{\partial f}{\partial X_t} = \frac{1}{X_t}$,
- $\frac{\partial^2 f}{\partial X_t^2} = -\frac{1}{X_t^2}$,
- $\frac{\partial f}{\partial t} = 0$.

Aplicando el Lema de Itô:
$$
df(X_t, t) = \frac{1}{X_t} dX_t - \frac{1}{2} \frac{1}{X_t^2} (\sigma^2 dt).
$$

Sustituyendo $dX_t$:
$$
df(X_t, t) = \frac{1}{X_t} (\mu dt + \sigma dW_t) - \frac{1}{2} \frac{\sigma^2}{X_t^2} dt.
$$

Simplificando:
$$
df(X_t, t) = \frac{\mu}{X_t} dt + \frac{\sigma}{X_t} dW_t - \frac{\sigma^2}{2X_t^2} dt.
$$


In [None]:
np.random.choice((-1,1),1000)

In [None]:
grid = np.linspace(0,1,1001)
grid

In [None]:
len(grid)

In [None]:
S = np.append(0,np.random.choice((-1,1),1000).cumsum())
S

In [None]:
X_T = S/(1000**0.5)
X_T

In [None]:
# Primero simularemos por medio de una caminata aleatoria.
grid = np.linspace(0,1,1001)
np.random.seed(seed = 467)
S = np.append(0,np.random.choice((-1,1),1000).cumsum())
X_T = S/(1000**0.5)
plt.figure(figsize=(15,6))
plt.plot(grid,X_T)
plt.title("Aproximación de una trayectoria del MB a través de una Caminata Aleatoria", fontsize = 18)

Sea $\{B_t: t \geq 0\}$ entonces es un movimiento browniano si

1. $B_0$ = 0
2. Tiene incrementos independientes y estacionarios
3. $B_t - B_s \sim N(0,t-s)$ si $s < t$
4. Tiene trayectorias continuas.

$B_{t_k} = \sum_{i=1}^k(B_{t_i}-B_{t_{i-1}})$

Para simular la trayectorias de un MB utilizaremos la propiedad de incrementos independientes y estacionarios, basta saber simulas observaciones independientes de una distribución normal.

In [None]:
stats.norm.rvs(0,(1/1000)**0.5,size = 1000)

In [None]:
## Scipy nos permite simular varias distribuciones, entre ellas la normal
grid = np.linspace(0,1,1001)
np.random.seed(seed = 4678)
Browniano = np.append(0,stats.norm.rvs(0,(1/1000)**0.5,size = 1000).cumsum())
plt.figure(figsize=(15,6))
plt.plot(grid,Browniano)
plt.title("Trayectoria del MB", fontsize = 18)

In [None]:
Browniano

In [None]:
#Vamos a simular varias trayectorias juntas
grid = np.linspace(0,1,1001)

plt.figure(figsize=(15,6))

for i in range(100):
    Browniano = np.append(0,stats.norm.rvs(0,(1/1000)**0.5,size = 1000).cumsum())
    plt.plot(grid,Browniano)
plt.title("Trayectorias del Movimiento Browniano", fontsize = 18)   

In [None]:
#Trayectorias del Movimiento Browniano Geometrico
S_0 = 100
mu = 0.21
sigma = 0.15

grid = np.linspace(0,1,1001)

np.random.seed(seed = 4678)
Browniano = np.append(0,stats.norm.rvs(0,(1/1000)**0.5,size = 1000).cumsum())
BGeometrico = S_0*np.e**((mu-sigma**2/2)*grid + sigma*Browniano)
plt.figure(figsize=(15,6))
plt.plot(grid,BGeometrico, color = "lightcoral")
plt.title("Trayectoria del Browniano Geométrico", fontsize = 18)

In [None]:
BGeometrico

In [None]:
Browniano

In [None]:
#Haciendo Varias trayectorias del Browniano Geométrico
grid = np.linspace(0,1,1001)

plt.figure(figsize=(15,6))

for i in range(100):
    Browniano = np.append(0,stats.norm.rvs(0,(1/1000)**0.5,size = 1000).cumsum())
    BGeometrico = S_0*np.e**((mu-sigma**2/2)*grid + sigma*Browniano)
    plt.plot(grid,BGeometrico)
plt.title("Trayectorias del Movimiento Browniano Geométrico", fontsize = 18) 

## Utilizando el Movimiento Browniano Geométrico para simular el comportamiento de un activo

Supongamos que el precio de un activo $\{S_t: t\geq0\}$ se comporta como un movimiento geométrico y nosotros quisieramos simular distintas trayectorias para ver el comportamiento del precio en un tiempo $T$, entonces necesitariamos estimar los paramétros del modelo.

$$S_T = S_0 e^{(\mu - \sigma ^2/2)T + \sigma B_T}$$

Si tenemos observaciones de los precios diarios sabemos que los logrendimientos diarios tienen una distribución normal con media $\mu - \sigma ^2/2$ y desviación $\sigma$, podemos reparametrizar y decir que siguen una distribución con media $\overline{\mu}$ y varianza $\overline{\sigma}$ y con ello podemos utilizar los siguientes estimadores.

$$\hat{\overline{\mu}} = \frac{1}{N}\sum_{i = 1}^N lR_i$$

$$\hat{\overline{\sigma}} =\sqrt{ \frac{1}{N-1} \sum_{i = 1}^N (lR_i - \hat{\overline{\mu}})^2} $$

donde $lR_i$ son los log-rendimientos.

In [None]:
# Vamos a cargar los datos
precios_AB = pd.read_csv('precios_amz_dis.csv', header = 0, index_col = 0)
precios_AB

In [None]:
# Vamos a cargar los datos
precios_AB = pd.read_csv('precios_amz_dis.csv', header = 0, index_col = 0)
precios_AB.index = pd.to_datetime(precios_AB.index, dayfirst = True)
precios_AB

In [None]:
# Vamos a cargar los datos
precios_AB = pd.read_csv('precios_amz_dis.csv', header = 0, index_col = 0)
precios_AB.index = pd.to_datetime(precios_AB.index, dayfirst = True)
precios_AB.index = precios_AB.index.to_period('D')
precios_AB.tail()

1. El argumento header=0 se usa para especificar que la primera fila del archivo CSV contiene los nombres de las columnas.

2. El argumento index_col=0 se usa para especificar que la primera columna del archivo CSV debe ser utilizada como el índice (etiqueta) de las filas en el DataFrame resultante.

El argumento dayfirst=True se utiliza para indicar que el formato de fecha en el índice sigue el formato día-mes-año.

Se convierten los objetos de fecha y hora en objetos de período utilizando el método to_period('D'). Esto significa que ahora los índices representan períodos de un día en lugar de fechas y horas precisas.

In [None]:
precios_AB['AMZ']

In [None]:
rend_amazon = precios_AB['AMZ'].pct_change().dropna()
rend_amazon

In [None]:
lr_amazon = np.log(rend_amazon+1)

In [None]:
lr_amazon_prueba = lr_amazon[:-13]
lr_amazon_prueba

In [None]:
mu = lr_amazon_prueba.mean()
sigma = lr_amazon_prueba.std(ddof = 1)

In [None]:
mu,sigma

In [None]:
precios_AB['AMZ'][-14]

In [None]:
## Primero simulamos una trayectoria
S_0 = precios_AB['AMZ'][-14]
grid = np.array(range(0,14))
Browniano = np.append(0,stats.norm.rvs(0,1,size = 13).cumsum())
BGeometrico = S_0*np.e**(mu*grid + sigma*Browniano)

plt.figure(figsize=(15,6))
plt.plot(grid,BGeometrico, color = "lightcoral", label = "Simulación")
plt.title("Simulación y Precio Real AMZ", fontsize = 18)
plt.plot(grid,precios_AB['AMZ'][-14:], color = "black", label = "Precio Real")
plt.legend(loc = "upper left", fontsize = 15)

In [None]:
# Ahora vamos a simular varias trayectorias
S_0 = precios_AB['AMZ'][-14]
grid = np.array(range(0,14))

plt.figure(figsize=(15,6))
for i in range(0,200):
    Browniano = np.append(0,stats.norm.rvs(0,1,size = 13).cumsum())
    BGeometrico = S_0*np.e**((mu-sigma**2/2)*grid + sigma*Browniano)
    plt.plot(grid,BGeometrico, color = "lightcoral")
    
plt.title("Simulaciones y Precio Real AMZ", fontsize = 18)
plt.plot(grid,precios_AB['AMZ'][-14:], color = "black", label = "Precio Real")
plt.legend(loc = "upper left", fontsize = 15)

Podemos crear un intervalo de confianza de $S_T$ ya sea de forma teorica y con ayuda de las simulaciones.

1. De forma teorica sabemos que $ln(S_T)$ sigue una distribución normal con media $ln(S_0) + \overline{\mu}T$ y varianza $\sigma^2 T$, el intervalo de confianza de nivel $\alpha$ estaría dado por 

$$(e^{ln(S_0) + \overline{\mu}T - z_{\alpha/2}\sigma\sqrt{T}},e^{ln(S_0) + \overline{\mu}T + z_{\alpha/2}\sigma\sqrt{T}})$$

In [None]:
z = stats.norm.ppf(0.70)
lower = np.e**(np.log(S_0) + mu*13-z*sigma*(13**0.5))
upper = np.e**(np.log(S_0) + mu*13+z*sigma*(13**0.5))

In [None]:
# Intervalo de confianza del 97.5%
lower,upper, S_0

In [None]:
## Hagamos un análisis para los precios de NETFLIX
precios_NFLX = pd.read_csv('NLFX.csv', header = 0, index_col = 0)
precios_NFLX.index = pd.to_datetime(precios_NFLX.index, dayfirst = True)
precios_NFLX.index = precios_NFLX.index.to_period('D')
precios_NFLX.tail()

In [None]:
precios_NFLX.loc['2023']

In [None]:
# Vamos a utilizar solo el año 2023 y simular trayectorias del 2024

rend_NFLX = precios_NFLX.loc['2023'].pct_change().dropna()
lr_NFLX = np.log(rend_NFLX+1)

In [None]:
lr_NFLX

In [None]:
mu_lr_NFLX = lr_NFLX.mean()
std_lr_NFLX = lr_NFLX.std(ddof = 1)

# El histograma de los datos 
plt.hist(lr_NFLX, bins = 10, density = True, color = "darkcyan")

# Agregando la densidad normal
x = np.linspace(lr_NFLX.min(),lr_NFLX.max(),100)
densidad = stats.norm.pdf(x,mu_lr_NFLX,std_lr_NFLX)
plt.plot(x,densidad,'--k')
plt.title('Log-Rendimientos Netflix y Ajuste Normal')

In [None]:
# Prueba JarqueBera
stats.jarque_bera(lr_NFLX) # Me dice que Rechaze :/

In [None]:
precios_NFLX.loc['2024']['NFLX'][0]

In [None]:
len(precios_NFLX.loc['2024'])

In [None]:
np.arange(len(precios_NFLX.loc['2024']))

In [None]:
# Vamos a hacer la simulación de trayectorias
S_0 = precios_NFLX.loc['2024']['NFLX'][0]
grid = np.arange(len(precios_NFLX.loc['2024']))

plt.figure(figsize=(15,6))
for i in range(0,500):
    Browniano = np.append(0,stats.norm.rvs(0,1,size = len(grid)-1).cumsum())
    BGeometrico = S_0*np.e**((mu_lr_NFLX[0])*grid + std_lr_NFLX[0]*Browniano)
    plt.plot(grid,BGeometrico, color = "lightcoral")
    
plt.title("Simulaciones y Precio Real Netflix 2024", fontsize = 18)
plt.plot(grid,precios_NFLX.loc['2024'], color = "black", label = "Precio Real")
plt.legend(loc = "upper left", fontsize = 15)

In [None]:
# Vamos a graficar unicamente los intervalos de confianza.
z = stats.norm.ppf(0.97)
lower = np.e**(np.log(S_0) + mu_lr_NFLX[0]*grid-z*std_lr_NFLX[0]*(grid**0.5))
upper = np.e**(np.log(S_0) + mu_lr_NFLX[0]*grid+z*std_lr_NFLX[0]*(grid**0.5))

In [None]:
lower

In [None]:
upper

In [None]:
plt.figure(figsize=(15,6))
plt.plot(grid,precios_NFLX.loc['2024'], color = "black", label = "Precio Real")
plt.plot(grid,lower,'--r',label = "Mínimo")
plt.plot(grid,upper,'--r',label = "Máximo")

plt.title("Precio Real Netflix 2024 e intervalos de confianza 90%", fontsize = 18)
plt.legend(fontsize = 15)
plt.gca().fill_between(grid, 
                       lower, upper, 
                       facecolor='lightsteelblue', 
                       alpha=0.1)

In [None]:
plt.figure(figsize=(15,6))
for i in range(0,100):
    Browniano = np.append(0,stats.norm.rvs(0,1,size = len(grid)-1).cumsum())
    BGeometrico = S_0*np.e**((mu_lr_NFLX[0]-std_lr_NFLX[0]**2/2)*grid + std_lr_NFLX[0]*Browniano)
    plt.plot(grid,BGeometrico, color = "lightgray")
    
plt.title("Precio Real Netflix 2024, simulaciones e intervalos de confianza 97.5%", fontsize = 18)
plt.plot(grid,precios_NFLX.loc['2024'], color = "black", label = "Precio Real")
plt.plot(grid,lower,'--r',label = "Mínimo")
plt.plot(grid,upper,'--r',label = "Máximo")

plt.legend(fontsize = 15)
plt.gca().fill_between(grid, 
                       lower, upper, 
                       facecolor='lightsteelblue', 
                       alpha=0.2)