# **Aplicaciones Financieras de ML & AI**
## **Examen II:** *Objetos Financieros Parte I*

#### Nombre: Julio César Avila Torreblanca

- **Problema 1:**:
    1. Descargue datos del precio del dólar en pesos mexicanos, use Yahoo Finance.
    2. Proponer una red de arquitectura LSTM que realice una predicción (forecast)
de la serie de tiempo anterior. ¿Es posible mejorar los resultados de un modelo ARIMA?
    3. ¿Es posible utilizar redes neuronales recurrentes en lugar de un modelo
ARCH?, Intente implementarlo y observe los resultados.


- **Contenido del notebook**:
    1. Librerías y parámetros
    2. Lectura de los datos
    3. Forecasting con ARIMA
    4. Forecasting con GARCH
    5. Forecasting con LSTM
    6. Conclusiones



# 1. Librerías y parámetros

In [None]:
!pip install arch

In [None]:
# data
import pandas as pd
pd.set_option('display.max_columns', None)
import numpy as np
import yfinance as yf

# plots
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.graph_objects as go

# modeling
from sklearn.model_selection import train_test_split

from statsmodels.tsa.stattools import adfuller
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
from statsmodels.tsa.arima.model import ARIMA

from arch import arch_model

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.optimizers import Adam
from tensorflow.keras import layers

# test
from sklearn.metrics import mean_squared_error, mean_absolute_error


# 2. Lectura de los datos

In [None]:
data = yf.download(
        tickers = "MXN=X", # dollar price
        period = "1y", # one year information
        interval = "1d", # daily information
    ).loc[:, 'Close']

data = data.rename(columns={'MXN=X': 'dollar_price'})
data

# 3. Forecasting con ARIMA
Los pasos a seguir son:
- Validar si la serie de tiempo es estacionaria, caso contrario, transformar los datos.
- Obtener los valores de p,q
- Entrenar las combinaciones $ARIMA(p,d,q)$
- Seleccionar el mejor modelo
- Análisis de resultados

## 3.1 *Estacionalidad*

In [None]:
# uso de test Dickey-Fuller para ver si la st es estacionaria
ADF_result = adfuller(data['dollar_price'])

print('ADF test con los datos originales:')
print(f'-> ADF Statistic: {ADF_result[0]}')
print(f'-> p-value: {ADF_result[1]}')

In [None]:
data['dollar_price'].plot(
    figsize = (12,4),
    color='#128277'
)

plt.title("Precio diario del dolar (MXN)")
plt.grid(alpha=0.4)
plt.legend('')
plt.show()

Dado que p-value > 0.05 no se rechaza la hipótesis nula, por ende la serie de tiempo no es estacionaria.

Probaremos con los retornos logaritmicos.

In [None]:
data['log_returns'] = np.log(data['dollar_price']) - np.log(data['dollar_price'].shift(1))
data = data.dropna()

ADF_result = adfuller(data['log_returns'])

print('ADF test con los retornos logarítmicos:')
print(f'-> ADF Statistic: {ADF_result[0]}')
print(f'-> p-value: {ADF_result[1]}')

In [None]:
data['log_returns'].plot(
    figsize = (12,4),
    color='#128277',
    alpha=0.7
)

plt.title("Retornos logarítmicos para el precio diario del dolar")
plt.grid(alpha=0.4)
plt.legend('')
plt.show()

Aquí p-value < 0.05, por lo que tomando los retornos logarítmicos del dolar obtenemos una serie de tiempo estacionaria. Trabajaremos con esta.

## 3.2 Obtener $p$, $q$

In [None]:
# ACF plot
n_coef = 50
fig, ax = plt.subplots(figsize=(12,4))

plot_acf(
    x=data['log_returns'],
    ax=ax,
    lags=n_coef,
    color='#004D47',
    #alpha=0.7
)
ax.set(
    xlabel='Timesteps',
    ylabel='Values',
    title = 'ACF: Retornos logarítmicos diarios del dolar')
ax.title.set_size(20)
plt.show()

In [None]:
# PACF plot
n_coef = 50
fig, ax = plt.subplots(figsize=(12,4))

plot_pacf(
    x=data['log_returns'],
    ax=ax,
    lags=n_coef,
    color='#004D47',
    #alpha=0.7
)
ax.set(
    xlabel='Timesteps',
    ylabel='Values',
    title = 'PACF: Retornos logarítmicos diarios del dolar')
ax.title.set_size(20)
plt.show()

Analizando los gráficos de ACP y PACF, vemos que solo la serie de tiempo solo tiene autocorrleación con el primer lag, con el resto de valores pasados no se aprecia alguna correlación. Dada la falta de Autocorrelaciones, podemos suponer que el uso del modelo ARIMA puede que no nos llegue a realizar una buena predicción. Por ahora continuaremos con el ejercicio tomando $p,q=1$.

## 3.3 Modelo ARIMA

### 3.3.1 Split data
Tomaremos el último **mes** como test y entrenaremos con el resto de datos.

In [None]:
train_data = data.iloc[:-20,:].copy()
test_data = data.iloc[-20:,:].copy()

print(train_data.shape)
print(test_data.shape)

### 3.3.2 Train

In [None]:
# MODELO ARIMA
model_arma = ARIMA(
    train_data['log_returns'],
    order=(1, 0, 1),
    enforce_stationarity=False,
)

model_arma_fitted = model_arma.fit()

In [None]:
print(model_arma_fitted.summary())

### 3.3.3 Test

In [None]:
# log returns
test_forecast = model_arma_fitted.get_forecast(steps=len(test_data))
test_forecast_series = pd.Series(test_forecast.predicted_mean.values, index=test_data.index)

# metrics
mse = mean_squared_error(test_data['log_returns'], test_forecast_series)
rmse = mse**0.5
mae = mean_absolute_error(test_data['log_returns'], test_forecast_series)

# plot for comparing
plt.figure(figsize=(12,4))
plt.plot(train_data['log_returns'], label='Training Data', color='#128277')
plt.plot(test_data['log_returns'], label='Test Data', color='#6FB98F',)
plt.plot(test_forecast_series, label='Forecasted Data', color='grey', linestyle='--')
plt.fill_between(test_data.index,
                 test_forecast.conf_int().iloc[:, 0],
                 test_forecast.conf_int().iloc[:, 1],
                 color='k', alpha=.1)
plt.title('Evaluación: ARIMA en retornos logarítmicos')
plt.xlabel('Date')
plt.ylabel('Date')
plt.legend()
plt.show()

print(f'RMSE: {rmse:.4f}')
print(f'MAE: {mae:.4f}')

In [None]:
# log returns
test_forecast = model_arma_fitted.get_forecast(steps=len(test_data))
test_forecast_values = test_forecast.predicted_mean.values

# inverse log return
for index,val in enumerate(test_forecast_values):
  test_forecast_values[index] = np.exp(val)*data['dollar_price'].iloc[-21+index]

test_forecast_series = pd.Series(test_forecast_values, index=test_data.index)
# metrics
mse = mean_squared_error(test_data['dollar_price'], test_forecast_series)
rmse = mse**0.5
mae = mean_absolute_error(test_data['dollar_price'], test_forecast_series)

# plot for comparing
plt.figure(figsize=(12,4))
plt.plot(train_data['dollar_price'], label='Training Data', color='#128277')
plt.plot(test_data['dollar_price'], label='Test Data', color='#6FB98F',)
plt.plot(test_forecast_series, label='Forecasted Data', color='grey', linestyle='--')
plt.fill_between(test_data.index,
                 test_forecast.conf_int().iloc[:, 0],
                 test_forecast.conf_int().iloc[:, 1],
                 color='k', alpha=.15)
plt.title('Evaluación: ARIMA en el precio del dolar')
plt.xlabel('Date')
plt.ylabel('Date')
plt.legend()
plt.show()

print(f'RMSE: {rmse:.4f}')
print(f'MAE: {mae:.4f}')

In [None]:
# log returns
test_forecast = model_arma_fitted.get_forecast(steps=len(test_data))
test_forecast_values = test_forecast.predicted_mean.values

# inverse log return
for index,val in enumerate(test_forecast_values):
  test_forecast_values[index] = np.exp(val)*data['dollar_price'].iloc[-21+index]

test_forecast_series = pd.Series(test_forecast_values, index=test_data.index)
# metrics
mse = mean_squared_error(test_data['dollar_price'], test_forecast_series)
rmse = mse**0.5
mae = mean_absolute_error(test_data['dollar_price'], test_forecast_series)

# plot for comparing
plt.figure(figsize=(12,4))
plt.plot(test_data['dollar_price'], label='Test Data', color='#6FB98F',)
plt.plot(test_forecast_series, label='Forecasted Data', color='grey', linestyle='--')
plt.fill_between(test_data.index,
                 test_forecast.conf_int().iloc[:, 0],
                 test_forecast.conf_int().iloc[:, 1],
                 color='k', alpha=.15)
plt.title('Evaluación: ARIMA en el precio del dolar')
plt.xlabel('Date')
plt.ylabel('Date')
plt.legend()
plt.show()

print(f'RMSE: {rmse:.4f}')
print(f'MAE: {mae:.4f}')

### 3.3.4. Conclusión

El modelo ARIMA a pesar de tener métricas de RMSE y MAE bajas, podemos notar en el último gráfico que la predicción obtenida es tan solo el valor anterior. Por ende el modelo no logra capturar completamente el comportamiento de la serie de tiempo. Probemos con otros métodos.

# 4. Forecasting con GARCH

Dado que ya hemos procesado y analizado los datos, iremos directamente al proceso de modelado con GARCH.*texto en cursiva*

In [None]:
daily_volatility = data['log_returns'].std()
print(f'Volatilidad Diaria: {daily_volatility:.4f}')

monthly_volatility = np.sqrt(21) * daily_volatility
print(f'Volatilidad Mensual: {monthly_volatility:.4f}')

yearly_volatility = np.sqrt(252) * daily_volatility
print(f'Volatilidad Anual: {yearly_volatility:.4f}')

## 4.1 Train

In [None]:
model_garch = arch_model(
    train_data['log_returns']*100, # Multiplicar por 100 para cambiar la escala
    mean='Zero',
    vol='ARCH',
    p=1,
    q=1
)

model_garch_fitted = model_garch.fit()

In [None]:
print(model_garch_fitted.summary())

## 4.2 Test

In [None]:
train_volatility = model_garch_fitted.conditional_volatility / 100 # regresar a la escala

forecasts = model_garch_fitted.forecast(horizon=20)
forecast_volatility = pd.Series(
    forecasts.variance[-1:].values.flatten(),
    index=test_data.index) / 100 #regresar a la escala

In [None]:
# plot
plt.figure(figsize=(12,4))

plt.plot(train_data['log_returns'], label='Training Data [Log_returns]', color='#128277')
plt.plot(train_volatility, label='Volatilidad Predicha', color='lightcoral')


plt.plot(test_data['log_returns'], label='Test Data [Log_returns]', color='#6FB98F',)
plt.plot(forecast_volatility, label='Volatilidad test', color='lightcoral', alpha=0.7, linestyle='--')

plt.title('Evaluación: ARCH en retornos logarítmicos')
plt.xlabel('Date')
plt.ylabel('Date')
plt.legend()
plt.show()


In [None]:
# plot
plt.figure(figsize=(12,4))
plt.plot(test_data['log_returns'], label='Test Data [Log_returns]', color='#6FB98F',)
plt.plot(forecast_volatility, label='Volatilidad test', color='lightcoral', alpha=0.7, linestyle='--')

plt.title('Evaluación: ARCH en retornos logarítmicos')
plt.xlabel('Date')
plt.ylabel('Date')
plt.legend()
plt.show()

# 4. Forecasting con LSTM

## 4.1 Preparación de los datos

In [None]:
# tomando un n_steps hacia atrás
def create_sequences(data, n_steps):
    X, y = [], []
    for i in range(len(data) - n_steps):
        X.append(data[i:(i + n_steps)])
        y.append(data[i + n_steps])

    X = np.array(X)
    X = np.reshape(X, (X.shape[0], X.shape[1], 1))

    y = np.array(y)


    return  X, y

In [None]:
n_steps_back = 1

# last month for testing
train_data = data.iloc[:-20,:].copy()
test_data = data.iloc[-20:,:].copy()

X_train, y_train = create_sequences(
    train_data['dollar_price'].values,
    n_steps=n_steps_back
)

X_test, y_test = create_sequences(
    test_data['dollar_price'].values,
    n_steps=n_steps_back
)

print(X_train.shape, y_train.shape)
print(X_test.shape, y_test.shape)

## 4.2 Arquitectura de LSTM

La red a implementar tendrá en su capa de entrada la cantidad de lags a tomar hacia atrás (2), luego una capa LSTM con 64 neuronas, después una capa Densa con (32) neuronas con función de activación relu y finalmente una capa de salida con un solo valor, la cuál será nuestra predicción.


In [None]:
model_lstm = keras.models.Sequential([
    layers.Input((n_steps_back, 1), name = 'price_input'),
    layers.LSTM(units=64,  name='first_lstm', return_sequences=True, activation="relu"), # 64 neuronas
    layers.LSTM(32, name='second_lstm', activation="relu"), # 64 neuronas
    #layers.Dense(32, name='first_dense',activation='relu'), # 32 neuronas
    #layers.Dense(16, name='second_dense',activation='softmax'), # 32 neuronas
    layers.Dense(1, name='output')
    ]
)

model_lstm.compile(
    loss='mse',
    optimizer=Adam(learning_rate=1e-3),
    metrics=['mean_absolute_error']
)


model_lstm.summary()

In [None]:
# Visualización del modelo
keras.utils.plot_model(
    model,
    show_shapes=True,
    show_dtype=False,
    show_layer_names=True,
    rankdir="TD",
    dpi=100,
)


## 4.2 Training

In [None]:
history = model_lstm.fit(
    X_train,
    y_train,
    epochs=100,
    #batch_size = n_steps_back,
)

## 4.3 Test

In [None]:
# Graficar la función de pérdida
plt.figure(figsize=(10, 6))
plt.plot(history.history['loss'], label='Entrenamiento', color='turquoise')
plt.title('Función de Pérdida del Modelo')
plt.xlabel('Época')
plt.ylabel('Pérdida')
plt.legend()
plt.show()

In [None]:
y_train_pred = model_lstm.predict(X_train)
y_test_pred = model_lstm.predict(X_test)

y_train_pred = pd.Series(
    y_train_pred.ravel(),
    index=train_data.iloc[n_steps_back:,].index
)
y_test_pred = pd.Series(
    y_test_pred.ravel(),
    index=test_data.iloc[n_steps_back:,].index
)


In [None]:
# metrics
rmse = mean_squared_error(y_train, y_train_pred)**0.5
mae = mean_absolute_error(y_train, y_train_pred)

print('Train Metrics:')
print(f'RMSE: {rmse:.4f}')
print(f'MAE: {mae:.4f}')

print('-'*20)

rmse = mean_squared_error(y_test, y_test_pred)**0.5
mae = mean_absolute_error(y_test, y_test_pred)
print('Test Metrics:')
print(f'RMSE: {rmse:.4f}')
print(f'MAE: {mae:.4f}')


In [None]:
# plot
plt.figure(figsize=(12,4))

plt.plot(pd.Series(y_train, index=y_train_pred.index), label='TrainData', color='#128277')
plt.plot(y_train_pred, label='Train Prediction ', color='lightcoral')

plt.plot(pd.Series(y_test, index=y_test_pred.index) , label='Test Data', color='#6FB98F',)
plt.plot(y_test_pred, label='Test Prediction', color='lightcoral', alpha=0.7, linestyle='--')

plt.title('Evaluación: LSTM en el precio del dolar')
plt.xlabel('Date')
plt.ylabel('Date')
plt.legend()
plt.show()

In [None]:
# plot
plt.figure(figsize=(12,4))

plt.plot(pd.Series(y_test, index=y_test_pred.index), label='Test Data', color='#6FB98F',)
plt.plot(y_test_pred, label='Test Prediction', color='lightcoral', alpha=0.7, linestyle='--')

plt.title('Evaluación: LSSTM en el precio del dolar')
plt.xlabel('Date')
plt.ylabel('Date')
plt.legend()
plt.show()