# Modelo VaR para un portafolio de bonos

**Descripci√≥n general**
-------------------
Este algoritmo reproduce la estimaci√≥n de de sensibilidades (Duraci√≥n, Convexidad) y el VaR para un portafolio de bonos del Tesoro de EE.UU.("US Treasury Bonds") usando Python. El algoritmo permite estimar el VaR Param√©trico/hist√≥rico y con volatilidad EWMA y realizar pruebas de backtesting (por ej. Kupiec).

-----------------------

1. Conexi√≥n y descarga de datos:
   - Se conecta y descarga desde FRED las tasas de bonos del Tesoro a diferentes vencimientos (DGS1MO, DGS3MO, DGS6MO, DGS1, DGS2, DGS3, DGS5, DGS7, DGS10, DGS20, DGS30).
   - Limpia los datos.

2. Construcci√≥n de la curva cero cup√≥n: se usa Bootstrap en Python interpolando tasas para apr√≥ximar la curva.

   Extensiones del algortimo:
    - usar modelos de Nelson & Siegel o Svensson
    - usar QuantLib para bootstrap de curva cero cup√≥n u otra librer√≠a alternativa.

3. Creaci√≥n y valoraci√≥n del portafolio:
   - Define un portafolio de bonos (maturity, cup√≥n, nominal) a distintos plazos.
   - Valora diariamente los bonos con la curva cero cup√≥n obtenida.
   - Calcula el valor total del portafolio.

4. Estimaci√≥n del VaR hist√≥rico:
   - Genera escenarios aplicando shocks.
   - Calcula la distribuci√≥n de p√©rdidas y ganancias (P&L).
   - Obtiene VaR al 99%.

5. Estimaci√≥n del VaR con volatilidad EWMA:
   - Ajusta los retornos hist√≥ricos por volatilidad condicional (EWMA) para reflejar la volatilidad actual del mercado.

   Extensiones del algortimo: usar modelos tipo GARCH(1,1) u otras extensiones.

6. Backtesting:
   - Eval√∫a excepciones (p√©rdidas reales que exceden el VaR).
   - Aplica pruebas estad√≠sticas de Kupiec (proporci√≥n de fallos).



Entradas del algoritmo:
--------
- Series hist√≥ricas de rendimientos/‚Äúpar yields‚Äù del Tesoro a distintos plazos.
- Definici√≥n del portafolio de bonos (vencimiento, cup√≥n, nominal).
- Par√°metros de ventana hist√≥rica, nivel de confianza y lambda EWMA.

Salidas:
-------
- Serie temporal de valores diarios del portafolio.
- Serie de P&L obervados.
- VaR hist√≥rico y EWMA al 99%.
- Resultados de backtesting (estad√≠sticos y p-valores).
- Gr√°ficos opcionales de VaR vs P&L.

Dependencias
------------
Obligatorias:
    *numpy pandas matplotlib scipy pandas_datareader*

Notas adicionales:
-----
- El portafolio puede ampliarse f√°cilmente a m√°s bonos especificando sus caracter√≠sticas.


In [None]:
import numpy as np
import pandas as pd
from scipy import stats
from scipy.interpolate import interp1d             # Reemplaza np.interp()
from pandas_datareader import data as web
import matplotlib.pyplot as plt
# Si se rqueren ajustes en los formatos de fechas
#import datetime
#from datetime import timedelta
#import matplotlib.dates as mdates
import warnings  # Manejo de warnings en las salidas del codigo
warnings.filterwarnings('ignore')

In [None]:
# !pip install --q QuantLib-Python
# import QuantLib as ql

Yields (curva) y bonos
---
Yields por nodos (DGS1MO, DGS3MO,..., DGS30) son cotizaciones de mercado que dan la forma de la curva de tipos de inter√©s (i.e. una tasa por cada vencimiento est√°ndar). Esa curva te permite construir una curva cero cup√≥n (descuento) y, con ella, valorar cualquier bono qe negocie en el mercado y a cualquier vencimiento.

In [None]:
#from pandas_datareader import data as web  # m√≥dulo adecuado para usar FRED
#----------------------------------------------------------------------------
# Descargar y limpiar rendimientos (FRED) ‚Üí df_par (DataFrame, T x M).
!pip install --q fredapi
from fredapi import Fred
fred = Fred(api_key='d3d779c3fb14e77f95d792940ab24895')   # Cambiar el codigo de la API de su cuenta personal

In [None]:
start = '2020-01-01'    # Ajustar las fechas segun la aplicacion a desarrollar
end = '2024-12-31'

In [None]:
## Como funciona "FRED data" (de forma directa)
#fred.search('DGS1MO')  # Market Yield on U.S. Treasury Securities at 10-Year Constant Maturity / #data[start:end]

In [None]:
# Lista de series FRED (Treasury Constant Maturity)
bonds = ['DGS1MO','DGS3MO','DGS6MO','DGS1','DGS2','DGS3','DGS5','DGS7','DGS10','DGS20','DGS30']

# Descarga las series en un DataFrame
bonds_yield = pd.DataFrame()

for bond in bonds:
    series = web.DataReader(bond, 'fred')  # descarga cada serie
    bonds_yield[bond] = series[bond]       # agrega columna con ese nombre

# Limpiar datos faltantes:
bonds_yield = bonds_yield.dropna()  # Los datos se limpian eliminando filas con valores nulos (.dropna())
bonds_yield = bonds_yield / 100     # Las yields se convierten de porcentaje a decimal (dividiendo por 100).

**Nota para el manejo de datos faltantes**: En lugar de usar 'dropna()', que elimina d√≠as (o fechas enteras) si faltan muy pocos datos, podr√≠as usar m√©todos de interpolaci√≥n (.interpolate() o .fillna(0)) para rellenar valores faltantes, lo cual es com√∫n en series de tiempo financieras.

In [None]:
## Verificar info
bonds_yield.head(3)

Unnamed: 0_level_0,DGS1MO,DGS3MO,DGS6MO,DGS1,DGS2,DGS3,DGS5,DGS7,DGS10,DGS20,DGS30
DATE,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
2020-10-05,0.0009,0.001,0.0011,0.0012,0.0014,0.0019,0.0033,0.0055,0.0078,0.0134,0.0157
2020-10-06,0.0008,0.001,0.0011,0.0014,0.0014,0.0017,0.0032,0.0053,0.0076,0.0133,0.0156
2020-10-07,0.0008,0.001,0.0012,0.0013,0.0016,0.0021,0.0035,0.0056,0.0081,0.0137,0.016


In [None]:
plt.figure(figsize=(11,3))
plt.plot(bonds_yield.index,bonds_yield, label=bonds_yield.columns)
plt.title('Yields (Tasas) en cada fecha ')
plt.ylabel('Yields')
plt.legend();

Portafolio de bonos
---
* Instrumento A: 2 a√±os, cup√≥n 2.5%, notional 1,000,000
* Instrumento B: 5 a√±os, cup√≥n 3.0%, notional 2,000,000
* Instrumento C: 10 a√±os, cup√≥n 3.5%, notional 1,000,000


In [None]:
bonos = [
    {'Bono': '2y', 'nocional': 1_000_000, 'cupon': 0.025, 'vencimiento': 2, 'frec_cupon': 2},
    {'Bono': '5y', 'nocional': 2_000_000, 'cupon': 0.030, 'vencimiento': 5, 'frec_cupon': 2},
    {'Bono': '10y', 'nocional': 1_500_000, 'cupon': 0.035, 'vencimiento': 10, 'frec_cupon': 2}
]
pd.DataFrame(bonos)

Unnamed: 0,Bono,nocional,cupon,vencimiento,frec_cupon
0,2y,1000000,0.025,2,2
1,5y,2000000,0.03,5,2
2,10y,1500000,0.035,10,2


# 2.	Convertir par yields Curva Cero Cup√≥n (por fecha) ‚Üí zero_curve (T x M)

Los rendimientos de FRED forman una curva de rendimientos al par (par yield curve). Para valorar correctamente un bono con cupones, necesitamos descontar cada uno de sus flujos de caja futuros (cupones y principal) con la tasa de inter√©s "cero cup√≥n" correspondiente a la fecha de cada flujo.

El bootstrapping es una de las metodolog√≠as que se utilizan para cosntruir la curva cero cup√≥n a partir de la curva al par.

**Bootstrap ‚Üí curva cero cup√≥n**

A partir de los par yields se obtiene la tasa cero cup√≥n para cada nodo (tenor).

**Metodolog√≠a:**

Vencimientos Cortos (T < 1 a√±o): Para tenores $T < 1$ a√±o (ej. 1m, 3m, 6m) se apr√≥xima como instrumento de descuento (Se asume que los instrumentos son de descuento puro).

$$ DF = \frac{1}{(1 + r)^T} ‚âà e^{-r \times T} ‚áí z = \frac{‚àíln(DF)}{T} $$

donde $z$ es la tasa cero en capitalizaci√≥n continua. La tasa cero ($z$) se deriva de la tasa al par (con capitalizaci√≥n simple, $r_{par}$).


Vencimientos Largos (T ‚â• 1 a√±o): Para tenores $T \ge 1$ a√±o con cupones semestrales (freq=2). Se utiliza un proceso iterativo. Si un bono al par vale 100, se despeja el factor de descuento ($DF_m$) del √∫ltimo flujo de caja, utilizando los factores de descuento ya calculados para los cupones anteriores. Si un $DF$ intermedio no se conoce, se interpola linealmente a partir de las tasas cero ya calculadas.

Supongamos $m$ pagos $m = T \times \text{freq}$, cup√≥n por periodo $c = r_{par} / \text{freq}$.

Valor presente de los cupones anteriores (con DFs ya calculados o interpolados):

$$ PV_{known} = \sum_{ùëò=1}^{ùëö‚àí1} c \times 100 \times DF(t_k)$$

Resolver $DF_m$ usando que bono a la par vale 100. Una vez despejado $DF_m$, la tasa cero se calcula como:

$$ z= -ln(DF_m)/T_m $$

**Supuestos y limitaciones**

Interpolaci√≥n de tasas para fechas intermedias usa interpolaci√≥n de tasas continuas (se interpola $-ln(DF)/t#).

Se puede hacer una mejora de esta aplicaic√≥n usando librer√≠as como QuantLib, que manejan convenciones de conteo de d√≠as, fechas de liquidaci√≥n y m√©todos de interpolaci√≥n m√°s sofisticados (ej. log-linear, c√∫bica), produciendo curvas id√©nticas a las del mercado.

### Funciones

In [None]:
def bootstrap_zero_curve(par_rates, tenors_months, coupon_freq=2):
    """Convierte una curva de rendimientos al par a una curva cero cup√≥n continua."""
    tenors_years = np.array(tenors_months, dtype=float) / 12
    zero_rates = np.zeros(len(par_rates))
    dfs_by_time = {}

    for i, (T, r_par) in enumerate(zip(tenors_years, par_rates)):
        if T <= 0: continue
        if T <= 1:
            df = 1 / (1 + r_par * T)
            zero_rates[i] = -np.log(df) / T if df > 0 else 0
        else:
            m = int(round(T * coupon_freq))
            coupon = r_par / coupon_freq
            pv_known_coupons = 0

            # Interpolar DFs para cupones intermedios
            known_times = np.array(sorted(dfs_by_time.keys()))
            if len(known_times) > 0:
                known_zeros = np.array([-np.log(dfs_by_time[t]) / t for t in known_times])
                interp_func = interp1d(known_times, known_zeros, kind='linear', fill_value='extrapolate') # np.interp()

            for k in range(1, m):
                t_k = k / coupon_freq
                if round(t_k, 8) in dfs_by_time:
                    df_k = dfs_by_time[round(t_k, 8)]
                elif len(known_times) > 0:
                    r_interp = float(interp_func(t_k))
                    df_k = np.exp(-r_interp * t_k)
                else: # Para el primer bono largo plazo
                    df_k = 1 / (1 + par_rates[i] * t_k)
                pv_known_coupons += coupon * df_k

            df_m = (1 - pv_known_coupons) / (1 + coupon)
            zero_rates[i] = -np.log(df_m) / T if df_m > 0 else (zero_rates[i-1] if i > 0 else 0)

        dfs_by_time[round(T, 8)] = np.exp(-zero_rates[i] * T)

    return zero_rates

In [None]:
# Mapeo de columnas a tenores (o nodos) en meses
months = [1, 3, 6, 12, 24, 36, 60, 84, 120, 240, 360]   # T < 12 (menor a un a√±o) | T > 12 (mayor a un a√±o)

zero_curves_hist = np.array([bootstrap_zero_curve(row, months) for index, row in bonds_yield.iterrows()])
                                                               # df.iterrows(): (Pandas) se utiliza para iterar sobre las filas de un DataFrame
tenors_years = np.array(months) / 12

In [None]:
plt.figure(figsize=(9,3))
plt.plot(bonds_yield.index,zero_curves_hist, label=months)
plt.title('Tasas cero cup√≥n en cada t')
plt.ylabel('Tasas cero cup√≥n')
plt.legend();

In [None]:
# Un ejemplo: para un fecha t
par_row = bonds_yield.iloc[-1].values
zero_curve_t1 = bootstrap_zero_curve(par_row, months)
print('zero curve (first date):', zero_curve_t1.round(4)*100)

zero curve (first date): [4.16 3.99 3.76 3.56 3.52 3.53 3.66 3.87 4.13 4.84 4.71]


**Otra mejora:** En lugar del bootstrap, puedes modelar la curva con funciones param√©tricas como Nelson-Siegel o su extensi√≥n Svensson. Estos modelos son excelentes para suavizar la curva y obtener tasas para cualquier vencimiento, incluso aquellos sin datos de mercado directos.

# Valoraci√≥n (Pricing) de los bonos

El valor de un portafolio de bonos es la suma de los valores individuales de cada bono. El valor (precio) de un bono individual se calcula como el valor presente de todos sus flujos de caja futuros, descontados con las tasas de la curva cero cup√≥n.

* Se generan cashflows y tiempos (en a√±os) para cada bono: cupones peri√≥dicos + principal.

$$ P = \sum_{i} CF_i\ e^{-z_i \times t_i } $$

Donde $CF_i$ es el flujo de caja en el tiempo $t_i$ y $z_i$ es la tasa cero para ese tiempo.

En el script se valora cada bono del portafolio y se suma en portfolio_values[i].

Nota: la implementaci√≥n usa a√±os y frecuencia fija; no implementa convenciones de day-count (ej., 30/360 o ACT/365).

In [None]:
def get_portfolio_cashflows(portfolio):
    """Pre-calcula los flujos de caja para toda la cartera."""
    portfolio_cfs = []
    for bono in portfolio:
        num_cupones = int(bono['vencimiento'] * bono['frec_cupon'])
        monto_cupon = (bono['cupon'] / bono['frec_cupon']) * bono['nocional']
        tiempos = np.arange(1, num_cupones + 1) / bono['frec_cupon']
        flujos = np.full(num_cupones, monto_cupon)
        flujos[-1] += bono['nocional']
        portfolio_cfs.append({'tiempos': tiempos, 'flujos': flujos})
    return portfolio_cfs

def valor_presente(portfolio_cfs, curve_zero, tenors_years):
    """Funci√≥n de valoraci√≥n que usa flujos de caja pre-calculados."""
    total_pv = 0
    interp_func = interp1d(tenors_years, curve_zero, kind='linear', fill_value='extrapolate')

    for bono_cfs in portfolio_cfs:
        tasas_cero = interp_func(bono_cfs['tiempos'])
        factores_descuento = np.exp(-tasas_cero * bono_cfs['tiempos'])
        total_pv += np.sum(bono_cfs['flujos'] * factores_descuento)
    return total_pv

def portfolio_pv_and_sensitivities(portfolio_cfs, curve_zero, tenors_years, shock=0.0001):
    pv_base = valor_presente(portfolio_cfs, curve_zero, tenors_years)

    pv_up = valor_presente(portfolio_cfs, curve_zero + shock, tenors_years)
    pv_down = valor_presente(portfolio_cfs, curve_zero - shock, tenors_years)

    duration = (pv_down - pv_up) / (2 * pv_base * shock) if pv_base else 0
    convexity = (pv_down + pv_up - 2 * pv_base) / (pv_base * shock**2) if pv_base else 0

    return pv_base, duration, convexity

In [None]:
portfolio_cfs = get_portfolio_cashflows(bonos)
portfolio_pv, portfolio_duration, portfolio_convexity = portfolio_pv_and_sensitivities(portfolio_cfs,
                                                                                       zero_curve_t1, tenors_years)


In [None]:
# Valor del portafolio y sensibilidades
print("\n VALOR Y SENSIBILIDADES")
print(f"   - Valor Presente del Portafolio: ${portfolio_pv:,.2f}")
print(f"   - Duraci√≥n Modificada: {portfolio_duration:.4f}")

Estimaci√≥n del VaR Hist√≥rico y P&L diario
---
El Value at Risk (VaR) es una medida de riesgo que estima la p√©rdida m√°xima potencial de un portafolio en un horizonte de tiempo determinado (ej. 1 d√≠a) con un nivel de confianza espec√≠fico (ej. 95% o 99%).
El m√©todo de VaR Hist√≥rica consiste en:

* Observar los cambios hist√≥ricos (shocks) en los factores de riesgo (en este caso, las tasas de la curva cero).

* Aplicar cada uno de esos shocks hist√≥ricos al estado actual de los factores de riesgo para generar una serie de escenarios futuros hipot√©ticos.

* Revalorar el portafolio en cada uno de estos escenarios.

* Construir una distribuci√≥n de p√©rdidas y ganancias (P&L) y encontrar el percentil correspondiente al nivel de confianza.


**Implementaci√≥n**

* Se calculan los cambios diarios hist√≥ricos (retornos) de todas las tasas de la curva cero: zero_returns = returns_matrix(zero_curves)

* Se itera a trav√©s de la "ventana de prueba" (test window). Para cada d√≠a t:

* Se toma la curva cero del d√≠a anterior (t-1): prev_tenors = zero_curves[t-1, :].

* Se aplican los √∫ltimos 250 retornos hist√≥ricos (lookback) a esa curva para generar 250 escenarios de curvas futuras (aqu√≠ es donde se debe aplicar la correcci√≥n a retornos logar√≠tmicos).

* Se revalora el portafolio en cada uno de los 250 escenarios: zeros_s ‚Üí obtenemos PortValues_scen[s].

* Se calcula el P&L simulado para cada escenario (Valor del escenario - Valor en t-1): SimulatedPandL[s] = PortValues_scen[s] - portfolio_values[t-1].

* La funci√≥n historical_var ordena las p√©rdidas y extrae el percentil 95 y 99 para obtener el VaR: devuelve el percentil de la distribuci√≥n SimulatedPandL.

**Nota**: sobre retornos vs log-returns: aplicar retornos relativos (1 + r) puede producir curvas negativas si las tasas son peque√±as y cambios negativos muy grandes.

In [None]:
def calculate_analytical_var(precio, duracion, volatilidad, z_alpha):
    return precio * duracion * (volatilidad * z_alpha)

def kupiec_pof_test(failures, n_obs, alpha):
    if n_obs == 0: return 1.0, 1.0
    failure_rate = np.clip(failures / n_obs, 1e-9, 1 - 1e-9)
    log_l0 = failures * np.log(failure_rate) + (n_obs - failures) * np.log(1 - failure_rate)
    log_l1 = failures * np.log(alpha) + (n_obs - failures) * np.log(1 - alpha)
    lr_stat = -2 * (log_l1 - log_l0)
    return 1 - stats.chi2.cdf(lr_stat, 1)

In [None]:
# C. Par√°metros de Riesgo
alpha = 0.99
z_alpha = stats.norm.ppf(alpha)
T = 250
lambd = 0.94
volatilidad = 0.0008

var_param = calculate_analytical_var(portfolio_pv, portfolio_duration, volatilidad, z_alpha)

print("\n VaR Param√©trico")
print(f"   - VaR a 1 d√≠a al {alpha*100:.0f}%: ${var_param:,.2f}")

Backtesting
---
El backtesting es el proceso de validar la precisi√≥n de un modelo de VaR comparando sus predicciones con las p√©rdidas y ganancias reales observadas.

**Prueba de Kupiec (Proporci√≥n de Fallos)**: Eval√∫a si el n√∫mero de excepciones (d√≠as en que la p√©rdida real excedi√≥ el VaR) es consistente con el nivel de confianza. Por ejemplo, para un VaR al 99%, se espera una excepci√≥n cada 100 d√≠as.

**Implementaci√≥n**

* Se identifican los d√≠as en que la p√©rdida real fue mayor que el VaR predicho.

* Se implementan las pruebas de ratio de verosimilitud (likelihood ratio) para Kupiec, calculando el estad√≠sticos LR y su p-valor a partir de una distribuci√≥n Chi-cuadrado.

* Un p-valor alto (generalmente > 0.05) indica que no se puede rechazar la hip√≥tesis nula de que el modelo es correcto.

Estimaci√≥n del VaR con Volatilidad EWMA (Simulaci√≥n Hist√≥rica Filtrada)
---

La simulaci√≥n hist√≥rica simple asume que los retornos pasados son igualmente probables en el futuro. Esto puede ser problem√°tico si la volatilidad del mercado ha cambiado recientemente. La Simulaci√≥n Hist√≥rica ajusta los retornos hist√≥ricos para que reflejen la volatilidad actual del mercado. Se utiliza un modelo como EWMA para dar m√°s peso a las observaciones recientes al calcular la volatilidad.

$$ \sigma_t^2 =Œª \sigma_{t‚àí1}^2 +(1-Œª)r_{t‚àí1}^2 $$


**Implementaci√≥n:**

Cuando EWMA=True, para cada d√≠a t en la ventana de prueba:

* Se calculan las volatilidades hist√≥ricas de los retornos de cada tasa en la ventana de 250 d√≠as.

* Se calcula la matriz de covarianza EWMA y de ella se extraen las volatilidades actuales para cada tasa: latest_sigma = sqrt(diag(S)) (Calcular hist_sigma como desviaci√≥n est√°ndar hist√≥rica de cada nodo).

* Los retornos de periodos de alta volatilidad pasada se amplifican si la volatilidad actual es alta, y viceversa.


In [None]:
def portfolio_analysis(par_df, portfolio_def, tenors_months, lookback, alpha, ewma_lambda):
    T, M = par_df.shape
    tenors_years = np.array(tenors_months) / 12

    print("1. Realizando bootstrapping para todas las fechas...")
    zero_curves = np.array([bootstrap_zero_curve(row.values, tenors_months) for _, row in par_df.iterrows()])

    print("2. Pre-calculando flujos de caja del portafolio...")
    portfolio_cfs = get_portfolio_cashflows(portfolio_def)

    print("3. Calculando valor hist√≥rico del portafolio y P&L...")
    portfolio_values = np.array([valor_presente(portfolio_cfs, zc, tenors_years) for zc in zero_curves])
    actual_pnl = np.diff(portfolio_values)

    zero_log_returns = np.diff(np.log(zero_curves + 1e-9), axis=0)

    print("4. Iniciando simulaci√≥n de VaR...")
    test_window_start = lookback + 1
    test_window_indices = np.arange(test_window_start, T)

    var_series_hs = np.zeros(len(test_window_indices))
    var_series_ewma = np.zeros(len(test_window_indices))

    for i, t in enumerate(test_window_indices):
        prev_zeros = zero_curves[t-1]
        lookback_idx = range(t - lookback - 1, t - 1)

        historical_log_returns = zero_log_returns[lookback_idx, :]

        # VaR Hist√≥rico
        scenario_curves_hs = prev_zeros * np.exp(historical_log_returns)
        scenario_pnl_hs = np.array([valor_presente(portfolio_cfs, sc, tenors_years) - portfolio_values[t-1] for sc in scenario_curves_hs])
        var_series_hs[i] = -np.percentile(scenario_pnl_hs, 100 * (1-alpha))

        # VaR Hist√≥rico con EWMA
        arithmetic_returns = np.exp(historical_log_returns) - 1
        S = np.cov(arithmetic_returns, rowvar=False)                  # Iniciar con cov hist√≥rica
        for r in arithmetic_returns:
            S = ewma_lambda * S + (1 - ewma_lambda) * np.outer(r, r)  # ope. los vectores

        latest_sigma = np.sqrt(np.diag(S) + 1e-9)
        hist_sigma = np.std(arithmetic_returns, axis=0, ddof=1) + 1e-9
        scaling_factor = latest_sigma / hist_sigma

        scaled_log_returns = historical_log_returns * scaling_factor
        scenario_curves_ewma = prev_zeros * np.exp(scaled_log_returns)
        scenario_pnl_ewma = np.array([valor_presente(portfolio_cfs, sc, tenors_years) - portfolio_values[t-1] for sc in scenario_curves_ewma])
        var_series_ewma[i] = -np.percentile(scenario_pnl_ewma, 100 * (1-alpha))

    print("5. Realizando backtesting...")
    actual_pnl_for_backtest = actual_pnl[test_window_indices - 1]

    exceptions_hs = actual_pnl_for_backtest < -var_series_hs
    exceptions_ewma = actual_pnl_for_backtest < -var_series_ewma

    n_obs_backtest = len(actual_pnl_for_backtest)
    p_kupiec_hs = kupiec_pof_test(np.sum(exceptions_hs), n_obs_backtest, alpha)
    p_kupiec_ewma = kupiec_pof_test(np.sum(exceptions_ewma), n_obs_backtest, alpha)

    backtest_results = {
        'hs': {'exceptions': np.sum(exceptions_hs), 'n_obs': n_obs_backtest, 'kupiec_p': p_kupiec_hs},
        'ewma': {'exceptions': np.sum(exceptions_ewma), 'n_obs': n_obs_backtest, 'kupiec_p': p_kupiec_ewma}
    }

    return {
        'portfolio_values': portfolio_values,
        'actual_pnl': actual_pnl,
        'var_series_hs': var_series_hs,
        'var_series_ewma': var_series_ewma,
        'test_window_indices': test_window_indices,
        'backtest': backtest_results
    }

In [None]:
# Ejecutar la simulaci√≥n y el backtesting
results = portfolio_analysis(bonds_yield, bonos, months, T, alpha, lambd)

In [None]:
print("\nC. Resultados VaR")
print(f"   - VaR Hist√≥rico: ${results['var_series_hs'][-1]:,.2f}")
print(f"   - VaR Hist√≥rico con EWMA: ${results['var_series_ewma'][-1]:,.2f}")

print("\n RESULTADOS DEL BACKTESTING")
res_hs = results['backtest']['hs']
res_ewma = results['backtest']['ewma']
print("\n   Resultados para VaR Hist√≥rico Simple:")
print(f"     - Observaciones: {res_hs['n_obs']}")
print(f"     - Excepciones: {res_hs['exceptions']} (Tasa de fallo: {res_hs['exceptions']/res_hs['n_obs']:.2%})")
print(f"     - Test de Kupiec (POF): p-value = {res_hs['kupiec_p']:.4f} {'(Modelo OK)' if res_hs['kupiec_p'] > 0.05 else '(Modelo RECHAZADO)'}")

print("\n   Resultados para VaR Hist√≥rico Filtrado (EWMA):")
print(f"     - Observaciones: {res_ewma['n_obs']}")
print(f"     - Excepciones: {res_ewma['exceptions']} (Tasa de fallo: {res_ewma['exceptions']/res_ewma['n_obs']:.2%})")
print(f"     - Test de Kupiec (POF): p-value = {res_ewma['kupiec_p']:.4f} {'(Modelo OK)' if res_ewma['kupiec_p'] > 0.05 else '(Modelo RECHAZADO)'}")

**Gr√°fico del Valor del Portafolio**

Muestra la evoluci√≥n del valor total de mercado de tu portafolio a lo largo del tiempo.

In [None]:
portfolio_values = results['portfolio_values']
# Valor del Portafolio
plt.figure(figsize=(10, 3))
plt.plot(bonds_yield.index, portfolio_values, label='Valor del Portafolio')
plt.title('Valor de Mercado del Portafolio')
plt.xlabel('Fecha')
plt.ylabel('Valor de Mercado ($)')
plt.legend();

In [None]:
# Backtesting de VaR
test_indices = results['test_window_indices']
test_dates = bonds_yield.index[test_indices]
pnl_for_plot = results['actual_pnl'][test_indices - 1]

plt.figure(figsize=(12, 6))
plt.plot(test_dates, pnl_for_plot, label='P&L Actual', color='gray', alpha=0.7, linewidth=1.5, zorder=1)
plt.plot(test_dates, -results['var_series_hs'], label=f'VaR {alpha*100:.0f}% Hist√≥rico', color='blue', linestyle='--', zorder=2)
plt.plot(test_dates, -results['var_series_ewma'], label=f'VaR {alpha*100:.0f}% EWMA', color='red', linestyle=':', zorder=3)

# Marcar las excepciones del modelo EWMA (suele ser m√°s interesante)
exceptions_plot = pnl_for_plot < -results['var_series_ewma']
plt.scatter(test_dates[exceptions_plot], pnl_for_plot[exceptions_plot],
               color='red', marker='o', s=50, label='Excepciones (EWMA)', zorder=4, facecolors='none', edgecolors='k')

plt.title('Backtesting: P&L Actual vs. VaR Pron√≥sticado')
plt.xlabel('Fecha')
plt.ylabel('P√©rdida y Ganancia ($)')
plt.legend();

Mejoras y Extensiones Sugeridas:
---

**Construcci√≥n de la Curva**: El m√©todo de bootstrap es funcional, pero se puede mejorar significativamente para obtener una curva m√°s suave y realista, lo que impactar√° directamente en la precisi√≥n de la valoraci√≥n y c√°lculos de sensibilidades (medidas de riesgo).

Por ejemplo, los modelos Param√©tricos  de Nelson-Siegel y/o Svensson. En lugar de la interpolaci√≥n lineal del bootstrap, puedes ajustar la curva de tasas a un modelo param√©trico.

**Modelo GARCH**: EWMA es un caso particular de los modelos GARCH. Un modelo GARCH(1,1) es m√°s flexible, ya que permite que la volatilidad revierta a una media a largo plazo, lo que a menudo es m√°s realista que el supuesto de EWMA.

Notas finales:
---

**¬øPor qu√© el ejemplo define solo tres bonos si tengo yields para muchos vencimientos?**

Hay varias razones, pr√°cticas y did√°cticas, para usar un peque√±o conjunto de bonos representativos en el ejemplo:

a) Suficiencia para exponer riesgo: Tres bonos ‚Äúbien elegidos‚Äù (uno corto, uno medio, uno largo) capturan la mayor parte del riesgo de tasa de inter√©s (duration y convexity) a lo largo de la curva. Para muchos prop√≥sitos ilustrativos ‚ÄîVaR, backtest‚Äî eso es suficiente.

b) Simplicidad / claridad did√°ctica: El ejemplo busca que se entienda el flujo: bootstrap ‚Üí pricing ‚Üí escenarios ‚Üí VaR.

c) Representatividad y liquidez: En mercados reales se suelen usar bonos liquidos en ciertos vencimientos (ej.: 2y, 5y, 10y, 30y). Un subconjunto seleccionado cubre las partes l√≠quidas de la curva.


**¬øCu√°ndo conviene usar m√°s bonos? (y c√≥mo elegirlos)**

Usa m√°s bonos cuando tu objetivo sea alguno de estos:

* Replicar exactamente la curva o replicar exposiciones a todos los tenores: necesitar√°s instrumentos que cubran toda la estructura.

* Replicar o seguir un √≠ndice (index-tracking).

* Hacer an√°lisis de Cobertura(hedging) / immunizaci√≥n.

Criterios de selecci√≥n pr√°ctica:

* Elige tenores representativos: por ejemplo 1y, 2y, 5y, 7y, 10y, 20y, 30y.

* Si buscas reproducir la curva: puedes resolver un problema de m√≠nimos cuadrados para hallar cantidades q_j que minimicen la diferencia entre precios/DFs objetivo y los del portafolio replicante.


In [None]:
print('Fin del ejemplo')