---
title: "Cómputo de los Errores Condicionales"
author: "DIE"
format: 
    revealjs:
        scrollable: true
        incremental: false
        slide-number: true
        smaller: true
        progress: true
        controls: true
        controls-back-arrows: faded
        center: true
---

```{css, echo=FALSE}
.reveal code {
  max-height: 100% !important;
}
```


El cálculo de los errores condicionales se fundamenta en el documento *"Criteria for SVAR Model Selection: A Proposal"*, el cual introduce una notación específica para organizar los conjuntos de datos y los resultados derivados del modelo.

## Repaso de Notación

---

Se denota por $t$ el índice de tiempo, el cual puede tomar valores dentro del conjunto $\lbrace 0, 1, \dots, T, T+1, T+2, \dots, V \rbrace$.

A partir de esta secuencia, se definen dos subconjuntos relevantes: el conjunto de entrenamiento 

$$
\mathcal{T} = \lbrace 0, 1, \dots, T \rbrace
$$ 

y el conjunto de validación 

$$
\mathcal{V} = \lbrace T+1, T+2, \dots, V \rbrace
$$

---

A partir del *conjunto de entrenamiento*, se estiman los parámetros: $\hat{A}_{0, \mathcal{T}}$, $\hat{A}_{1, \mathcal{T}}$ y $\hat{B}_{0, \mathcal{T}}$. 

Estos parámetros permiten generar pronósticos incondicionales (**fuera de muestra**) a horizonte 1, definidos como 

$$
\hat{y}_{t|t-1,u,\mathcal{T},\mathcal{V}} = \hat{A}_{0, \mathcal{T}} + \hat{A}_{1, \mathcal{T}} y_{t-1}
$$ 

para todo $t$ en el conjunto de validación $\mathcal{V}$.

La diferencia entre los valores observados $y_t$ y sus pronósticos genera los residuos incondicionales 

$$
\hat{e}_{t|t-1,u,\mathcal{T},\mathcal{V}} = y_t - \hat{y}_{t|t-1,u,\mathcal{T},\mathcal{V}}
$$

Aplicando la matriz $\hat{B}_{0, \mathcal{T}}$ sobre estos residuos se obtienen los choques estructurales correspondientes al pronóstico incondicional: 

$$
\hat{w}_{t|t-1,\mathcal{T},\mathcal{V}} = \hat{B}_{0, \mathcal{T}} \hat{e}_{t|t-1,u,\mathcal{T},\mathcal{V}}
$$

---

Adicionalmente, se estiman en el *conjunto de validación*: $\hat{A}_{0, \mathcal{V}}$, $\hat{A}_{1, \mathcal{V}}$ y $\hat{B}_{0, \mathcal{V}}$. 

Estos parámetros permiten generar pronósticos incondicionales (**dentro de muestra**) a horizonte 1, definidos como 

$$
\hat{y}_{t|t-1,u,\mathcal{V},\mathcal{V}} = \hat{A}_{0, \mathcal{V}} + \hat{A}_{1, \mathcal{V}} y_{t-1}
$$ 

para todo $t$ en el conjunto de validación $\mathcal{V}$.

A partir de estos pronósticos dentro de muestra se calculan los correspondientes residuos:

$$
\hat{e}_{t|t-1,u,\mathcal{V},\mathcal{V}} = y_t - \hat{y}_{t|t-1,u,\mathcal{V},\mathcal{V}}
$$

Y aplicando la matriz $\hat{B}_{0, \mathcal{V}}$ sobre estos residuos se obtienen los choques estructurales correspondientes: 

$$
\hat{w}_{t|t-1,\mathcal{V},\mathcal{V}} = \hat{B}_{0, \mathcal{V}} \hat{e}_{t|t-1,u,\mathcal{V},\mathcal{V}}
$$

---

Los **errores condicionales** son, entonces:

$$
\hat{e}_{t|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}} = 
    y_t - \hat{y}_{t|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}}, \, \forall t \in \mathcal{V}
$$

en donde el pronóstico condicional $\hat{y}_{t,c,\mathcal{T},\mathcal{V},\mathcal{V}}$ se define como:

$$
\hat{y}_{t|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}} = 
    \hat{A}_{0, \mathcal{T}} + \hat{A}_{1, \mathcal{T}} y_{t-1} +
    \hat{B}_{0, \mathcal{T}}^{-1} \hat{w}_{t|t-1,\mathcal{V},\mathcal{V}}, \, \forall t \in \mathcal{V}
$$

## Algoritmo de Cómputo

---

Para computar los errores condicionales, requerimos:

- Una muestra de estimación $\mathcal{T}$.
- Una muestra de validación $\mathcal{V}$.
- Una parametrización en la muestra de estimación: $\hat{A}_{0, \mathcal{T}}$, $\hat{A}_{1, \mathcal{T}}$ y $\hat{B}_{0, \mathcal{T}}$.
- Una parametrización en la muestra de validación: $\hat{A}_{0, \mathcal{V}}$, $\hat{A}_{1, \mathcal{V}}$ y $\hat{B}_{0, \mathcal{V}}$.
- Los choques estructurales computados a partir de la parametrización en la muestra de validación $\mathcal{V}$, y los pronósticos dentro de muestra en el mismo conjunto de validación: $\hat{w}_{t,\mathcal{V},\mathcal{V}}$.

---

Con estos componentes, el objetivo es calcular 

$$
\hat{e}_{t|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}} = 
    y_t - \hat{y}_{t|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}}, \, \forall t \in \mathcal{V}
$$

Sin embargo, también estamos interesados en los errores condicionales a horizontes mayores, es decir:

$$
\hat{e}_{t+1|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}} = 
    y_{t+1} - \hat{y}_{t+1|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}}, \, \forall t+1 \in \mathcal{V}
$$

$$
\hat{e}_{t+2|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}} = 
    y_{t+2} - \hat{y}_{t+2|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}}, \, \forall t+2 \in \mathcal{V}
$$
$$
\vdots
$$

Todos estos errores comparten la misma condición inicial en $t-1$, y se diferencian únicamente en el horizonte de validación.

¿Cómo se genera un error de pronóstico condicional a un horizonte $h$, $\hat{e}_{t+h-1|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}}$?

---

1. Primero, necesitamos calcular los choques estructurales en la muestra de validación con parametrización en la misma muestra: $\hat{w}_{t+h-1|t-1,\mathcal{V},\mathcal{V}}$.

$$
\hat{y}_{t+h-1|t-1,u,\mathcal{V},\mathcal{V}} = 
    \hat{A}_{1, \mathcal{V}}^h y_{t-1} + 
    \sum_{i=1}^{h} \hat{A}_{1, \mathcal{V}}^{i-1} \hat{A}_{0, \mathcal{V}}
$$ 

$$
\hat{e}_{t+h-1|t-1,u,\mathcal{V},\mathcal{V}} = y_{t+h-1} - \hat{y}_{t+h-1|t-1,u,\mathcal{V},\mathcal{V}}
$$
$$
\hat{w}_{t+h-1|t-1,\mathcal{V},\mathcal{V}} = \hat{B}_{0, \mathcal{V}} \hat{e}_{t+h-1|t-1,u,\mathcal{V},\mathcal{V}}
$$

---

2. Luego, con los choques generados en la muestra de validación, generamos los pronósticos condicionales:

$$
\hat{y}_{t+h-1|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}} = 
    \hat{y}_{t+h-1|t-1,u,\mathcal{T},\mathcal{V}} +
    \hat{B}_{0, \mathcal{T}}^{-1} \hat{w}_{t+h-1|t-1,\mathcal{V},\mathcal{V}}
$$

$$
\hat{y}_{t+h-1|t-1,u,\mathcal{T},\mathcal{V}} = 
    \hat{A}_{1, \mathcal{T}}^h y_{t-1} + 
    \sum_{i=1}^{h} \hat{A}_{1, \mathcal{T}}^{i-1} \hat{A}_{0, \mathcal{T}}
$$ 

3. Con los pronósticos condicionales, podemos calcular los errores condicionales:

$$
\hat{e}_{t+h-1|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}} = 
    y_{t+h-1} - \hat{y}_{t+h-1|t-1,c,\mathcal{T},\mathcal{V},\mathcal{V}}
$$

---

Los pasos 1, 2 y 3 corresponden al procedimiento implementado en el método `computeConditionalValidationErrors`.

---

Una diferencia entre los modelos SVAR y aquellos utilizados en la herramienta de selección radica en las variables reconstruidas que completan las ecuaciones del modelo. 

Por esta razón, el método `computeConditionalValidationErrors` aprovecha las funciones `simulate` y `filter` del paquete `IRIS`, que permiten generar pronósticos condicionales para todas las variables, incluidas las reconstruidas.

---

La función `iris/filter` se utiliza para generar los choques en el paso 1. 

La dificultad radica en que esta función siempre calcula los choques condicionando en la observación anterior, es decir:

| Condición Inicial | Pronóstico Incondicional | Choque calculado con `iris/filter` | Choque deseado |
|-|-|-|-|
$y_{t-1}$ | $\hat{y}_{t|t-1}$ | $w_{t|t-1}$ | $w_{t|t-1}$ |
$y_{t-1}$ | $\hat{y}_{t+1|t-1}$ | $w_{t+1|t}$ | $w_{t+1|t-1}$ |
$y_{t-1}$ | $\hat{y}_{t+2|t-1}$ | $w_{t+2|t+1}$ | $w_{t+2|t-1}$ |
$\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |

---

Supongamos que tenemos un `SubsampleModel` estimado entre 2005Q1 y 2015Q4. El período de validación se define de 2016Q1 a 2024Q4.

En la primera iteración dentro de la muestra de validación, se tendría lo siguiente:

| Condición Inicial | Pronóstico Incondicional | Choque calculado con `iris/filter` | Choque deseado |
|-|-|-|-|
$y_{2015Q4}$ | $\hat{y}_{2016Q1|2015Q4}$ | $\hat{w}_{2016Q1|2015Q4}$ | $\hat{w}_{2016Q1|2015Q4}$ |
$y_{2015Q4}$ | $\hat{y}_{2016Q2|2015Q4}$ | $\hat{w}_{2016Q2|2016Q1}$ | $\hat{w}_{2016Q2|2015Q4}$ |
$y_{2015Q4}$ | $\hat{y}_{2016Q3|2015Q4}$ | $\hat{w}_{2016Q3|2016Q2}$ | $\hat{w}_{2016Q3|2015Q4}$ |
$\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |

:Iteración 1. Condición inicial de los pronósticos en 2015Q4

---

| Condición Inicial | Pronóstico Incondicional | Choque calculado con `iris/filter` | Choque deseado |
|-|-|-|-|
$y_{2016Q1}$ | $\hat{y}_{2016Q2|2016Q1}$ | $\hat{w}_{2016Q2|2016Q1}$ | $\hat{w}_{2016Q2|2015Q4}$ |
$y_{2016Q1}$ | $\hat{y}_{2016Q3|2016Q1}$ | $\hat{w}_{2016Q3|2016Q2}$ | $\hat{w}_{2016Q3|2015Q4}$ |
$y_{2016Q1}$ | $\hat{y}_{2016Q4|2016Q1}$ | $\hat{w}_{2016Q4|2016Q3}$ | $\hat{w}_{2016Q4|2015Q4}$ |
$\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |

:Iteración 2. Condición inicial de los pronósticos en 2016Q1

---

Puntos importantes sobre el funcionamiento de `iris/filter`:

- Aunque se actualicen las condiciones iniciales de pronóstico iterativamente, los choques calculados son siempre a horizonte 1.
- La función no permite especificar una condición inicial distinta del dato inmediatamente anterior.

Por tanto, aplicar `iris/filter` directamente no es suficiente. 

---

La solución consiste en aplicar `iris/filter` de manera iterativa, sustituyendo las observaciones por los pronósticos incondicionales para generar el comportamiento deseado.

| Nota | Condición Inicial | Pronóstico Incondicional | Choque calculado con `iris/filter` | Choque deseado |
|-|-|-|-|-|
|| $y_{t-1}$ | $\hat{y}_{t|t-1}$ | $\hat{w}_{t|t-1}$ | $\hat{w}_{t|t-1}$ |
| Se sustituye manualmente $y_t$ por $\hat{y}_{t|t-1}$ y se aplica `iris/filter` por segunda vez. | $\hat{y}_{t|t-1}$ | $\hat{y}_{t+1|t-1}$ | $\hat{w}_{t+1|t-1}$ | $\hat{w}_{t+1|t-1}$ |
|| $\hat{y}_{t+1|t-1}$ | $\hat{y}_{t+2|t-1}$ | $\hat{w}_{t+2|t-1}$ | $\hat{w}_{t+2|t-1}$ |
|| $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |

---

Una vez obtenidos los choques correctos, se ejecuta lo descrito en el paso 2, condicionando los pronósticos con `simulate` y utilizando `exogenize/endogenize`.

Por defecto, `simulate` trata los choques como exógenos, por lo que basta con añadir los choques anteriores a las condiciones iniciales mediante un `dboverlay`.

---

Finalmente, el paso 3 es análogo a `computeValidationErrors`, calculando los errores de pronóstico condicionales.

## Recorrido sobre la implementación

---

```matlab
m1 = m1.computeConditionalValidationErrors(12);
m1.modelResults.conditionalValidationErrors
```

El argumento en al función indica el horizonte de pronóstico máximo a evaluar.

Por defecto este es igual a 12. 

---

Examinando dentro de la definición de `computeConditionalValidationErrors` destacan las funciones `computeForwardShocks` y `computeConditionalForecast`, correspondientes al paso 1 y 2 del algoritmo de cómputo. 

```matlab
function obj = computeConditionalValidationErrors(obj, max_horizon)
    ...
    tic
    shocks_validation_insample = computeForwardShocks( ...
        obj_validation, ...
        obj_validation.validationStart:obj_validation.validationEnd, ...
        model_observables, ...
        smoothing_start_date, ...
        max_horizon ...
    );
    toc
    ...
    tic
    conditional_forecasted_variables = computeConditionalForecast(...
        obj, ...
        model_observables, ...
        shocks_validation_insample, ...
        max_horizon ...
    );
    toc
    ...
end   
```

---

Ejemplo con un `RestrictedOLSModel`:

```matlab
m1 = ModelClasses.RestrictedOLSModel( ...
    identifier, ...
    data, ...
    qq(2005, 1), ...
    qq(2015, 4), ...
    qq(2016, 1), ...
    qq(2024, 4), ...
    iris_model_path, ...
    @setparam_SVAR50_4B, ...
    endogenous_vars, ...
    restriction_matrix, ... 
    estimation_options ...
);
```

---

La estimación en el la muestra de validación se realiza clonando el objeto `obj` y sustituyendo la muestra de estimación por la de validación: 

```matlab
function obj = computeConditionalValidationErrors(obj, max_horizon)
    arguments
        obj,
        max_horizon = 12
    end

    ...

    obj_validation = obj;
    obj_validation.estimationStart = obj.validationStart;
    obj_validation.estimationEnd = obj.validationEnd;
    
    fprintf('estimating the model in the validation set...\n');
    obj_validation = obj_validation.estimate();

    ...

    end
```

---

Comprabando que la muestra de estimación es la misma que la muestra de validación:

```
[obj_validation.estimationStart, obj_validation.validationStart]
ans = 

  1x2 QUARTERLY Date(s)

    {'2016Q1'}    {'2016Q1'}

[obj_validation.estimationEnd, obj_validation.validationEnd]
ans = 

  1x2 QUARTERLY Date(s)

    {'2024Q4'}    {'2024Q4'}

```

---

El inicio de todos los filtros, por simplicidad, será la fecha inicial en los datos observados: 

```matlab
smoothing_start_date = min( ...
    structfun( ...
        @(x) x.Range(1), ...
        model_observables ...
    ) ...
);

smoothing_start_date = 

  1x1 QUARTERLY Date(s)

    {'2001Q1'}
```

---

`computeForwardShocks` tiene los siguientes argumentos: 

```matlab
...

    shocks_validation_insample = computeForwardShocks( ...
        ... % Objeto estimado en la muestra de validación
        obj_validation, ... 
        ... % Rango en donde vamos a calcular los choques (dentro de muestra)
        obj_validation.validationStart:obj_validation.validationEnd, ...
        ... % Datos observados
        model_observables, ...
        ... % Fecha de inicio para todos los filtros
        smoothing_start_date, ...
        ... % Horizonte máximo de pronóstico
        max_horizon ...
    );

...
```

---

En la definición de `computeForwardShocks`, la parte más importante es el siguiente bucle:

```matlab

    % forward_shocks_rng fue definido en los argumentos como:
    % obj_validation.validationStart:obj_validation.validationEnd
    first_initial_condition_date = forward_shocks_rng(1) - 1;

    m = length(forward_shocks_rng);
    
    for h = 1:m
        % cada iteración de h actualiza las condiciones iniciales del pronóstico    
        initial_condition_date = first_initial_condition_date + h - 1;
        validation_start_date = initial_condition_date + 1;
        validation_end_date = validation_start_date + max_horizon - 1;

        % Esta rutina debe aplicarse en cada fecha de validación, ya que el 
        % filtro de Kalman solo estima shocks condicionados en t|t-1. Para lograr t|t₀,
        % se deben actualizar manualmente las condiciones iniciales con el pronóstico incondicional.
        tmp_observables = model_observables;
        
```

---


```matlab
        for v = validation_start_date:validation_end_date
            % Calculamos los shocks estructurales para los datos imputados en v (o t),
            % usando `initial_condition_date` como t₀ para la condición inicial.
            [~, s_data] = filter( ...
                obj.irisModel, ...
                tmp_observables, ...
                smoothing_start_date:v, ...
                'meanOnly=', true, ...
                'data=', 'smooth', ...
                'condition=', observables_names ...
            );
            % Pronostico incondicional
            [~, p_data] = filter( ...
                obj.irisModel, ...
                tmp_observables, ...
                smoothing_start_date:v, ...
                'meanOnly=', true, ...
                'data=', 'predict' ...
            );
            p_data = p_data * observables_names;
            p_data = dbclip(p_data, v);

```

---

```matlab
            % Reemplazar el valor observado en v con su pronóstico incondicional 
            % para simular un proceso de pronóstico recursivo hacia adelante.
            tmp_observables = dboverlay( ...
                tmp_observables, ... data with obs in v
                p_data ... substituting the obs in v for the unconditional forecast
            );
            ...
        end
        ...
    end
```

---

Si `h=1` entonces obtenemos los siguiente resultados:

```
>> first_initial_condition_date = 

  1x1 QUARTERLY Date(s)

    {'2015Q4'}

>> initial_condition_date = first_initial_condition_date + h - 1

initial_condition_date = 

  1x1 QUARTERLY Date(s)

    {'2015Q4'}

>> validation_start_date = initial_condition_date + 1

validation_start_date = 

  1x1 QUARTERLY Date(s)

    {'2016Q1'}         

>> validation_end_date = validation_start_date + max_horizon - 1

validation_end_date = 

  1x1 QUARTERLY Date(s)

    {'2018Q4'}
```