### <span style="color:red">CONFIGURACIÓN: EJECUTAR UNA SOLA VEZ CUANDO SE INICIA EL COLAB.</span>

In [None]:
!git clone https://github.com/mayala-afi/econometria-mf.git

%cd econometria-mf

!pip install -q -r requirements.txt

## SESIÓN 1 : MCO (OLS)

### Importación de librerías

In [None]:
import pandas as pd
import numpy as np
from utils import plot_resid, predict_plot

import statsmodels.api as sm

from statsmodels.tsa.api import VAR
from statsmodels.stats.diagnostic import het_breuschpagan, acorr_breusch_godfrey

import warnings

warnings.filterwarnings("ignore")

### 1. Carga de datos

In [None]:
df = pd.read_stata("./data/base1.dta")

### 2. Crear fecha trimestral y declaración de serie temporal

In [None]:
df["year"] = df["time"].str.slice(0, 4).astype(int) # Extraemos el año
df["quarter"] = df["time"].str.slice(6, 7).astype(int) # Extraemos el trimestre

df["t"] = pd.PeriodIndex.from_fields(year=df["year"], quarter=df["quarter"], freq="Q") # Creamos la columna de fecha trimestral
df.set_index("t", inplace=True) # Pasamos la columna de fecha creada a índice

### 3. Limpieza y renombrado de variables

In [None]:
# Renombramos las variables a nombres en español
df.rename(
    columns={"gdp": "pib", "g_expenditure": "gasto", "g_revenue": "impuestos"},
    inplace=True,
)

# Eliminamos filas con valores no numéricos representados por ':'
clean_df = df[(df != ':').all(axis=1)]

# Aseguramos que las columnas sean de tipo numérico
clean_df["pib"] = pd.to_numeric(clean_df["pib"], errors='coerce')
clean_df["gasto"] = pd.to_numeric(clean_df["gasto"], errors='coerce')
clean_df["impuestos"] = pd.to_numeric(clean_df["impuestos"], errors='coerce')

### 4. _(Opcional)_ Transformaciones (log-diferencias)

Este paso debe realiazarse con df_no_nan para evitar errores al calcular logaritmos de valores no numéricos

In [None]:
# Transformaciones log-diferencias
clean_df["dpib"] = 100 * np.log(clean_df["pib"]).diff()
clean_df["dgasto"] = 100 * np.log(clean_df["gasto"]).diff()
clean_df["dimpuestos"] = 100 * np.log(clean_df["impuestos"]).diff()

# Eliminamos filas con NaN resultantes de las diferencias
clean_df = clean_df.dropna()

# Nos quedamos solo con las columnas necesarias para el análisis
clean_df = clean_df[["dpib", "dgasto", "dimpuestos"]]

In [None]:
# En este punto podemos revisar como queda el DataFrame limpio y transformado
clean_df.head()


### 5. Regresión MCO

In [None]:
Y = clean_df["dpib"]
X = clean_df[["dgasto", "dimpuestos"]]
X = sm.add_constant(X)  # Agregamos constante para el intercepto

ols_model = sm.OLS(Y, X).fit()
print(ols_model.summary())

### 6. Diagnóstico de residuos

In [None]:
resid = ols_model.resid
fitted = ols_model.fittedvalues

# Heterocedasticidad
bp_test = het_breuschpagan(resid, X)
print("")
print(f"\nBreusch-Pagan test:\n - LM Statistic: {bp_test[0]}\n - p-value: {bp_test[1]}")

# Autocorrelación
bg_test = acorr_breusch_godfrey(ols_model, nlags=4)
print("")
print(f"\nBreusch-Godfrey test:\n - LM Statistic: {bg_test[0]}\n - p-value: {bg_test[1]}")

# Gráficos de diagnóstico de residuos
plot_resid(adj_vals=fitted, resids=resid)

### 7. Causalidad de Granger

_Nota: La hipótesis nula es que "dgasto no causa dpib"_

In [None]:
g_data = clean_df[["dpib", "dgasto"]]
var_model = VAR(g_data)
var_results = var_model.fit(maxlags=4) # Basado en el test de información AIC

print(var_results.test_causality("dpib", ["dgasto"], kind="f").summary())

### 8. Predecir valores futuros

In [None]:
clean_df["yhat"] = ols_model.fittedvalues

In [None]:
predict_plot(df = clean_df[["dpib", "yhat"]], title="Predicción del PIB")

#### _Notas:_
- _Asegúrate que las variables están correctamente ajustadas (precios constantes, series reales)_