<img src="escuela-de-economia.png" width="260" height="60">
<center>
    <b>EC4301 MACROECONOMETRÍA</b><br>
    <b>Profesor:  Randall Romero Aguilar, PhD</b>
<br><br>
<b>Laboratorio:</b>
<div style="font-size:175%;color:white; background-color: #0064b0;">Tema 5: Modelos para series con tendencia</div>
<div style="font-size:250%;color:white; background-color: #0064b0;">Pruebas de raíz unitaria para el PIB en Costa Rica</div> 
</center>
<i>Creado:     2020-May-01 
    <br>
    Actualizado: 2020-Oct-07</i>

In [None]:
if 'google.colab' in str(get_ipython()):
    print("Este cuaderno está corriendo en Google Colab. Es necesario instalar el paquete bccr para obtener los datos")
    !pip install bccr
else:
    print("Este cuaderno está corriendo localmente.")

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.formula.api as smf
import statsmodels.api as sm

In [None]:
from statsmodels.tsa.stattools import adfuller, kpss

In [None]:
plt.style.use('seaborn')
plt.rc('figure', figsize=(15,4))
plt.rc('axes', titlesize=20, labelsize=14)
plt.rc('legend', fontsize=14)
plt.rc('xtick', labelsize=14)
plt.rc('ytick', labelsize=14)

# Obtener y graficar los datos del PIB

## Descargar los datos

In [None]:
import bccr

In [None]:
consulta = bccr.ServicioWeb()
#consulta.buscar(todos='Producto interno bruto encadenado')

In [None]:
pib = consulta({'33783':'PIB'})
pib['lPIB'] = np.log(pib['PIB'])

temp = pib.copy()
temp.index = pib.index.to_series().astype(str)
temp.reset_index().to_stata('pib-costa-rica.dta')
del temp

## Gráfico de la serie

In [None]:
fig, ax = plt.subplots()
pib['PIB'].plot(ax=ax, legend=False)
ax.set(yscale='log', title='Producto interno bruto de Costa Rica', ylabel='escala logarítmica')
fig.savefig('pib-costa-rica-I(1).pdf', bbox_inches='tight')

## Correlograma del (logaritmo) del PIB y su primer diferencia

In [None]:
fig,axs = plt.subplots(2,1, figsize=[15,8], sharex=True)
sm.graphics.tsa.plot_acf(pib['lPIB'],ax=axs[0]);
axs[0].set(ylim=[-0.1,1.1], title='$\log(PIB_t)$')

sm.graphics.tsa.plot_acf(pib['lPIB'].diff().dropna(),ax=axs[1]);
axs[1].set(ylim=[-0.5,1.1], title='$\Delta\log(PIB_t)$')

fig.suptitle('Autocorrelación del PIB trimestral de Costa Rica', fontsize=20)
fig.savefig('pib-costa-rica-rho.pdf',bbox_inches='tight')

# Ajustando una tendencia lineal

## Estimando la tendencia y los residuos

In [None]:
pib['t'] = np.arange(pib.shape[0])

pib['tendencia'] = smf.ols('lPIB ~ t', pib).fit().fittedvalues
pib['residuos'] = pib['lPIB'] - pib['tendencia']

In [None]:
fig, axs = plt.subplots(2,1, figsize=[15,7], sharex=True)
pib[['lPIB','tendencia']].plot(ax=axs[0], legend=False)
axs[0].set(title='PIB con tendencia lineal ajustada', ylabel='logaritmos')

pib[['residuos']].plot(ax=axs[1], legend=False)
axs[1].set(title='Residuos')
fig.savefig('pib-tendencia-lineal.pdf', bbox_inches='tight')

## Correlograma de los residuos

In [None]:
sm.graphics.tsa.plot_acf(pib['residuos']);

# Pruebas de DickeyFuller

## Implementando la prueba DF con regresión lineal

In [None]:
dy  = pib['lPIB'].diff()[1:]
ly = pib['lPIB'].shift(1)[1:]
tt = np.arange(dy.size)

X = sm.add_constant(ly)
Z = np.c_[X,tt]

In [None]:
tnc = sm.OLS(dy,ly, hasconst=False).fit().tvalues[0]
tc = sm.OLS(dy, X, hasconst=True).fit().tvalues[1]
tct = sm.OLS(dy, Z, hasconst=True).fit().tvalues[1]

In [None]:
tnc, tc, tct


In [None]:
tbl = sm.OLS(dy, X, hasconst=True).fit().summary().tables[1]

with open('df-lpib-regresion.tex','w') as cuadro:
    cuadro.write(tbl.as_latex_tabular())


## Implementando el código para hacer las tablas

In [None]:
specs = ['nc', 'c', 'ct']
indice = ['sin constante', 'con constante', 'con constante y tendencia']

def DF(datos, spec):
    res = adfuller(datos, maxlag=0,regression=spec)
    resultado = {
        'z':res[0], 
        '1%': res[4]['1%'], 
        '5%': res[4]['5%'], 
        '10%': res[4]['10%']}
    return resultado

def ADF(datos, spec):
    res = adfuller(datos, regression=spec, autolag='t-stat')
    resultado = {
        'z':res[0], 
        '1%': res[4]['1%'], 
        '5%': res[4]['5%'], 
        '10%': res[4]['10%'],
        'p': res[2]}
    return resultado

pruebas = {'df':DF, 'adf':ADF}

def tabla_dickey_fuller(serie, test, diff=0):
    datos = pib[serie].diff(diff) if diff else pib[serie]
    resultados = pd.DataFrame([pruebas[test](datos.dropna(), ss) for ss in specs], index=indice).round(3)
    nombre = '_'.join([test,serie,str(diff)])
    resultados.to_latex(nombre + '.tex')
    return resultados

## Prueba Dickey-Fuller

### Serie en nivel

In [None]:
tabla_dickey_fuller('lPIB','df')

### Serie en primer diferencia

In [None]:
tabla_dickey_fuller('lPIB', 'df', diff=1)

### Serie de los residuos alrededor de tendencia

In [None]:
tabla_dickey_fuller('residuos', 'df', diff=0)

## Prueba aumentada de Dickey-Fuller

### Serie en nivel

In [None]:
tabla_dickey_fuller('lPIB', 'adf', diff=0)

### Serie en primer diferencia

In [None]:
tabla_dickey_fuller('lPIB', 'adf', diff=1)

### Serie de los residuos alrededor de tendencia

In [None]:
tabla_dickey_fuller('residuos', 'adf', diff=0)

# Pruebas KPSS

In [None]:
def KPSS_una_serie(datos, tipo):
    return [kpss(datos.dropna(), regression=tipo, lags=k)[0] for k in range(7)]   

In [None]:
critical = pd.DataFrame(
    {'c': np.array([0.347, 0.463, 0.574, 0.739]),
     'ct':np.array([0.119, 0.146, 0.176, 0.216])},
    index=['10%', '5%', '2.5%', '1%'])


In [None]:
def tabla_KPSS(diff=0):
    datos = pib['lPIB'].diff(diff) if diff else pib['lPIB']
    resultados = pd.DataFrame([KPSS_una_serie(datos, ss) for ss in ['c','ct']], index=['c','ct']).round(3)
    #nombre = '_'.join([test,serie,str(diff)])
    #resultados.to_latex(nombre + '.tex')
    return resultados.T

In [None]:
#%%capture
tab = pd.concat([tabla_KPSS(diff=r) for r in range(2)], axis=1,keys=['nivel','diferencia'])

In [None]:
tab.to_latex('kpss_lPIB.tex')
tab

In [None]:
critical.to_latex('kpss_critical.tex')