# ***Introductory Econometrics: A modern approach***
---

# Chapter 18: Advanced Time Series Topics

> Book: 

    - WOOLDRIDGE, J. M.. Introdução à econometria: uma abordagem moderna. 3a ed. São Paulo: Pioneira Thomson Learning, 2006.

    - WOOLDRIDGE, Jeffrey M. Introductory econometrics: A modern approach. Cengage learning, 2015.

> LINK to codes correction:

http://www.upfie.net/downloads18.html

# Bibliotecas
---

In [1]:
import wooldridge as woo
import pandas as pd
import numpy as np
import statsmodels.formula.api as smf
import statsmodels.api as sm
import patsy as pt

## Observações iniciais

- Processos estocásticos de raízes unitárias: a presença de raíz unitária indica que um choque hoje tenha efeitos duradouros no tempo;

- Regressões espúrias: se as duas séries com raízes unitárias forem usadas em uma regressão de uma contra a outra, há grandes chances das estatísticas de testes mostrarem insignificância estatística equivocadamente. Quando os processos estocásticos são integrados em alguma ordem, devemos estar atentos aos procedimentos padrões de inferência;

- Com uma combinação linear de séries integradas I(0), a regressão não é espúria, mas pode dizer algo sobre a relação de longo prazo entre as séries. Para esse caso de cointegração, temos um modelo específico conhecido como modelos de correção de erro. 

# Infinite Distributed Lag Models (Modelos de Defasagens Distribuídas)
---

> Uma extensão dos modelos de defasagem distribuídas finitas vistos no capítulos 10 do livro-texto. Permite que as mudanças nos valores das variáveis explicativas afetem todos os valores futuros da variável dependente.

## Formalização

$$
y_t = \alpha + \delta_0z_t + \delta_1z_{t-1} + \delta_2z_{t-2} + .... + u_t
$$

Trata-se, de séries bivariadas, em que a definição é generalizada, mas que do ponto de vista econômico, nenhuma série se estende infinitamente no futuro.

Nesse caso, faz sentido que $\delta_j \to 0$ à medida que $t \to \infty$. Isso não significa, por exemplo, que há uma regra em que os coeficientes mais pertos do presente devem ser maiores, e sim que, ao longo do tempo, há uma tendência dos efeitos da variável independente sejam reduzidos sobre a variável dependente. Em outras palavras, o passado mais distante da variável dependente tende a ser menos relevante para explicar a variável dependente. 

Não podemos estimar um modelo com infinitos coeficientes e, ainda, não faria sentido econômico e prático, como dito anteriormente, dado que não temos séries temporais infinitas. Nesse caso, a principal restrição é **limitar o número de parâmetros a serem estimados**. 

Assim como nos modelos de defasagem finita (FDL), o impacto de um choque em $z$ é $\delta_0$ se for transitório, mas pode ser a somatória dos $\delta_j$'s caso o choque em $z$ seja permanente. 

Nesse caso, o impacto marginal de uma mundança temporária em $z$ para cada período $h \geq 0$ é dado por:

$$
E(y_h) = \alpha + \delta_h + u_h = \alpha + \delta_h
$$

Com a mesma hipótese de que o erro tem um efeito médio igual a zero. 

Com um choque temporário e t tendendo a infinito, temos então que o efeito é transitório e se dissipa ao longo do tempo, de modo que $E(y_h) = \alpha$.

Já o impacto de um choque permanente é a soma de todos os coeficientes: 

$$
LRP = \delta_0 + \delta_1 + \delta_2 + ... + \delta_n
$$

E na lógica similar ao choque transitório:

$$
E(y_h) = \alpha + \delta_0 + \delta_1 + \delta_2 + ... + \delta_h + u_h = \alpha + \delta_0 + \delta_1 + \delta_2 + ... + \delta_h
$$

Ao assumirmos essas duas formas com um efeito médio do erro igual à zero, trabalhamos também com a hipóteses de **exogeneidade estrita**. Formalmente, as mudanças em $z$ não provocariam mudanças no termo de erro e, formalmente: 

$$
E(u_y|z_{t-2}, ..., z_{t+2}) = 0
$$

De modo que o erro não depende das variáveis exógenas em nenhum período de tempo. Em aplicações, esse pode ser o caso, mas limita outros casos em que uma mudança na variável exógena hoje seja reflexo de uma mudança na variável endógena no período anterior, principalmente em aplicações relacionadas à política econômica, por exemplo. 

Para casos como esse, assumimos uma hipótese mais fraca:

$$
E(u_y|z_t, ..., z_{t-2}) = 0
$$

Ou seja, fazemos com que o termo do erro não seja correlacionado com as variáveis exógenas apenas no período corrente e nos anteriores, permitindo correlação nos períodos futuros, caso a variável exógena seja alterada em razão dos resultados anteriores da exógena. 

Vale lembrar que nenhuma das formas dessa hipótese de exogeinedade diz algo sobre a correlação serial. Na verdade, podemos esperar, em boa parte dos casos que haja correlação serial, dado que a equação a ser estimada não necessariamente está completa dinâmicamente. 

Nesse caso, a interpretação dos impactos temporários e permanentes segue a mesma.

## Defasagem geométrica distribuída - (The Geometric (or Koyck) Distributed Lag)

## Formalização

$$
\delta_j = \gamma\rho^j
$$

em que: $|\rho| < 1$ e $j = 1, 2, ...$

Lembrando que esse modelo ainda depende de um número infinito de lags.

Mas nesse caso, temos que $\delta_j \to 0$ quando $j \to \infty$ de modo que o tempo passa a ser uma espécie de restrição para a estimação em que o passado distante exerce pouco efeito ou efeito nulo sobre o presente. 

Para um choque de curto prazo, temos que o impactio é dado por:

$$
IP = \delta_0 = \gamma
$$

Para choques permanentes, temos um efeito que persiste no tempo e temos a seguinte forma:

$$
LRP = \gamma * (1 + \rho^1 + \rho^2 + ... + \rho^j) = \gamma * \frac{1}{1 - \rho} = \frac{\gamma}{1 - \rho}
$$

Substituindo na primeira equação, temos:

$$
y_t = \alpha + \gamma z_t + \gamma\rho z_{t-1} + \gamma\rho^2 z_{t-2} + .... + u_t
$$

e

$$
y_{t-1} = \alpha + \gamma z_{t-1} + \gamma\rho z_{t-2} + \gamma\rho^2 z_{t-3} + .... + u_{t-1}
$$

E com a subtração, podemos finalmente estimar um modelo:

$$
y_t - y_{t-1} = (1-\rho)\alpha + \gamma z_t + u_t -\rho u_{t-1}
$$

E manipulando 

$$
y_t = \alpha_0 + \gamma z_t + \rho y_{t-1} + u_t -\rho u_{t-1}
$$

Contudo, sem mais hipóteses há grandes chance de termos incosistência nos estimadores dado que o termo do erro composto $v_t = u_t -\rho u_{t-1}$ será correlacionado com $y_{t-1}$. Ainda, podemos ver que esse erro composto possui correlação serial pela sua forma, que o caracteriza como um processo de média móvel da primeira ordem. 

Contudo, com a hipótese de exogeneidade estrita, temos que $z$ não estará correlacionado com o termo do erro e, portanto, com um instrumento forte para estimar $y_{t-1}$ poderemos estimar a equação completa. Temos então que o instrumento forte, sob essa hipótese, e a própria defasagem de z: $z_{t-1}$. Basta então obter os erros padrões robustos para correlação serial e teremos estimado o modelo de interesse. 

Contudo, se o erro seguir um processo AR(1), teremos:

$$
u_t = \rho u_{t-1} + e_t 
$$

e, portanto:

$$
y_t = \alpha_0 + \gamma z_t + \rho y_{t-1} + e_t
$$

Sob nossa hipótese convencional: $E(u_t|z) = 0$. Assim, a estimação por MQO é consistente e assintóticamente segue normalidade, também com testes válidos de $e_t$ for homoscedástico.

Essas propriedades podem ser generalizadas para diversas variáveis exógenas $z_{t1} ... z_{tk}$ e com as hipóteses acima pode ser estimado por MQO ou, caso contrário, estimado por IV. 

## Modelos de defasagens racionais distribuídas (Rational Distributed Lag Models)