## Extensões dos Modelos de Dados em Painel
Prof. Daniel de Abreu Pereira Uhr

#### Conteúdo

* Modelos Estáticos
  * IV for LSDV
  * IV for First-Differences Model
  * Within IV Estimator
* Modelos Dinâmicos
  * Dynamic Panel Data (Arellano-Bond estimator)
  * System GMM (Blundell-Bond estimator)
* Testes de diagnósticos
* Aplicações em Python
* Aplicação na Literatura
* Considerações

#### Referências
* Wooldridge, J. M. (2002). Econometric analysis of cross section and panel data. MIT press. - Capítulo 11
* Cameron, A. C.; Trivedi, P. K. (2005). Microeconometrics: Methods and Applications. Cambridge University Press. - Capítulo 22
* Anderson, T. W.; Hsiao, C. Estimation of Dynamic Models with Error Components. Journal of the American Statistical Association, Vol. 76, No. 375 (Sep., 1981), pp. 598-606. https://doi.org/10.2307/2287517
* Arellano, M.; Bond, S. Some Tests of Specification for Panel Data: Monte Carlo Evidence and an Application to Employment Equations. The Review of Economic Studies, Vol. 58, No. 2 (Apr., 1991), pp. 277-297. https://doi.org/10.2307/2297968 
* Arellano, M.; Bover, O. Another Look at the Instrumental Variable Estimation of Error-Components Models. Journal of Econometrics, Vol. 68, No. 1 (Jul., 1995), pp. 29-51. https://doi.org/10.1016/0304-4076(94)01642-D
* Blunder, R.; Bond, S. Initial conditions and moment restrictions in dynamic panel data models. Journal of Econometrics, Vol. 87, No. 1 (Aug., 1998), pp. 115-143. https://doi.org/10.1016/S0304-4076(98)00009-8
* Blundell, R.; Bond, S. GMM Estimation with Persistent Panel Data: An Application to Production Functions. Econometric Reviews, Vol. 19, No. 3 (Aug., 2000), pp. 321-340. https://doi.org/10.1080/07474930008800475
* Hansen, B.; Lee, S. Inference for Iterated GMM under Misspecification. Econometrica, Vol. 89, Issue 3 (May, 2021), pp. 1419-1447. https://doi.org/10.3982/ECTA16274 
* Holtz-Eakin, D.; Newey, W.; Rosen, H. Estimating Vector Autoregressions with Panel Data. Econometrica, Vol. 56, No. 6 (Nov., 1988), pp. 1371-1395. https://doi.org/10.2307/1913103
* Windmeijer, F. A finite sample correction for the variance of linear efficient two-step GMM estimators. Journal of Econometrics, Vol. 126, No. 1 (May, 2005), pp. 25-51. https://doi.org/10.1016/j.jeconom.2004.02.005 


---

### Modelos Estáticos

O desenvolvimento dos estimadores procurou integrar a ideia da utilização de **variáveis instrumentais** numa estrutura de **dados em painel**. Vimos que na estrutura cross-section, variáveis endógenas são instrumentadas por variáveis que **não aparecem como regressoras na equação de interesse** (variáveis excluídas da relação). Tais variáveis também podem ser utilizadas como instrumentos no caso de Painel.

**É possivel obter instrumentos a partir da própria estrutura de Dados em Painel?**

* No caso de Dados em Painel, os períodos adicionais dos dados nos proporcionam **condições de momento e instrumentos adicionais** que podem facilmente levar à identificação ou sobreidentificação do coeficiente beta.

* O número de condições de momento e instrumentos disponíveis expande-se progressivamente a medida em que hipóteses são feitas sobre a correlação de $u_{it}$ e $Z_{is}$, para $s,t=1,...,T$.

* A ênfase está em **utilizar os componentes exógenos dos regressores** como instrumentos mais de uma vez (instrumentos internos), mas é importante destacar que a técnica também se aplica aos instrumentos tradicionais que estejam disponíveis fora (externos/excluídos) da regressão.


**Quais os tipos de instrumentos possíveis para utilizarmos em estimadores com Dados em Painel?**

* **Instrumentos externo:** Variável correlacionada com a variável de interesse mas não com o termo de erro (visto anteriormente).

* **Instrumentos internos:** Uso de regressores exógenos em períodos diferentes que o período corrente (ex. variáveis defasadas). A depender das hipóteses de exogeneidade consideradas.


Sabemos que **é difícil obter variávei instrumentais**. Assim, os econometristas teóricos ao considerarem a própria estrutura da base de dados em painel, tiveram a ideia de **utilizar as defasagens das próprias variáveis explicativas** como instrumentos para variáveis endógenas. A lógica é que eventos passados não afetam diretamente o resultado do presente, entretanto estão relacionados com a variável endógena. Assim:

* Se assumirmos que $E[x_{it−1} u_{it}]=0$ então $x_{it−1}$ está disponível como um instrumento adicional.
* Haviamos definido anteriormente que $Z_i$ representava a matriz das variáveis exógenas. Então a matriz $Z_i$ será composta tanto pelos **regressores correntes** (exógenos) quanto pelas **defasagens exógenas**.
* Se supormos que **todos os regressores são contemporaneamente exógenos**, teremos um modelo exatamente identificado, e implicará no Pooled OLS (ou LSDV).

Vejamos quais as hipóteses necessárias para que isso seja possível, e quais as implicações para a estimação dos parâmetros.


**Hipóteses de Exogeneidade**

**Hipótese de Exogeneidade Contemporânea**
* Os instrumentos são assumidos como contemporaneamente não correlacionados com o termo de erro
* $E[Z_{it}u_{it}] = 0$ para $t=1,...,T$

**Hipótese de Exogeneidade Fraca**
* Também chamada de hipótese de instrumentos predeterminados, considera-se adicionalmente que os valores das defasagens dos instrumentos são não correlacionados com o erro do período corrente. 
* $ E[Z_{is}u_{it}] = 0$ para $s=1,...,t-1$ e $t=1,...,T$
* OBS: Essa condição será mais relevante nos **modelos dinâmicos com variáveis dependentes como regressores**.

**Hipótese de Exogeneidade Forte**
* Hipótese mais forte que a anterior, onde os valores futuros dos instrumentos são assumidos não correlacionados com o erro corrente. 
* $E[Z_{is}u_{it}] = 0$ para $s,t$; $t=1,...,T$
* Então valores passados, correntes e futuros de Z são instrumentos validos.

**Estimadores tradicionais de dados em painel**

* POLS
* Efeitos Fixos com Variáveis dummies
* Estimador de Efeitos Fixos Within
* Estimador de Primeira Diferença
* Estimador Between
* Efeitos Aleatórios

Vimos que em ciências sociais aplicadas o controle dos efeitos fixos é fundamental para a obtenção de estimadores consistentes numa estrutura de dados em painel. Entretanto, os teóricos da econometria se questionaram se exisitiria alguma forma de eliminar uma outra fonte de viés além daquela proveniente dos efeitos fixos. Para isso, eles pensaram em uma estratégia que consiste em controlar os efeitos fixos e estimar os modelos empregando o estimador de variáveis instrumentais.

Logo, a ideia foi combinar a eliminação/controle dos efeitos fixos com os estimadores IV, 2SLS e GMM.




#### IV for LSDV

É o estimador IV, ou 2SLS ou Panel GMM para o modelo de efeitos fixos com variáveis dummies.

$$ y_{it} = \alpha_i + \beta x_{it} + u_{it}$$

para $t=1,...,T$ e $i=1,...,N$.

* Sob a **hipótese de exogeneidade fraca**, $E[Z_{is} u_{it}]=0$ para $s≤t$;
* Temos um estimador IV consistente para beta.

#### IV for First-Differences Model

É o estimador IV, ou 2SLS ou Panel GMM para o modelo em primeira diferença:

$$\Delta y_{it} = \Delta x_{it}\beta + \Delta u_{it}$$

$$ y_{it} - y_{it-1} = (x_{it} - x_{it-1})\beta + u_{it} - u_{it-1}$$

para $t=1,...,T$ e $i=1,...,N$.


* Sob a **hipótese de exogeneidade fraca**, $E[Z_{is} (u_{it} − u_{it−1})]=0$ para $s≤t−1$;

* Sabemos que a primeira diferença reduz a dimensão temporal do conjunto dos instrumentos disponíveis em um período.

* Ao assumirmos exogeneidade fraca temos um estimador IV consistente para beta.


#### IV for Within or Mean-Defferenced Model (Within IV Estimator)

O Within IV Estimator é o estimador IV, 2SLS, ou Painel GMM do modelo:

$$y_{it} - \bar{y}_{i} = (x_{it}-\bar{x}_{i})'\beta + (u_{it}-\bar{u}_{i})$$

para $t=1,...,T$ e $i=1,...,N$.

* Considerando o modelo de painel Within, $E[Z_{is} u_{𝑖}] \neq 0$ para todo $s$, porque a média do termo de erro inclui o passado (o presente e o futuro), logo é correlacionado com $Z_{is}$ por construção.

* O estimador **IV de modelo Within leva à estimações inconsistentes de beta** se os instrumentos são fracamente exógenos, até mesmo se eles satisfazem as hipóteses de exogeneidade contemporânea. Logo, **a transformação within somente pode ser usada se os instrumentos são realmente fortemente exógenos (ou com Instrumentos Excluídos)**.


Logo, é teoricamente possível utilizar variáveis defasaadas como instrumentos para variáveis endógenas. Entretanto, é preciso lembrar que para controlar corretamente o efeito fixo individual, apenas os modelos LSVD e de primeira diferenças são adequados. O modelo within não é adequado porque a média do termo de erro inclui o passado (o presente e o futuro), logo é correlacionado com $Z_{is}$.

### Modelos Dinâmicos

Em algumas discussões teóricas, argumenta-se que o comportamento econômico pode ser influenciado pelo passado recente. Por exemplo, o consumo pode apresentar padrões devido à razões psicológicas, onde as pessoas não mudam seus hábitos de forma imediata. Além disso, as razões tecnológicas ou institucionais também contam para a natureza dinâmica em uma relação econométrica. Logo, se justificaria o tempo para ajustar o novo padrão de consumo. Ou seja, a variável dependente defasada considerada dentro do modelo de regressão agregaria um peso da história a estimação (modelo dinâmico). 

Além disso, a estrutura dinâmica permitiria estimação de **efeitos de curto** e **longo prazos**.


O modelo dinâmico é dado por:

$$y_{it} = \rho y_{it-1} + x_{it}'\beta + \alpha_{i} +u_{it}$$

para $t=2,...,T$ e $i=1,...,N$. 

Repare que estamos modelando a variável dependente como uma função de seu próprio passado e de regressores contemporâneos e os efeitos fixos individuais. Como de costume, o painel é curto com dados independentes em $i$. Também é assumido que $|\rho|<1$. Mesmo que $\alpha_{i}$ seja um efeito aleatório, a estimação OLS leva à coeficientes inconsistentes porque a variável dependente defasada é correlacionada com $\alpha_{i}$, e com o erro composto ($\alpha_{i} + \epsilon_{it}$).


Para o desenvolvimento dos estimadores, vamos considerar estimações com $\alpha_{i}$ como efeito-fixo, $|\rho|<1$, erro $\epsilon_{it}$ não serialmente correlacionado, e painel curto(estrutura de aplicações microeconômicas).



Por simplicidade, seja beta igual a zero, então:

$$y_{it} = \rho y_{it-1} + \alpha_{i} +u_{it}$$

Teoricamente, 
$$E[y_{it}|y_{it-1},\alpha_{i}] = \rho y_{it-1} + \alpha_{i}$$

e, 

$$corr(y_{it},y_{it-1}) = \rho$$

Entretanto, como $\alpha_{i}$ é desconhecido, e observamos:

$$E[y_{it}|y_{it-1}, \alpha_{i}] = \rho y_{it-1} + E[\alpha_{i}|y_{it-1}]$$

Isso implica que

$$ corr(y_{it},y_{it-1}) \neq \rho$$

Porque, para o caso de beta igual a zero (depois de alguma álgebra), teremos:

$$corr(y_{it},y_{it-1}) = corr[(\rho y_{it-1} + \alpha_{i} + u_{it}),y_{it-1}] = \rho + \frac{(1-\rho)}{1+(1-\rho)\sigma_{\epsilon}^{2}/(1+\rho)\sigma_{\alpha}^{2}}$$

Esse resultado mostra que há duas razões para a correlação entre $y_{it}$ e $y_{it-1}$:

* **Um verdadeiro estado de dependência** que ocorre quando a correlação no tempo é devido ao mecanismo causal em que o período defasado determina o período atual. Essa dependência é relativamente maior se o efeito individual $\alpha_{i}$ for aproximadamente zero assim como $corr(y_{it},y_{it-1})$ for aproximadamente igual a $\rho$. Mais geralmente, isso ocorre quando $\sigma^{2}_{\alpha}$ é menor relativo à $\sigma^{2}_{\epsilon}$.
* **Devido à heterogeneidade não observada**: que surge mesmo se não houver mecanismo causal, $\rho=0$, mesmo assim há correlação simplificando a relação em $\frac{1}{1+\frac{\sigma^{2}_{\epsilon}}{\sigma_{\alpha}^{2}}}= \frac{\sigma^{2}_{\alpha}}{(\sigma^{2}_{\alpha}+\sigma^{2}_{\epsilon})}$. 

**Inconsistência dos estimadores em Painel Clássicos**

Todos os estimadores vistos anteriormente são inconsistentes se a regressão apresentar variável dependente defasada, mesmo no caso do modelo de efeitos aleatórios.

* Considere o estimador POLS de $𝑦_𝑖𝑡$ sobre $y_{it−1}$ e $x_{it}$. A variável dependente é correlacionada com o termo de erro conjunto ($\alpha_𝑖 + \epsilon_{𝑖𝑡}$).
* Considere o estimador Within, o regressor ($𝑦_{𝑖𝑡−1} − \bar{𝑦}_{𝑖}$) é correlacionado com o erro ($\epsilon_{𝑖𝑡} − \bar{\epsilon}_{𝑖}$) porque é correlacionado com $\epsilon_{𝑖𝑡−1}$ que está em sua média $\bar{\epsilon}_{i}$
* E do estimador **Random effects** porque é uma **combinação dos estimadores between e within**.


#### Dynamic Panel Data (Arellano-Bond estimator)

Considerando a primeira diferença do modelo dinâmico:

$$(y_{it}- y_{it-1}) = \rho (y_{it-1} - y_{it-2}) + (x_{it} - x_{it-1})'\beta + (\alpha_{i} - \alpha_{i}) + (\epsilon_{it} - \epsilon_{it-1})$$

$i=1,...,N$ e $t=3,...,T$.

O estimador OLS é inconsistente porque $y_{it-1}$ é correlacionado com $\epsilon_{it-1}$, logo o regressor ($y_{it-1} - y_{it-2}$) é correlacionado com o erro ($\epsilon_{it} - \epsilon_{it-1}$). Implicando em endogeneidade por construção.

**Anderson e Hsiao (1981)** propuseram estimar a equação com $y_{it-2}$ como instrumento para $y_{it-1} - y_{it-2}$. O instrumento é válido porque não está correlacionado com o erro ($\epsilon_{it} - \epsilon_{it-1}$), desde que o termo de erro não seja serialmente correlacionado. Outro instrumento proposto foi o $\Delta y_{it-2}$, como instrumento para $\Delta y_{it-1}$.

**Arellano e Bond (1991)** propuseram um estimador GMM para o modelo dinâmico. **A ideia é adicionar mais defasagens da variável dependente como instrumentos**. Por exemplo, $y_{it-2}, y_{it-3},...,y_{it-s}$, onde $s$ é o número de defasagens da variável dependente. Dessa forma é possivel obter um estimador sobreidentificado, para buscar uma estimação teoricamente mais eficiente. Repare que o número de instrumentos cresce a medida que o tempo se aproxima de $T$. Por exemplo, no período 3 temos somente o instrumento $y_{it-1}$. No período 4 temos $y_{it-1}$ e $y_{it-2}$, no período 5 teremos, $y_{it-1}$, $y_{it-2}$ e $y_{it-3}$, e assim por diante. 


O estimador GMM de Arellano-Bond é dado por:

$$\hat{\beta}_{AB} =  \left [ \left (  \sum_{i}^{N} \tilde{X}_{i}´Z_{i} \right ) W_{N} \left (  \sum_{i}^{N} Z_{i}´\tilde{X}_{i}\right )\right]^{-1} \left (  \sum_{i}^{N} \tilde{X}_{i}´Z_{i} \right ) W_{N} \left (  \sum_{i}^{N} Z_{i}´\tilde{y}_{i} \right )$$

onde $\tilde{X}_{i}$ é uma matriz (T-2)x(K+1) com a linha ($\Delta y_{i,t-1}, \Delta x_{it}´$), $t=3,...T$, $\tilde{y}_{i}$ é um vetor (T-2)x1 com a linha ($\Delta y_{i,t}$), $t=3,...T$, e $Z_{i}$ é uma matriz de instrumentos (T-2)xr 

$$ Z_{i} = \begin{bmatrix} 
z_{i3}´ & 0 & ... & 0 \\ 
0 & z_{i4}´ & ... & 0 \\ 
\vdots & \vdots & \vdots & \vdots \\ 
0 & 0 & ... & z_{iT}´ \\ 
\end{bmatrix}$$

No arcabouço de Anderson-Hsiao, as variáveis defasadas em 2 períodos aparecem da seguinte forma na matriz de instrumento(s) (excluído(s)):

$$ Z_{i} = \begin{pmatrix}
. \\
y_{i,1} \\
\vdots  \\
y_{i,T-2} \\
\end{pmatrix}
$$


Onde a primeira linha corresponde à $t=2$, dado que a primeira observação é perdida pela aplicação da primeira diferença. O valor “missing” no instrumento para $t=2$ implica na remoção da observação na estimação. Se também incluirmos a terceira defasagem como um segundo instrumento no arcabouço de Anderson-Hsiao, nós perderemos outra observação no painel:

$$
Z_{i} = \begin{pmatrix}
. & . \\
y_{i,1} & . \\
y_{i,2} &  y_{i,1}\\
\vdots & \vdots \\
y_{i,T-2} & y_{i,T-3} \\
\end{pmatrix}
$$ 

Então a primeira observação disponível para a regressão é para $t=4$; Para lidar com isso, Holtz-Eakin et al. (1988); Construiram um conjunto de instrumentos a partir da segunda defasagem de $y$, de modo que cada instrumento pertence a cada período:

$$
Z_{i} = \begin{pmatrix}
0 & 0 & 0 & 0 \\
y_{i,1} & 0 & 0 & 0 \\
0 & y_{i,2} & 0 & 0 \\
\vdots & \vdots & \vdots & \vdots \\
0 & 0 & 0 & y_{i,T-2} \\
\end{pmatrix}
$$

A inclusão dos zeros no lugar dos valores “missing´s” previne a perda de graus de liberdade, onde todas as observações datadas em t=2 e anteriores podem ser incluídas na regressão. A condição de momento resultante corresponde: $𝐸(𝑦_{𝑖,𝑡−2} \epsilon_{𝑖𝑡})=0$. A matriz vista anteriormente também deve ser válida se colapsarmos as colunas (“collapse”) de Z em uma única coluna, a qual incorpora a mesma expectativa anterior, produzindo um única condição de momento. Nesse sentido, o conjunto dos instrumentos colapsados será o mesmo que o IV padrão, com zero em substituição aos dados missing.

$$
Z_{i} = \begin{pmatrix}
0 \\
y_{i,1} \\
y_{i,2} \\
\vdots \\
y_{i,T-2} \\
\end{pmatrix}
$$

Por outro lador, poderíamos incluir **todas as variáveis defasadas disponíveis**.

$$
Z_{i} = \begin{pmatrix}
0 & 0 & 0 & 0 & 0 & 0 & \vdots \\
y_{i,1} & 0 & 0 & 0 & 0 & 0 & \vdots \\
0 & y_{i,2} & y_{i,1} & 0 & 0 & 0 & \vdots \\
0 & 0 & 0 & y_{i,3} & y_{i,2} & y_{i,1} & \vdots \\
\vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\
0 & 0 & 0 & 0 & 0 & 0 & \vdots \\
\end{pmatrix}
$$

Temos diferentes instrumentos disponíveis para cada período, um para o período $t=2$; dois para o período $t=3$; e assim por diante. Uma **desvantagem dessa estratégia** é que o número de instrumentos produzidos será quadrático em T. Para uma dimensão temporal mais longa (T>10, por exemplo) é necessário restringir o numero de defasagens utilizadas.

O estimador em **Painel GMM dinâmico em diferença** com a matriz de instrumentos descrita anteriormente é conhecido como **Difference GMM**. 


**Quando utilizar o Estimador Arellano-Bond (Diff-GMM)?**

* T pequeno, e N Grande.
* Relação funcional linear;
* Dinâmica da variável dependente;
* Existência de variáveis explicativas não estritamente exógenas (podem ser correlacionadas com o passado e, ou, com o termo de erro).
* Efeito fixo;
* Heterocedasticidade e autocorrelação dentro dos erros das unidades individuais, mas não entre elas.


**Situações onde o modelo Diff-GMM não provê boas estimações:**

* **Sob heterocedasticidade:** então utilizamos o estimador two-step GMM. Este é robusto à heterocedasticidade, entretanto os erros padrão são enviesados para baixo. Entretanto, este problema foi resolvido por **Windmeijer (2005)**, o qual propôs uma **correção para o estimador two-step GMM**.
* **Quando se utiliza regressores invariantes no tempo:** A primeira diferença elimina todas os regressores constantes. (veremos que o System GMM resolve esse problema de forma colateral).
* Quando $y$ se aproxima de um passeio aleatório, o Diff-GMM performa fracamente. Porque as defasagens adicionam pouca informação sobre as mudanças futuras, então as defasagens em nível são instrumentos fracos para as variáveis transformadas. 
* Uma fraqueza adicional do estimador Diff-GMM ocorre quando o painel é desbalanceado, de modo que se perde informação devido aos dados missing. 







#### System GMM - Blundel-Bond estimator

Além de utilizar a equação em diferenças (e suas defasagens em nível como instrumentos), o estimador de Blundel-Bond (1998) também considera a equação em nível utilizando as diferenças defasadas como instrumentos. Implicando em um conjunto adicional de instrumentos. Este estimador é chamado de System GMM.

* Assume que $𝐸[\Delta y_{𝑖𝑡} \alpha_𝑖 ]=0$ para todo $i$. 
* Então, $\Delta 𝑦_{𝑖𝑡}$ é um instrumento válido. A equação em nível é instrumentalizada pelas diferenças. 
* A hipótese é válida para erros não serialmente correlacionados.


**Em suma**:

* O estimador **Difference GMM de Arellano e Bond (1991) mostrou ter fracas propriedades para amostra finita** (em termos de viés e imprecisão) no caso em que as séries são altamente persistentes ou se a variância do efeito específico individual é grande em relação à variância do erro (ver Blundell e Bond, 1998). Nesses casos, os níveis defasados ​​da série são apenas fracamente correlacionados com as primeiras diferenças subsequentes, levando a instrumentos fracos. A fraqueza do instrumento, por sua vez, aumenta a variância dos coeficientes e, em amostras relativamente pequenas, é provável que gere estimativas enviesadas. 

* **A recomendação é o estimador System GMM** de Blundell e Bond (1998). É importante lembrar que uma **proliferação de instrumentos** pode superestimar as variáveis ​​endógenas e levar a uma perda de poder na inferência, mas pode-se **restringir o comprimento máximo dos instrumentos defasados**. 

* Em geral, os ganhos da estimação SYS-GMM em relação ao estimador de Diff-GMM são mais acentuadas quando as unidades de painel (N) são grandes (>30) e os períodos de tempo (T) são moderadamente pequeno (entre 10 e 20/25).



#### Testes de Diagnósticos

**Teste de autocorrelação de Arellano-Bond**
Se os erros são serialmente não correlacionados, esperamos:
* **rejeitar a hipótese de não existência de correlação para a primeira ordem, AR(1)**
* **Aceitar a hipótese nula para as ordens superiores, AR(2)**. 
* Isto é, é esperado que o AR(1) seja estatísticamente diferente de zero porque $D.u_{it} = u_{it} – u_{it-1}$ deve se correlacionar com $D.u_{it-1} = u_{it-1} – u_{it-2}$ , porque eles compartilham o termo $u_{it-1}$.

**Teste de sobreidentificação de Hansen/Sargan** (Validação dos instrumentos)

Testa-se se os instrumentos, como um grupo/conjunto, são exógenos.

* Sargan (one-step, non-robust)
* Hansen (two-step, robust)
* Difference in Hansen/Sargan test: Testa se as condições de momento adicionais do SYS-GMM são ortogonais ao erro. (Ho: os instrumentos adicionais são válidos)

Antes de realizar as aplicações, vejamos nossas opções para regressão dos modelos dinâmicos em painel.

Lembre que o estimador **one-step** GMM assume uma matriz de pesos $W=(Z´Z)^{-1}$ , tornando-se no 2SLS. Já o Two-Step GMM assume $W=\hat{S}^{-1}$ onde $\hat{S}=\frac{1}{n}\sum Z_{i}´\hat{u}_{i}\hat{u}_{i}´Z_{i}$. É chamado de Two-step GMM porque no primeiro estágio obtem-se os resíduos por 2SLS para compor $\hat{S}$, e no segundo estágio utiliza-se $\hat{S}$ para obter o estimador GMM. 

Então, podemos aplicar o One-step e o Two-Step GMM para o modelo em diferença (Difference GMM - Arellano-Bond) e para o sistema (nível e diferença) (System GMM - Blundel-Bond).

#### Aplicação em Python

O pacote para aplicação de painel dinâmico no no Python pode ser encontrado aqui: https://pypi.org/project/pydynpd/ . O pacote reporta erros padrão robustos para estimadores one-step e two-step (corrigidos conforme Windmeijer, 2005 ).

Vamos utilizar os dados empregados no exemplo do próprio pacote. São os dados do artigo de Arellano e Bond (1991). É um painel desbalanceado com 140 empresas ao longo de 9 anos (1976-1984).

$$ n_{it} = \rho n_{i,t-1} + \rho n_{it-2} + \beta w_{it} + \delta k_{it} + \alpha_{i} + \epsilon_{it}$$

onde, $n$, $w$, e $k$ são o ln do emprego, salário e capital, respectivamente. $\alpha_{i}$ é o efeito fixo individual, e $\epsilon_{it}$ é o erro idiocincrático.

Hipóteses:

* Vamos supor que $w$ e $k$ são variáveis estritamente exógena (independentes das demais).
* É possivel classificar as variáveis como predeterminadas (valor é conhecido ou determinado antes do período de análise; são aquelas que não são influenciadas pelas outras variáveis do modelo no período em análise).

Para estimar o modelo importamos os dados.

In [57]:
# pacotes
import pandas as pd
from  pydynpd import regression
# dados
df = pd.read_csv("data.csv")
print(df.head())

   Unnamed: 0   c1  ind  year    emp     wage     cap    indoutpt         n  \
0           1  1-1    7  1977  5.041  13.1516  0.5894   95.707199  1.617604   
1           2  2-1    7  1978  5.600  12.3018  0.6318   97.356903  1.722767   
2           3  3-1    7  1979  5.015  12.8395  0.6771   99.608299  1.612433   
3           4  4-1    7  1980  4.715  13.8039  0.6171  100.550102  1.550749   
4           5  5-1    7  1981  4.093  14.2897  0.5076   99.558098  1.409278   

          w  ...      ysL2  yr1976  yr1977  yr1978  yr1979  yr1980  yr1981  \
0  2.576543  ...       NaN       0       1       0       0       0       0   
1  2.509746  ...       NaN       0       0       1       0       0       0   
2  2.552526  ...  4.561294       0       0       0       1       0       0   
3  2.624951  ...  4.578383       0       0       0       0       1       0   
4  2.659539  ...  4.601245       0       0       0       0       0       1   

   yr1982  yr1983  yr1984  
0       0       0       0  


Vamos entender os componentes do comando que será empregado.

* Na primeira parte teremos a indicação da regressão dinâmica, onde o primeiro termo é a variável dependente e os lags das variáveis dependentes (defasagens) são indicados por L1.n e L2.n, que são as defasagens de n em 1 e 2 períodos, respectivamente, além das demais variáveis explicativas.

* Na segunda parte indicamos como os instrumentos são criados. Podemos usar o segundo e o terceiro lag da variável dependente (por exemplo, L2.n e L3.n) como instrumentos, então incluímos a lista gmm: $gmm(n, 2:3)$. Ou apenas indicar a variável endógena (endo(n)). Se acreditamos que a variável $w$ é predeterminada e usamos o primeiro e os lags subsequentes como instrumentos (por exemplo, L1.w, L2.W, ...), Assim, incluímos uma segunda lista gmm: $gmm(w, 1:.)$ o ponto significa que não há restrição com respeito ao máximo de lags que podem ser incluídos. Entretanto, se supormos que ela seja predeterminada, indicamos pred(w), por exemplo. Se supomos que $k$ é estritamente exógeno, então na lista de IV, indicamos $iv(k)$. Isso mostra ao pacote para usar $k$ como instrumento para si mesmo.
* A terceira parte do comando é indicada as opções para estimação:
  * **one-step**: performa o estimador One-step GMM.
  * **nolevel**: performa somente o difference GMM.
  * **iterated**: performa a estimação GMM iterativa (Iterated Efficient GMM - usa o two-step efficient GMM estimator, O processo é repetido (iterado) até que as estimativas de $\hat{g}(\hat{S}^{-1}(\hat{W}))$ não mudem significativamente de uma iteração para outra. Pesquisas recentes aprofundam o estimador: Econometrica, Vol.89, No.3 (May,2021), 1419–1447).
  * **timedumm**: inclui automaticamente variáveis dummies na primeira parte, e a declaração iv na segunda.
  * **hqic**: se houver vários modelos concorrentes, classifique-os por hqic em vez de pelo bic padrão.
  * **collapse**: colapse os instrumentos para reduzir o problema de muitos instrumentos.
  
* Finalmente, colocamos todos juntos.

In [59]:
# One-Step Difference GMM
One_Step_Diff_GMM = regression.abond('n L1.n w k | endo(n) iv(w k) | onestep nolevel collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, one-step difference GMM
 Group variable: id                              Number of obs = 751     
 Time variable: year                             Min obs per group: 5    
 Number of instruments = 9                       Max obs per group: 7    
 Number of groups = 140                          Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.8436831  |      0.1399704      | 6.0275826  | 0.0000000 | *** |
|  w   | -0.6277566 |      0.1972370      | -3.1827528 | 0.0014588 |  ** |
|  k   | 0.2224798  |      0.0560811      | 3.9671102  | 0.0000727 | *** |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(6) = 21.428 Prob > Chi2 = 0.002
Arellano-Bond test for AR(1) in first differences:

In [60]:
One_Step_Diff_GMM.models[0].regression_table

Unnamed: 0,variable,coefficient,std_err,z_value,p_value,sig
0,L1.n,0.843683,0.13997,6.027583,1.664302e-09,***
1,w,-0.627757,0.197237,-3.182753,0.001458821,**
2,k,0.22248,0.056081,3.96711,7.274936e-05,***


In [61]:
rho = One_Step_Diff_GMM.models[0].regression_table.iloc[0]['coefficient']
w_beta = One_Step_Diff_GMM.models[0].regression_table.iloc[1]['coefficient']
lr_w_beta = w_beta / (1 - rho)
print(lr_w_beta)

erro_padrao_rho = One_Step_Diff_GMM.models[0].regression_table.iloc[0]['std_err']
estatistica_z = rho / erro_padrao_rho
estatistica_z
print(estatistica_z)

erro_padrao_w = One_Step_Diff_GMM.models[0].regression_table.iloc[1]['std_err']
erro_padrao_longo_prazo_w = erro_padrao_w / ((1 - w_beta) ** 2)
estatistica_z_w = w_beta / erro_padrao_longo_prazo_w
print(estatistica_z_w)

-4.015923039631502
6.027582550565978
-8.432994982004542


In [62]:
# Two-Step Diff GMM
Two_Step_Diff_GMM = regression.abond('n L1.n w k | endo(n) iv(w k)| nolevel collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step difference GMM
 Group variable: id                              Number of obs = 751     
 Time variable: year                             Min obs per group: 5    
 Number of instruments = 9                       Max obs per group: 7    
 Number of groups = 140                          Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.6989810  |      0.1282409      | 5.4505313  | 0.0000001 | *** |
|  w   | -0.7691985 |      0.1041913      | -7.3825596 | 0.0000000 | *** |
|  k   | 0.2408001  |      0.0659494      | 3.6512839  | 0.0002609 | *** |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(6) = 21.428 Prob > Chi2 = 0.002
Arellano-Bond test for AR(1) in first differences:

In [63]:
# One-Step System GMM
One_Step_Sys_GMM = regression.abond('n L1.n w k | endo(n) iv(w k) | onestep collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, one-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 11                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |    |
+------+------------+---------------------+------------+-----------+----+
| L1.n | 0.5607060  |      0.1789877      | 3.1326509  | 0.0017324 | ** |
|  w   | -0.2440339 |      0.1038804      | -2.3491803 | 0.0188148 | *  |
|  k   | 0.3595693  |      0.1390491      | 2.5859162  | 0.0097121 | ** |
| _con | 1.3593874  |      0.4831933      | 2.8133406  | 0.0049030 | ** |
+------+------------+---------------------+------------+-----------+----+
Hansen test of overid. restrictions: chi(7) = 29.449 Pro

In [64]:
# Two-Step System GMM
Two_Step_Sys_GMM1 = regression.abond('n L1.n w k | endo(n) iv(w k) | collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 11                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.5103802  |      0.1481366      | 3.4453352  | 0.0005704 | *** |
|  w   | -0.3683856 |      0.1544791      | -2.3846950 | 0.0170933 |  *  |
|  k   | 0.4036385  |      0.1164868      | 3.4651001  | 0.0005300 | *** |
| _con | 1.8120008  |      0.6299040      | 2.8766298  | 0.0040195 |  ** |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(7) = 29

Vamos restringir o número de lags para a variável dependente defasada de 2 a 3.

In [65]:
# Two-Step System GMM - lag (2-3)
Two_Step_Sys_GMM2 = regression.abond('n L1.n w k | gmm(n, 2:3) iv(w k) | collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                              Number of obs = 751     
 Time variable: year                             Min obs per group: 5    
 Number of instruments = 6                       Max obs per group: 7    
 Number of groups = 140                          Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.8693642  |      0.1208382      | 7.1944474  | 0.0000000 | *** |
|  w   | -0.3023662 |      0.1404797      | -2.1523843 | 0.0313671 |  *  |
|  k   | 0.1251722  |      0.0986176      | 1.2692690  | 0.2043451 |     |
| _con | 1.0985217  |      0.5594399      | 1.9636099  | 0.0495753 |  *  |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(2) = 15.879

Permitindo todas as defasagens como instrumento.

In [66]:
# Two-Step System GMM - lag (2-...)
Two_Step_Sys_GMM3 = regression.abond('n L1.n w k | gmm(n, 2:.) iv(w k) | collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 11                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.5103802  |      0.1481366      | 3.4453352  | 0.0005704 | *** |
|  w   | -0.3683856 |      0.1544791      | -2.3846950 | 0.0170933 |  *  |
|  k   | 0.4036385  |      0.1164868      | 3.4651001  | 0.0005300 | *** |
| _con | 1.8120008  |      0.6299040      | 2.8766298  | 0.0040195 |  ** |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(7) = 29

Adicionando efeitos fixos de ano

In [67]:
# Two-Step System GMM - Time fixed effects
Two_Step_Sys_GMM4 = regression.abond('n L1.n w k | gmm(n, 2:.) iv(w k) | timedumm collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 18                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+-----------+------------+---------------------+------------+-----------+-----+
|     n     |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+-----------+------------+---------------------+------------+-----------+-----+
|    L1.n   | 0.5621990  |      0.1871391      | 3.0041768  | 0.0026630 |  ** |
|     w     | -0.2413994 |      0.1115897      | -2.1632763 | 0.0305199 |  *  |
|     k     | 0.3547180  |      0.1462262      | 2.4258160  | 0.0152740 |  *  |
| year_1978 | -0.0262823 |      0.0187601      | -1.4009676 | 0.1612237 |     |
| year_1979 | -0.0365280 |      0.0217959      | -1.6759069 | 0.0937564 |     |
| year_1

Modelo Iterativo e considerando as covariáveis como predeterminadas.


In [68]:
# Two-Step System GMM - Iterative e Time fixed effects
Iterated_Sys_GMM = regression.abond('n L1.n w k | gmm(n, 2:.) pred(w k) | iterated timedumm collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, 18-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 34                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+-----------+------------+---------------------+------------+-----------+-----+
|     n     |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+-----------+------------+---------------------+------------+-----------+-----+
|    L1.n   | 0.9851469  |      0.0750937      | 13.1188973 | 0.0000000 | *** |
|     w     | -0.3715333 |      0.1473139      | -2.5220530 | 0.0116672 |  *  |
|     k     | 0.1539436  |      0.0563663      | 2.7311291  | 0.0063118 |  ** |
| year_1978 | -0.0333228 |      0.0178837      | -1.8633021 | 0.0624198 |     |
| year_1979 | -0.0510517 |      0.0210822      | -2.4215521 | 0.0154544 |  *  |
| year_19

**Alguém poderia perguntar**:

* E caso eu queira utilizar as defasagens como instrumentos internos para outra variável endógena? Vamos assumir que desconfiamos que $k$ seja endógena. Então, podemos utilizar as defasagens de $k$ como instrumentos para $k$.

In [69]:
# Two-Step System GMM - com Time fixed effects
TS_Sys_GMM_TFE = regression.abond('n L1.n w k | gmm(n, 2:.) gmm(k, 2:4) iv(w) | timedumm collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 21                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+-----------+------------+---------------------+------------+-----------+-----+
|     n     |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+-----------+------------+---------------------+------------+-----------+-----+
|    L1.n   | 0.7702054  |      0.1530545      | 5.0322294  | 0.0000005 | *** |
|     w     | -0.1741308 |      0.0538857      | -3.2314868 | 0.0012315 |  ** |
|     k     | 0.2331483  |      0.0714535      | 3.2629388  | 0.0011026 |  ** |
| year_1978 | -0.0173987 |      0.0177855      | -0.9782516 | 0.3279499 |     |
| year_1979 | -0.0283925 |      0.0204651      | -1.3873609 | 0.1653317 |     |
| year_1

**Como calcular o efeito de longo prazo de k?**

Vejamos a partir da última regressão

In [70]:
TS_Sys_GMM_TFE.models[0].regression_table

Unnamed: 0,variable,coefficient,std_err,z_value,p_value,sig
0,L1.n,0.770205,0.153055,5.032229,4.848088e-07,***
1,w,-0.174131,0.053886,-3.231487,0.00123148,**
2,k,0.233148,0.071453,3.262939,0.001102633,**
3,year_1978,-0.017399,0.017786,-0.978252,0.3279499,
4,year_1979,-0.028393,0.020465,-1.387361,0.1653317,
5,year_1980,-0.058841,0.021046,-2.795829,0.005176677,**
6,year_1981,-0.126677,0.023971,-5.284528,1.260295e-07,***
7,year_1982,-0.098254,0.028223,-3.481309,0.0004989691,***
8,year_1983,-0.054159,0.037805,-1.432584,0.1519766,
9,year_1984,-0.065391,0.056327,-1.160905,0.2456804,


In [71]:
# Calculando o efeito de longo prazo para k
rho = TS_Sys_GMM_TFE.models[0].regression_table.iloc[0]['coefficient']
k_beta = TS_Sys_GMM_TFE.models[0].regression_table.iloc[2]['coefficient']
lr_k_beta = k_beta / (1 - rho)
print(lr_k_beta)


1.0145939508350157


In [72]:
# Estatística de teste
erro_padrao_k = TS_Sys_GMM_TFE.models[0].regression_table.iloc[1]['std_err']
erro_padrao_longo_prazo_k = erro_padrao_k / ((1 - k_beta) ** 2)
estatistica_z_k = k_beta / erro_padrao_longo_prazo_k
print(estatistica_z_k)

2.544379059344379


: 

#### Aplicação na Literatura

**RBE - Revista Brasileira de Economia**: https://periodicos.fgv.br/rbe/article/view/77642 (2020)


<div style="text-align:center;">
    <img src="images/RBE1.png"  alt="Imagem" style="width: 500px;"/>
</div>


<div style="text-align:center;">
    <img src="images/RBE2.png"  alt="Imagem" style="width: 500px;"/>
</div>


#### Considerações

* As críticas à esse tipo de estimador recaem principalmente à **dependência da escolha dos instrumentos por parte dos pesquidor**. Assim, o pesquisador pode ajustar o numero de defasagens serão utilizadas como instrumento, gerando uma arbitrariedade sobre a escolha do modelo e dos prováveis resultados.
* Os **instrumentos internos** são teóricamente válidos, entretanto há críticas sobre sua relação teórica com a variável endógena.