## Extens√µes dos Modelos de Dados em Painel
Prof. Daniel de Abreu Pereira Uhr

#### Conte√∫do

* Modelos Est√°ticos
  * IV for LSDV
  * IV for First-Differences Model
  * Within IV Estimator
* Modelos Din√¢micos
  * Dynamic Panel Data (Arellano-Bond estimator)
  * System GMM (Blundell-Bond estimator)
* Testes de diagn√≥sticos
* Aplica√ß√µes em Python
* Aplica√ß√£o na Literatura
* Considera√ß√µes

#### Refer√™ncias
* Wooldridge, J. M. (2002). Econometric analysis of cross section and panel data. MIT press. - Cap√≠tulo 11
* Cameron, A. C.; Trivedi, P. K. (2005). Microeconometrics: Methods and Applications. Cambridge University Press. - Cap√≠tulo 22
* Anderson, T. W.; Hsiao, C. Estimation of Dynamic Models with Error Components. Journal of the American Statistical Association, Vol. 76, No. 375 (Sep., 1981), pp. 598-606. https://doi.org/10.2307/2287517
* Arellano, M.; Bond, S. Some Tests of Specification for Panel Data: Monte Carlo Evidence and an Application to Employment Equations. The Review of Economic Studies, Vol. 58, No. 2 (Apr., 1991), pp. 277-297. https://doi.org/10.2307/2297968 
* Arellano, M.; Bover, O. Another Look at the Instrumental Variable Estimation of Error-Components Models. Journal of Econometrics, Vol. 68, No. 1 (Jul., 1995), pp. 29-51. https://doi.org/10.1016/0304-4076(94)01642-D
* Blunder, R.; Bond, S. Initial conditions and moment restrictions in dynamic panel data models. Journal of Econometrics, Vol. 87, No. 1 (Aug., 1998), pp. 115-143. https://doi.org/10.1016/S0304-4076(98)00009-8
* Blundell, R.; Bond, S. GMM Estimation with Persistent Panel Data: An Application to Production Functions. Econometric Reviews, Vol. 19, No. 3 (Aug., 2000), pp. 321-340. https://doi.org/10.1080/07474930008800475
* Hansen, B.; Lee, S. Inference for Iterated GMM under Misspecification. Econometrica, Vol. 89, Issue 3 (May, 2021), pp. 1419-1447. https://doi.org/10.3982/ECTA16274 
* Holtz-Eakin, D.; Newey, W.; Rosen, H. Estimating Vector Autoregressions with Panel Data. Econometrica, Vol. 56, No. 6 (Nov., 1988), pp. 1371-1395. https://doi.org/10.2307/1913103
* Windmeijer, F. A finite sample correction for the variance of linear efficient two-step GMM estimators. Journal of Econometrics, Vol. 126, No. 1 (May, 2005), pp. 25-51. https://doi.org/10.1016/j.jeconom.2004.02.005 


---

### Modelos Est√°ticos

O desenvolvimento dos estimadores procurou integrar a ideia da utiliza√ß√£o de **vari√°veis instrumentais** numa estrutura de **dados em painel**. Vimos que na estrutura cross-section, vari√°veis end√≥genas s√£o instrumentadas por vari√°veis que **n√£o aparecem como regressoras na equa√ß√£o de interesse** (vari√°veis exclu√≠das da rela√ß√£o). Tais vari√°veis tamb√©m podem ser utilizadas como instrumentos no caso de Painel.

**√â possivel obter instrumentos a partir da pr√≥pria estrutura de Dados em Painel?**

* No caso de Dados em Painel, os per√≠odos adicionais dos dados nos proporcionam **condi√ß√µes de momento e instrumentos adicionais** que podem facilmente levar √† identifica√ß√£o ou sobreidentifica√ß√£o do coeficiente beta.

* O n√∫mero de condi√ß√µes de momento e instrumentos dispon√≠veis expande-se progressivamente a medida em que hip√≥teses s√£o feitas sobre a correla√ß√£o de $u_{it}$ e $Z_{is}$, para $s,t=1,...,T$.

* A √™nfase est√° em **utilizar os componentes ex√≥genos dos regressores** como instrumentos mais de uma vez (instrumentos internos), mas √© importante destacar que a t√©cnica tamb√©m se aplica aos instrumentos tradicionais que estejam dispon√≠veis fora (externos/exclu√≠dos) da regress√£o.


**Quais os tipos de instrumentos poss√≠veis para utilizarmos em estimadores com Dados em Painel?**

* **Instrumentos externo:** Vari√°vel correlacionada com a vari√°vel de interesse mas n√£o com o termo de erro (visto anteriormente).

* **Instrumentos internos:** Uso de regressores ex√≥genos em per√≠odos diferentes que o per√≠odo corrente (ex. vari√°veis defasadas). A depender das hip√≥teses de exogeneidade consideradas.


Sabemos que **√© dif√≠cil obter vari√°vei instrumentais**. Assim, os econometristas te√≥ricos ao considerarem a pr√≥pria estrutura da base de dados em painel, tiveram a ideia de **utilizar as defasagens das pr√≥prias vari√°veis explicativas** como instrumentos para vari√°veis end√≥genas. A l√≥gica √© que eventos passados n√£o afetam diretamente o resultado do presente, entretanto est√£o relacionados com a vari√°vel end√≥gena. Assim:

* Se assumirmos que $E[x_{it‚àí1} u_{it}]=0$ ent√£o $x_{it‚àí1}$ est√° dispon√≠vel como um instrumento adicional.
* Haviamos definido anteriormente que $Z_i$ representava a matriz das vari√°veis ex√≥genas. Ent√£o a matriz $Z_i$ ser√° composta tanto pelos **regressores correntes** (ex√≥genos) quanto pelas **defasagens ex√≥genas**.
* Se supormos que **todos os regressores s√£o contemporaneamente ex√≥genos**, teremos um modelo exatamente identificado, e implicar√° no Pooled OLS (ou LSDV).

Vejamos quais as hip√≥teses necess√°rias para que isso seja poss√≠vel, e quais as implica√ß√µes para a estima√ß√£o dos par√¢metros.


**Hip√≥teses de Exogeneidade**

**Hip√≥tese de Exogeneidade Contempor√¢nea**
* Os instrumentos s√£o assumidos como contemporaneamente n√£o correlacionados com o termo de erro
* $E[Z_{it}u_{it}] = 0$ para $t=1,...,T$

**Hip√≥tese de Exogeneidade Fraca**
* Tamb√©m chamada de hip√≥tese de instrumentos predeterminados, considera-se adicionalmente que os valores das defasagens dos instrumentos s√£o n√£o correlacionados com o erro do per√≠odo corrente. 
* $ E[Z_{is}u_{it}] = 0$ para $s=1,...,t-1$ e $t=1,...,T$
* OBS: Essa condi√ß√£o ser√° mais relevante nos **modelos din√¢micos com vari√°veis dependentes como regressores**.

**Hip√≥tese de Exogeneidade Forte**
* Hip√≥tese mais forte que a anterior, onde os valores futuros dos instrumentos s√£o assumidos n√£o correlacionados com o erro corrente. 
* $E[Z_{is}u_{it}] = 0$ para $s,t$; $t=1,...,T$
* Ent√£o valores passados, correntes e futuros de Z s√£o instrumentos validos.

**Estimadores tradicionais de dados em painel**

* POLS
* Efeitos Fixos com Vari√°veis dummies
* Estimador de Efeitos Fixos Within
* Estimador de Primeira Diferen√ßa
* Estimador Between
* Efeitos Aleat√≥rios

Vimos que em ci√™ncias sociais aplicadas o controle dos efeitos fixos √© fundamental para a obten√ß√£o de estimadores consistentes numa estrutura de dados em painel. Entretanto, os te√≥ricos da econometria se questionaram se exisitiria alguma forma de eliminar uma outra fonte de vi√©s al√©m daquela proveniente dos efeitos fixos. Para isso, eles pensaram em uma estrat√©gia que consiste em controlar os efeitos fixos e estimar os modelos empregando o estimador de vari√°veis instrumentais.

Logo, a ideia foi combinar a elimina√ß√£o/controle dos efeitos fixos com os estimadores IV, 2SLS e GMM.




#### IV for LSDV

√â o estimador IV, ou 2SLS ou Panel GMM para o modelo de efeitos fixos com vari√°veis dummies.

$$ y_{it} = \alpha_i + \beta x_{it} + u_{it}$$

para $t=1,...,T$ e $i=1,...,N$.

* Sob a **hip√≥tese de exogeneidade fraca**, $E[Z_{is} u_{it}]=0$ para $s‚â§t$;
* Temos um estimador IV consistente para beta.

#### IV for First-Differences Model

√â o estimador IV, ou 2SLS ou Panel GMM para o modelo em primeira diferen√ßa:

$$\Delta y_{it} = \Delta x_{it}\beta + \Delta u_{it}$$

$$ y_{it} - y_{it-1} = (x_{it} - x_{it-1})\beta + u_{it} - u_{it-1}$$

para $t=1,...,T$ e $i=1,...,N$.


* Sob a **hip√≥tese de exogeneidade fraca**, $E[Z_{is} (u_{it} ‚àí u_{it‚àí1})]=0$ para $s‚â§t‚àí1$;

* Sabemos que a primeira diferen√ßa reduz a dimens√£o temporal do conjunto dos instrumentos dispon√≠veis em um per√≠odo.

* Ao assumirmos exogeneidade fraca temos um estimador IV consistente para beta.


#### IV for Within or Mean-Defferenced Model (Within IV Estimator)

O Within IV Estimator √© o estimador IV, 2SLS, ou Painel GMM do modelo:

$$y_{it} - \bar{y}_{i} = (x_{it}-\bar{x}_{i})'\beta + (u_{it}-\bar{u}_{i})$$

para $t=1,...,T$ e $i=1,...,N$.

* Considerando o modelo de painel Within, $E[Z_{is} u_{ùëñ}] \neq 0$ para todo $s$, porque a m√©dia do termo de erro inclui o passado (o presente e o futuro), logo √© correlacionado com $Z_{is}$ por constru√ß√£o.

* O estimador **IV de modelo Within leva √† estima√ß√µes inconsistentes de beta** se os instrumentos s√£o fracamente ex√≥genos, at√© mesmo se eles satisfazem as hip√≥teses de exogeneidade contempor√¢nea. Logo, **a transforma√ß√£o within somente pode ser usada se os instrumentos s√£o realmente fortemente ex√≥genos (ou com Instrumentos Exclu√≠dos)**.


Logo, √© teoricamente poss√≠vel utilizar vari√°veis defasaadas como instrumentos para vari√°veis end√≥genas. Entretanto, √© preciso lembrar que para controlar corretamente o efeito fixo individual, apenas os modelos LSVD e de primeira diferen√ßas s√£o adequados. O modelo within n√£o √© adequado porque a m√©dia do termo de erro inclui o passado (o presente e o futuro), logo √© correlacionado com $Z_{is}$.

### Modelos Din√¢micos

Em algumas discuss√µes te√≥ricas, argumenta-se que o comportamento econ√¥mico pode ser influenciado pelo passado recente. Por exemplo, o consumo pode apresentar padr√µes devido √† raz√µes psicol√≥gicas, onde as pessoas n√£o mudam seus h√°bitos de forma imediata. Al√©m disso, as raz√µes tecnol√≥gicas ou institucionais tamb√©m contam para a natureza din√¢mica em uma rela√ß√£o econom√©trica. Logo, se justificaria o tempo para ajustar o novo padr√£o de consumo. Ou seja, a vari√°vel dependente defasada considerada dentro do modelo de regress√£o agregaria um peso da hist√≥ria a estima√ß√£o (modelo din√¢mico). 

Al√©m disso, a estrutura din√¢mica permitiria estima√ß√£o de **efeitos de curto** e **longo prazos**.


O modelo din√¢mico √© dado por:

$$y_{it} = \rho y_{it-1} + x_{it}'\beta + \alpha_{i} +u_{it}$$

para $t=2,...,T$ e $i=1,...,N$. 

Repare que estamos modelando a vari√°vel dependente como uma fun√ß√£o de seu pr√≥prio passado e de regressores contempor√¢neos e os efeitos fixos individuais. Como de costume, o painel √© curto com dados independentes em $i$. Tamb√©m √© assumido que $|\rho|<1$. Mesmo que $\alpha_{i}$ seja um efeito aleat√≥rio, a estima√ß√£o OLS leva √† coeficientes inconsistentes porque a vari√°vel dependente defasada √© correlacionada com $\alpha_{i}$, e com o erro composto ($\alpha_{i} + \epsilon_{it}$).


Para o desenvolvimento dos estimadores, vamos considerar estima√ß√µes com $\alpha_{i}$ como efeito-fixo, $|\rho|<1$, erro $\epsilon_{it}$ n√£o serialmente correlacionado, e painel curto(estrutura de aplica√ß√µes microecon√¥micas).



Por simplicidade, seja beta igual a zero, ent√£o:

$$y_{it} = \rho y_{it-1} + \alpha_{i} +u_{it}$$

Teoricamente, 
$$E[y_{it}|y_{it-1},\alpha_{i}] = \rho y_{it-1} + \alpha_{i}$$

e, 

$$corr(y_{it},y_{it-1}) = \rho$$

Entretanto, como $\alpha_{i}$ √© desconhecido, e observamos:

$$E[y_{it}|y_{it-1}, \alpha_{i}] = \rho y_{it-1} + E[\alpha_{i}|y_{it-1}]$$

Isso implica que

$$ corr(y_{it},y_{it-1}) \neq \rho$$

Porque, para o caso de beta igual a zero (depois de alguma √°lgebra), teremos:

$$corr(y_{it},y_{it-1}) = corr[(\rho y_{it-1} + \alpha_{i} + u_{it}),y_{it-1}] = \rho + \frac{(1-\rho)}{1+(1-\rho)\sigma_{\epsilon}^{2}/(1+\rho)\sigma_{\alpha}^{2}}$$

Esse resultado mostra que h√° duas raz√µes para a correla√ß√£o entre $y_{it}$ e $y_{it-1}$:

* **Um verdadeiro estado de depend√™ncia** que ocorre quando a correla√ß√£o no tempo √© devido ao mecanismo causal em que o per√≠odo defasado determina o per√≠odo atual. Essa depend√™ncia √© relativamente maior se o efeito individual $\alpha_{i}$ for aproximadamente zero assim como $corr(y_{it},y_{it-1})$ for aproximadamente igual a $\rho$. Mais geralmente, isso ocorre quando $\sigma^{2}_{\alpha}$ √© menor relativo √† $\sigma^{2}_{\epsilon}$.
* **Devido √† heterogeneidade n√£o observada**: que surge mesmo se n√£o houver mecanismo causal, $\rho=0$, mesmo assim h√° correla√ß√£o simplificando a rela√ß√£o em $\frac{1}{1+\frac{\sigma^{2}_{\epsilon}}{\sigma_{\alpha}^{2}}}= \frac{\sigma^{2}_{\alpha}}{(\sigma^{2}_{\alpha}+\sigma^{2}_{\epsilon})}$. 

**Inconsist√™ncia dos estimadores em Painel Cl√°ssicos**

Todos os estimadores vistos anteriormente s√£o inconsistentes se a regress√£o apresentar vari√°vel dependente defasada, mesmo no caso do modelo de efeitos aleat√≥rios.

* Considere o estimador POLS de $ùë¶_ùëñùë°$ sobre $y_{it‚àí1}$ e $x_{it}$. A vari√°vel dependente √© correlacionada com o termo de erro conjunto ($\alpha_ùëñ + \epsilon_{ùëñùë°}$).
* Considere o estimador Within, o regressor ($ùë¶_{ùëñùë°‚àí1} ‚àí \bar{ùë¶}_{ùëñ}$) √© correlacionado com o erro ($\epsilon_{ùëñùë°} ‚àí \bar{\epsilon}_{ùëñ}$) porque √© correlacionado com $\epsilon_{ùëñùë°‚àí1}$ que est√° em sua m√©dia $\bar{\epsilon}_{i}$
* E do estimador **Random effects** porque √© uma **combina√ß√£o dos estimadores between e within**.


#### Dynamic Panel Data (Arellano-Bond estimator)

Considerando a primeira diferen√ßa do modelo din√¢mico:

$$(y_{it}- y_{it-1}) = \rho (y_{it-1} - y_{it-2}) + (x_{it} - x_{it-1})'\beta + (\alpha_{i} - \alpha_{i}) + (\epsilon_{it} - \epsilon_{it-1})$$

$i=1,...,N$ e $t=3,...,T$.

O estimador OLS √© inconsistente porque $y_{it-1}$ √© correlacionado com $\epsilon_{it-1}$, logo o regressor ($y_{it-1} - y_{it-2}$) √© correlacionado com o erro ($\epsilon_{it} - \epsilon_{it-1}$). Implicando em endogeneidade por constru√ß√£o.

**Anderson e Hsiao (1981)** propuseram estimar a equa√ß√£o com $y_{it-2}$ como instrumento para $y_{it-1} - y_{it-2}$. O instrumento √© v√°lido porque n√£o est√° correlacionado com o erro ($\epsilon_{it} - \epsilon_{it-1}$), desde que o termo de erro n√£o seja serialmente correlacionado. Outro instrumento proposto foi o $\Delta y_{it-2}$, como instrumento para $\Delta y_{it-1}$.

**Arellano e Bond (1991)** propuseram um estimador GMM para o modelo din√¢mico. **A ideia √© adicionar mais defasagens da vari√°vel dependente como instrumentos**. Por exemplo, $y_{it-2}, y_{it-3},...,y_{it-s}$, onde $s$ √© o n√∫mero de defasagens da vari√°vel dependente. Dessa forma √© possivel obter um estimador sobreidentificado, para buscar uma estima√ß√£o teoricamente mais eficiente. Repare que o n√∫mero de instrumentos cresce a medida que o tempo se aproxima de $T$. Por exemplo, no per√≠odo 3 temos somente o instrumento $y_{it-1}$. No per√≠odo 4 temos $y_{it-1}$ e $y_{it-2}$, no per√≠odo 5 teremos, $y_{it-1}$, $y_{it-2}$ e $y_{it-3}$, e assim por diante. 


O estimador GMM de Arellano-Bond √© dado por:

$$\hat{\beta}_{AB} =  \left [ \left (  \sum_{i}^{N} \tilde{X}_{i}¬¥Z_{i} \right ) W_{N} \left (  \sum_{i}^{N} Z_{i}¬¥\tilde{X}_{i}\right )\right]^{-1} \left (  \sum_{i}^{N} \tilde{X}_{i}¬¥Z_{i} \right ) W_{N} \left (  \sum_{i}^{N} Z_{i}¬¥\tilde{y}_{i} \right )$$

onde $\tilde{X}_{i}$ √© uma matriz (T-2)x(K+1) com a linha ($\Delta y_{i,t-1}, \Delta x_{it}¬¥$), $t=3,...T$, $\tilde{y}_{i}$ √© um vetor (T-2)x1 com a linha ($\Delta y_{i,t}$), $t=3,...T$, e $Z_{i}$ √© uma matriz de instrumentos (T-2)xr 

$$ Z_{i} = \begin{bmatrix} 
z_{i3}¬¥ & 0 & ... & 0 \\ 
0 & z_{i4}¬¥ & ... & 0 \\ 
\vdots & \vdots & \vdots & \vdots \\ 
0 & 0 & ... & z_{iT}¬¥ \\ 
\end{bmatrix}$$

No arcabou√ßo de Anderson-Hsiao, as vari√°veis defasadas em 2 per√≠odos aparecem da seguinte forma na matriz de instrumento(s) (exclu√≠do(s)):

$$ Z_{i} = \begin{pmatrix}
. \\
y_{i,1} \\
\vdots  \\
y_{i,T-2} \\
\end{pmatrix}
$$


Onde a primeira linha corresponde √† $t=2$, dado que a primeira observa√ß√£o √© perdida pela aplica√ß√£o da primeira diferen√ßa. O valor ‚Äúmissing‚Äù no instrumento para $t=2$ implica na remo√ß√£o da observa√ß√£o na estima√ß√£o. Se tamb√©m incluirmos a terceira defasagem como um segundo instrumento no arcabou√ßo de Anderson-Hsiao, n√≥s perderemos outra observa√ß√£o no painel:

$$
Z_{i} = \begin{pmatrix}
. & . \\
y_{i,1} & . \\
y_{i,2} &  y_{i,1}\\
\vdots & \vdots \\
y_{i,T-2} & y_{i,T-3} \\
\end{pmatrix}
$$ 

Ent√£o a primeira observa√ß√£o dispon√≠vel para a regress√£o √© para $t=4$; Para lidar com isso, Holtz-Eakin et al. (1988); Construiram um conjunto de instrumentos a partir da segunda defasagem de $y$, de modo que cada instrumento pertence a cada per√≠odo:

$$
Z_{i} = \begin{pmatrix}
0 & 0 & 0 & 0 \\
y_{i,1} & 0 & 0 & 0 \\
0 & y_{i,2} & 0 & 0 \\
\vdots & \vdots & \vdots & \vdots \\
0 & 0 & 0 & y_{i,T-2} \\
\end{pmatrix}
$$

A inclus√£o dos zeros no lugar dos valores ‚Äúmissing¬¥s‚Äù previne a perda de graus de liberdade, onde todas as observa√ß√µes datadas em t=2 e anteriores podem ser inclu√≠das na regress√£o. A condi√ß√£o de momento resultante corresponde: $ùê∏(ùë¶_{ùëñ,ùë°‚àí2} \epsilon_{ùëñùë°})=0$. A matriz vista anteriormente tamb√©m deve ser v√°lida se colapsarmos as colunas (‚Äúcollapse‚Äù) de Z em uma √∫nica coluna, a qual incorpora a mesma expectativa anterior, produzindo um √∫nica condi√ß√£o de momento. Nesse sentido, o conjunto dos instrumentos colapsados ser√° o mesmo que o IV padr√£o, com zero em substitui√ß√£o aos dados missing.

$$
Z_{i} = \begin{pmatrix}
0 \\
y_{i,1} \\
y_{i,2} \\
\vdots \\
y_{i,T-2} \\
\end{pmatrix}
$$

Por outro lador, poder√≠amos incluir **todas as vari√°veis defasadas dispon√≠veis**.

$$
Z_{i} = \begin{pmatrix}
0 & 0 & 0 & 0 & 0 & 0 & \vdots \\
y_{i,1} & 0 & 0 & 0 & 0 & 0 & \vdots \\
0 & y_{i,2} & y_{i,1} & 0 & 0 & 0 & \vdots \\
0 & 0 & 0 & y_{i,3} & y_{i,2} & y_{i,1} & \vdots \\
\vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\
0 & 0 & 0 & 0 & 0 & 0 & \vdots \\
\end{pmatrix}
$$

Temos diferentes instrumentos dispon√≠veis para cada per√≠odo, um para o per√≠odo $t=2$; dois para o per√≠odo $t=3$; e assim por diante. Uma **desvantagem dessa estrat√©gia** √© que o n√∫mero de instrumentos produzidos ser√° quadr√°tico em T. Para uma dimens√£o temporal mais longa (T>10, por exemplo) √© necess√°rio restringir o numero de defasagens utilizadas.

O estimador em **Painel GMM din√¢mico em diferen√ßa** com a matriz de instrumentos descrita anteriormente √© conhecido como **Difference GMM**. 


**Quando utilizar o Estimador Arellano-Bond (Diff-GMM)?**

* T pequeno, e N Grande.
* Rela√ß√£o funcional linear;
* Din√¢mica da vari√°vel dependente;
* Exist√™ncia de vari√°veis explicativas n√£o estritamente ex√≥genas (podem ser correlacionadas com o passado e, ou, com o termo de erro).
* Efeito fixo;
* Heterocedasticidade e autocorrela√ß√£o dentro dos erros das unidades individuais, mas n√£o entre elas.


**Situa√ß√µes onde o modelo Diff-GMM n√£o prov√™ boas estima√ß√µes:**

* **Sob heterocedasticidade:** ent√£o utilizamos o estimador two-step GMM. Este √© robusto √† heterocedasticidade, entretanto os erros padr√£o s√£o enviesados para baixo. Entretanto, este problema foi resolvido por **Windmeijer (2005)**, o qual prop√¥s uma **corre√ß√£o para o estimador two-step GMM**.
* **Quando se utiliza regressores invariantes no tempo:** A primeira diferen√ßa elimina todas os regressores constantes. (veremos que o System GMM resolve esse problema de forma colateral).
* Quando $y$ se aproxima de um passeio aleat√≥rio, o Diff-GMM performa fracamente. Porque as defasagens adicionam pouca informa√ß√£o sobre as mudan√ßas futuras, ent√£o as defasagens em n√≠vel s√£o instrumentos fracos para as vari√°veis transformadas. 
* Uma fraqueza adicional do estimador Diff-GMM ocorre quando o painel √© desbalanceado, de modo que se perde informa√ß√£o devido aos dados missing. 







#### System GMM - Blundel-Bond estimator

Al√©m de utilizar a equa√ß√£o em diferen√ßas (e suas defasagens em n√≠vel como instrumentos), o estimador de Blundel-Bond (1998) tamb√©m considera a equa√ß√£o em n√≠vel utilizando as diferen√ßas defasadas como instrumentos. Implicando em um conjunto adicional de instrumentos. Este estimador √© chamado de System GMM.

* Assume que $ùê∏[\Delta y_{ùëñùë°} \alpha_ùëñ ]=0$ para todo $i$. 
* Ent√£o, $\Delta ùë¶_{ùëñùë°}$ √© um instrumento v√°lido. A equa√ß√£o em n√≠vel √© instrumentalizada pelas diferen√ßas. 
* A hip√≥tese √© v√°lida para erros n√£o serialmente correlacionados.


**Em suma**:

* O estimador **Difference GMM de Arellano e Bond (1991) mostrou ter fracas propriedades para amostra finita** (em termos de vi√©s e imprecis√£o) no caso em que as s√©ries s√£o altamente persistentes ou se a vari√¢ncia do efeito espec√≠fico individual √© grande em rela√ß√£o √† vari√¢ncia do erro (ver Blundell e Bond, 1998). Nesses casos, os n√≠veis defasados ‚Äã‚Äãda s√©rie s√£o apenas fracamente correlacionados com as primeiras diferen√ßas subsequentes, levando a instrumentos fracos. A fraqueza do instrumento, por sua vez, aumenta a vari√¢ncia dos coeficientes e, em amostras relativamente pequenas, √© prov√°vel que gere estimativas enviesadas. 

* **A recomenda√ß√£o √© o estimador System GMM** de Blundell e Bond (1998). √â importante lembrar que uma **prolifera√ß√£o de instrumentos** pode superestimar as vari√°veis ‚Äã‚Äãend√≥genas e levar a uma perda de poder na infer√™ncia, mas pode-se **restringir o comprimento m√°ximo dos instrumentos defasados**. 

* Em geral, os ganhos da estima√ß√£o SYS-GMM em rela√ß√£o ao estimador de Diff-GMM s√£o mais acentuadas quando as unidades de painel (N) s√£o grandes (>30) e os per√≠odos de tempo (T) s√£o moderadamente pequeno (entre 10 e 20/25).



#### Testes de Diagn√≥sticos

**Teste de autocorrela√ß√£o de Arellano-Bond**
Se os erros s√£o serialmente n√£o correlacionados, esperamos:
* **rejeitar a hip√≥tese de n√£o exist√™ncia de correla√ß√£o para a primeira ordem, AR(1)**
* **Aceitar a hip√≥tese nula para as ordens superiores, AR(2)**. 
* Isto √©, √© esperado que o AR(1) seja estat√≠sticamente diferente de zero porque $D.u_{it} = u_{it} ‚Äì u_{it-1}$ deve se correlacionar com $D.u_{it-1} = u_{it-1} ‚Äì u_{it-2}$ , porque eles compartilham o termo $u_{it-1}$.

**Teste de sobreidentifica√ß√£o de Hansen/Sargan** (Valida√ß√£o dos instrumentos)

Testa-se se os instrumentos, como um grupo/conjunto, s√£o ex√≥genos.

* Sargan (one-step, non-robust)
* Hansen (two-step, robust)
* Difference in Hansen/Sargan test: Testa se as condi√ß√µes de momento adicionais do SYS-GMM s√£o ortogonais ao erro. (Ho: os instrumentos adicionais s√£o v√°lidos)

Antes de realizar as aplica√ß√µes, vejamos nossas op√ß√µes para regress√£o dos modelos din√¢micos em painel.

Lembre que o estimador **one-step** GMM assume uma matriz de pesos $W=(Z¬¥Z)^{-1}$ , tornando-se no 2SLS. J√° o Two-Step GMM assume $W=\hat{S}^{-1}$ onde $\hat{S}=\frac{1}{n}\sum Z_{i}¬¥\hat{u}_{i}\hat{u}_{i}¬¥Z_{i}$. √â chamado de Two-step GMM porque no primeiro est√°gio obtem-se os res√≠duos por 2SLS para compor $\hat{S}$, e no segundo est√°gio utiliza-se $\hat{S}$ para obter o estimador GMM. 

Ent√£o, podemos aplicar o One-step e o Two-Step GMM para o modelo em diferen√ßa (Difference GMM - Arellano-Bond) e para o sistema (n√≠vel e diferen√ßa) (System GMM - Blundel-Bond).

#### Aplica√ß√£o em Python

O pacote para aplica√ß√£o de painel din√¢mico no no Python pode ser encontrado aqui: https://pypi.org/project/pydynpd/ . O pacote reporta erros padr√£o robustos para estimadores one-step e two-step (corrigidos conforme Windmeijer, 2005 ).

Vamos utilizar os dados empregados no exemplo do pr√≥prio pacote. S√£o os dados do artigo de Arellano e Bond (1991). √â um painel desbalanceado com 140 empresas ao longo de 9 anos (1976-1984).

$$ n_{it} = \rho n_{i,t-1} + \rho n_{it-2} + \beta w_{it} + \delta k_{it} + \alpha_{i} + \epsilon_{it}$$

onde, $n$, $w$, e $k$ s√£o o ln do emprego, sal√°rio e capital, respectivamente. $\alpha_{i}$ √© o efeito fixo individual, e $\epsilon_{it}$ √© o erro idiocincr√°tico.

Hip√≥teses:

* Vamos supor que $w$ e $k$ s√£o vari√°veis estritamente ex√≥gena (independentes das demais).
* √â possivel classificar as vari√°veis como predeterminadas (valor √© conhecido ou determinado antes do per√≠odo de an√°lise; s√£o aquelas que n√£o s√£o influenciadas pelas outras vari√°veis do modelo no per√≠odo em an√°lise).

Para estimar o modelo importamos os dados.

In [57]:
# pacotes
import pandas as pd
from  pydynpd import regression
# dados
df = pd.read_csv("data.csv")
print(df.head())

   Unnamed: 0   c1  ind  year    emp     wage     cap    indoutpt         n  \
0           1  1-1    7  1977  5.041  13.1516  0.5894   95.707199  1.617604   
1           2  2-1    7  1978  5.600  12.3018  0.6318   97.356903  1.722767   
2           3  3-1    7  1979  5.015  12.8395  0.6771   99.608299  1.612433   
3           4  4-1    7  1980  4.715  13.8039  0.6171  100.550102  1.550749   
4           5  5-1    7  1981  4.093  14.2897  0.5076   99.558098  1.409278   

          w  ...      ysL2  yr1976  yr1977  yr1978  yr1979  yr1980  yr1981  \
0  2.576543  ...       NaN       0       1       0       0       0       0   
1  2.509746  ...       NaN       0       0       1       0       0       0   
2  2.552526  ...  4.561294       0       0       0       1       0       0   
3  2.624951  ...  4.578383       0       0       0       0       1       0   
4  2.659539  ...  4.601245       0       0       0       0       0       1   

   yr1982  yr1983  yr1984  
0       0       0       0  


Vamos entender os componentes do comando que ser√° empregado.

* Na primeira parte teremos a indica√ß√£o da regress√£o din√¢mica, onde o primeiro termo √© a vari√°vel dependente e os lags das vari√°veis dependentes (defasagens) s√£o indicados por L1.n e L2.n, que s√£o as defasagens de n em 1 e 2 per√≠odos, respectivamente, al√©m das demais vari√°veis explicativas.

* Na segunda parte indicamos como os instrumentos s√£o criados. Podemos usar o segundo e o terceiro lag da vari√°vel dependente (por exemplo, L2.n e L3.n) como instrumentos, ent√£o inclu√≠mos a lista gmm: $gmm(n, 2:3)$. Ou apenas indicar a vari√°vel end√≥gena (endo(n)). Se acreditamos que a vari√°vel $w$ √© predeterminada e usamos o primeiro e os lags subsequentes como instrumentos (por exemplo, L1.w, L2.W, ...), Assim, inclu√≠mos uma segunda lista gmm: $gmm(w, 1:.)$ o ponto significa que n√£o h√° restri√ß√£o com respeito ao m√°ximo de lags que podem ser inclu√≠dos. Entretanto, se supormos que ela seja predeterminada, indicamos pred(w), por exemplo. Se supomos que $k$ √© estritamente ex√≥geno, ent√£o na lista de IV, indicamos $iv(k)$. Isso mostra ao pacote para usar $k$ como instrumento para si mesmo.
* A terceira parte do comando √© indicada as op√ß√µes para estima√ß√£o:
  * **one-step**: performa o estimador One-step GMM.
  * **nolevel**: performa somente o difference GMM.
  * **iterated**: performa a estima√ß√£o GMM iterativa (Iterated Efficient GMM - usa o two-step efficient GMM estimator, O processo √© repetido (iterado) at√© que as estimativas de $\hat{g}(\hat{S}^{-1}(\hat{W}))$ n√£o mudem significativamente de uma itera√ß√£o para outra. Pesquisas recentes aprofundam o estimador: Econometrica, Vol.89, No.3 (May,2021), 1419‚Äì1447).
  * **timedumm**: inclui automaticamente vari√°veis dummies na primeira parte, e a declara√ß√£o iv na segunda.
  * **hqic**: se houver v√°rios modelos concorrentes, classifique-os por hqic em vez de pelo bic padr√£o.
  * **collapse**: colapse os instrumentos para reduzir o problema de muitos instrumentos.
  
* Finalmente, colocamos todos juntos.

In [59]:
# One-Step Difference GMM
One_Step_Diff_GMM = regression.abond('n L1.n w k | endo(n) iv(w k) | onestep nolevel collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, one-step difference GMM
 Group variable: id                              Number of obs = 751     
 Time variable: year                             Min obs per group: 5    
 Number of instruments = 9                       Max obs per group: 7    
 Number of groups = 140                          Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.8436831  |      0.1399704      | 6.0275826  | 0.0000000 | *** |
|  w   | -0.6277566 |      0.1972370      | -3.1827528 | 0.0014588 |  ** |
|  k   | 0.2224798  |      0.0560811      | 3.9671102  | 0.0000727 | *** |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(6) = 21.428 Prob > Chi2 = 0.002
Arellano-Bond test for AR(1) in first differences:

In [60]:
One_Step_Diff_GMM.models[0].regression_table

Unnamed: 0,variable,coefficient,std_err,z_value,p_value,sig
0,L1.n,0.843683,0.13997,6.027583,1.664302e-09,***
1,w,-0.627757,0.197237,-3.182753,0.001458821,**
2,k,0.22248,0.056081,3.96711,7.274936e-05,***


In [61]:
rho = One_Step_Diff_GMM.models[0].regression_table.iloc[0]['coefficient']
w_beta = One_Step_Diff_GMM.models[0].regression_table.iloc[1]['coefficient']
lr_w_beta = w_beta / (1 - rho)
print(lr_w_beta)

erro_padrao_rho = One_Step_Diff_GMM.models[0].regression_table.iloc[0]['std_err']
estatistica_z = rho / erro_padrao_rho
estatistica_z
print(estatistica_z)

erro_padrao_w = One_Step_Diff_GMM.models[0].regression_table.iloc[1]['std_err']
erro_padrao_longo_prazo_w = erro_padrao_w / ((1 - w_beta) ** 2)
estatistica_z_w = w_beta / erro_padrao_longo_prazo_w
print(estatistica_z_w)

-4.015923039631502
6.027582550565978
-8.432994982004542


In [62]:
# Two-Step Diff GMM
Two_Step_Diff_GMM = regression.abond('n L1.n w k | endo(n) iv(w k)| nolevel collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step difference GMM
 Group variable: id                              Number of obs = 751     
 Time variable: year                             Min obs per group: 5    
 Number of instruments = 9                       Max obs per group: 7    
 Number of groups = 140                          Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.6989810  |      0.1282409      | 5.4505313  | 0.0000001 | *** |
|  w   | -0.7691985 |      0.1041913      | -7.3825596 | 0.0000000 | *** |
|  k   | 0.2408001  |      0.0659494      | 3.6512839  | 0.0002609 | *** |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(6) = 21.428 Prob > Chi2 = 0.002
Arellano-Bond test for AR(1) in first differences:

In [63]:
# One-Step System GMM
One_Step_Sys_GMM = regression.abond('n L1.n w k | endo(n) iv(w k) | onestep collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, one-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 11                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |    |
+------+------------+---------------------+------------+-----------+----+
| L1.n | 0.5607060  |      0.1789877      | 3.1326509  | 0.0017324 | ** |
|  w   | -0.2440339 |      0.1038804      | -2.3491803 | 0.0188148 | *  |
|  k   | 0.3595693  |      0.1390491      | 2.5859162  | 0.0097121 | ** |
| _con | 1.3593874  |      0.4831933      | 2.8133406  | 0.0049030 | ** |
+------+------------+---------------------+------------+-----------+----+
Hansen test of overid. restrictions: chi(7) = 29.449 Pro

In [64]:
# Two-Step System GMM
Two_Step_Sys_GMM1 = regression.abond('n L1.n w k | endo(n) iv(w k) | collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 11                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.5103802  |      0.1481366      | 3.4453352  | 0.0005704 | *** |
|  w   | -0.3683856 |      0.1544791      | -2.3846950 | 0.0170933 |  *  |
|  k   | 0.4036385  |      0.1164868      | 3.4651001  | 0.0005300 | *** |
| _con | 1.8120008  |      0.6299040      | 2.8766298  | 0.0040195 |  ** |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(7) = 29

Vamos restringir o n√∫mero de lags para a vari√°vel dependente defasada de 2 a 3.

In [65]:
# Two-Step System GMM - lag (2-3)
Two_Step_Sys_GMM2 = regression.abond('n L1.n w k | gmm(n, 2:3) iv(w k) | collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                              Number of obs = 751     
 Time variable: year                             Min obs per group: 5    
 Number of instruments = 6                       Max obs per group: 7    
 Number of groups = 140                          Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.8693642  |      0.1208382      | 7.1944474  | 0.0000000 | *** |
|  w   | -0.3023662 |      0.1404797      | -2.1523843 | 0.0313671 |  *  |
|  k   | 0.1251722  |      0.0986176      | 1.2692690  | 0.2043451 |     |
| _con | 1.0985217  |      0.5594399      | 1.9636099  | 0.0495753 |  *  |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(2) = 15.879

Permitindo todas as defasagens como instrumento.

In [66]:
# Two-Step System GMM - lag (2-...)
Two_Step_Sys_GMM3 = regression.abond('n L1.n w k | gmm(n, 2:.) iv(w k) | collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 11                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+------+------------+---------------------+------------+-----------+-----+
|  n   |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+------+------------+---------------------+------------+-----------+-----+
| L1.n | 0.5103802  |      0.1481366      | 3.4453352  | 0.0005704 | *** |
|  w   | -0.3683856 |      0.1544791      | -2.3846950 | 0.0170933 |  *  |
|  k   | 0.4036385  |      0.1164868      | 3.4651001  | 0.0005300 | *** |
| _con | 1.8120008  |      0.6299040      | 2.8766298  | 0.0040195 |  ** |
+------+------------+---------------------+------------+-----------+-----+
Hansen test of overid. restrictions: chi(7) = 29

Adicionando efeitos fixos de ano

In [67]:
# Two-Step System GMM - Time fixed effects
Two_Step_Sys_GMM4 = regression.abond('n L1.n w k | gmm(n, 2:.) iv(w k) | timedumm collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 18                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+-----------+------------+---------------------+------------+-----------+-----+
|     n     |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+-----------+------------+---------------------+------------+-----------+-----+
|    L1.n   | 0.5621990  |      0.1871391      | 3.0041768  | 0.0026630 |  ** |
|     w     | -0.2413994 |      0.1115897      | -2.1632763 | 0.0305199 |  *  |
|     k     | 0.3547180  |      0.1462262      | 2.4258160  | 0.0152740 |  *  |
| year_1978 | -0.0262823 |      0.0187601      | -1.4009676 | 0.1612237 |     |
| year_1979 | -0.0365280 |      0.0217959      | -1.6759069 | 0.0937564 |     |
| year_1

Modelo Iterativo e considerando as covari√°veis como predeterminadas.


In [68]:
# Two-Step System GMM - Iterative e Time fixed effects
Iterated_Sys_GMM = regression.abond('n L1.n w k | gmm(n, 2:.) pred(w k) | iterated timedumm collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, 18-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 34                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+-----------+------------+---------------------+------------+-----------+-----+
|     n     |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+-----------+------------+---------------------+------------+-----------+-----+
|    L1.n   | 0.9851469  |      0.0750937      | 13.1188973 | 0.0000000 | *** |
|     w     | -0.3715333 |      0.1473139      | -2.5220530 | 0.0116672 |  *  |
|     k     | 0.1539436  |      0.0563663      | 2.7311291  | 0.0063118 |  ** |
| year_1978 | -0.0333228 |      0.0178837      | -1.8633021 | 0.0624198 |     |
| year_1979 | -0.0510517 |      0.0210822      | -2.4215521 | 0.0154544 |  *  |
| year_19

**Algu√©m poderia perguntar**:

* E caso eu queira utilizar as defasagens como instrumentos internos para outra vari√°vel end√≥gena? Vamos assumir que desconfiamos que $k$ seja end√≥gena. Ent√£o, podemos utilizar as defasagens de $k$ como instrumentos para $k$.

In [69]:
# Two-Step System GMM - com Time fixed effects
TS_Sys_GMM_TFE = regression.abond('n L1.n w k | gmm(n, 2:.) gmm(k, 2:4) iv(w) | timedumm collapse', df, ['id', 'year'])

 Dynamic panel-data estimation, two-step system GMM
 Group variable: id                               Number of obs = 751     
 Time variable: year                              Min obs per group: 5    
 Number of instruments = 21                       Max obs per group: 7    
 Number of groups = 140                           Avg obs per group: 5.36 
+-----------+------------+---------------------+------------+-----------+-----+
|     n     |   coef.    | Corrected Std. Err. |     z      |   P>|z|   |     |
+-----------+------------+---------------------+------------+-----------+-----+
|    L1.n   | 0.7702054  |      0.1530545      | 5.0322294  | 0.0000005 | *** |
|     w     | -0.1741308 |      0.0538857      | -3.2314868 | 0.0012315 |  ** |
|     k     | 0.2331483  |      0.0714535      | 3.2629388  | 0.0011026 |  ** |
| year_1978 | -0.0173987 |      0.0177855      | -0.9782516 | 0.3279499 |     |
| year_1979 | -0.0283925 |      0.0204651      | -1.3873609 | 0.1653317 |     |
| year_1

**Como calcular o efeito de longo prazo de k?**

Vejamos a partir da √∫ltima regress√£o

In [70]:
TS_Sys_GMM_TFE.models[0].regression_table

Unnamed: 0,variable,coefficient,std_err,z_value,p_value,sig
0,L1.n,0.770205,0.153055,5.032229,4.848088e-07,***
1,w,-0.174131,0.053886,-3.231487,0.00123148,**
2,k,0.233148,0.071453,3.262939,0.001102633,**
3,year_1978,-0.017399,0.017786,-0.978252,0.3279499,
4,year_1979,-0.028393,0.020465,-1.387361,0.1653317,
5,year_1980,-0.058841,0.021046,-2.795829,0.005176677,**
6,year_1981,-0.126677,0.023971,-5.284528,1.260295e-07,***
7,year_1982,-0.098254,0.028223,-3.481309,0.0004989691,***
8,year_1983,-0.054159,0.037805,-1.432584,0.1519766,
9,year_1984,-0.065391,0.056327,-1.160905,0.2456804,


In [71]:
# Calculando o efeito de longo prazo para k
rho = TS_Sys_GMM_TFE.models[0].regression_table.iloc[0]['coefficient']
k_beta = TS_Sys_GMM_TFE.models[0].regression_table.iloc[2]['coefficient']
lr_k_beta = k_beta / (1 - rho)
print(lr_k_beta)


1.0145939508350157


In [72]:
# Estat√≠stica de teste
erro_padrao_k = TS_Sys_GMM_TFE.models[0].regression_table.iloc[1]['std_err']
erro_padrao_longo_prazo_k = erro_padrao_k / ((1 - k_beta) ** 2)
estatistica_z_k = k_beta / erro_padrao_longo_prazo_k
print(estatistica_z_k)

2.544379059344379


: 

#### Aplica√ß√£o na Literatura

**RBE - Revista Brasileira de Economia**: https://periodicos.fgv.br/rbe/article/view/77642 (2020)


<div style="text-align:center;">
    <img src="images/RBE1.png"  alt="Imagem" style="width: 500px;"/>
</div>


<div style="text-align:center;">
    <img src="images/RBE2.png"  alt="Imagem" style="width: 500px;"/>
</div>


#### Considera√ß√µes

* As cr√≠ticas √† esse tipo de estimador recaem principalmente √† **depend√™ncia da escolha dos instrumentos por parte dos pesquidor**. Assim, o pesquisador pode ajustar o numero de defasagens ser√£o utilizadas como instrumento, gerando uma arbitrariedade sobre a escolha do modelo e dos prov√°veis resultados.
* Os **instrumentos internos** s√£o te√≥ricamente v√°lidos, entretanto h√° cr√≠ticas sobre sua rela√ß√£o te√≥rica com a vari√°vel end√≥gena.