# GUIA DE PAINEL DINÂMICO SYSTEM GMM NO STATA

**Autor:** Silvio da Rosa Paula                  
**Data:** 22/07/2022                   
[**Github**](https://github.com/silviopaula)                 
[**Lattes**](http://lattes.cnpq.br/4981826568605006)                  

## Objetivo

O objetivo deste guia é introduzir a utilização de painel dinâmicos, mais especificamente ao estimador*Two-Step System GMM*, dado que ele é assintoticamente mais eficiente que os demais.

## O que é Painel Dinâmico?

Diferentemente do painel de dados estático, no painel dinâmico a variável dependente defasada é considerada como uma variável explicativa dentro da regressão. Deste modo, é possível modelar como as realizações passadas explicam as realizações presentes e futuras. Formalmente podemos expressão os modelos de painel dinâmicos pela seguinte expressão:

$$Y_{it}={\gamma}Y_{it-1} + X'_{it}{\beta} + {\epsilon}_{it}$$          
$${i=1,...,N}$$       
$${T=2,...,T}$$       

Onde $Y_{it}$ é a variável dependente do individuo *i* no período *t*; $Y_{it-1}$ é o *lag* da variável dependente $X'_{it}$ é o vetor de covariadas do modelo e ${\epsilon}_{it}$ é o vetor de erros. 

Dado que a especificação comporta a defasagem da variável dependente, também, é possível estimar os  efeitos de longo prazo, utilizando o coeficiente estimado da variável de interesse $\hat{\beta}$ e o coeficiente da variável dependente defasada ${\gamma}$, substituindo os valores na seguinte expressão:

$$\frac{\hat{\beta}}{1 - {\gamma}}$$

## Porque e quando utilizar estimadores de Painel Dinâmico?

Usualmente, problemas de carácter macroeconômico envolvendo por exemplo, modelos de crescimento, geralmente são estimados por meio de estimadores de painel dinâmico, devido ao comportamento inercial  que advém de razões tecnológicas, institucionais e psicológicas dos agentes que não apresentam mudanças abruptas em seus hábitos após choques, de capital humano, capital físico ou insumos de trabalho. Neste contexto, podemos  considerar que existe um _delay_ na reação do produtor, de modo que a produção não é função apenas do capital físico, capital humano e outros fatores, mas, também, das condições institucionais presentes  e passadas.


Ainda nesta perspectiva,  estimações no contexto macroeconômico apresentam obstáculos que são relacionados a endogeneidade das covariáveis utilizadas nas estimações. O nível agregado das variáveis, torna praticamente inviável encontrar uma variável instrumental W, que afeta a variável dependente Y somente por meio de X. Essa é uma das principais vantagens dos estimadores GMM, pois utilizam como instrumentos as defasagens da variável dependente e das covariadas como instrumentos.
Diante dessas considerações, os estimadores GMM de painel dinâmico são importantes ferramentas para modelar problemas de carácter inercial, onde as realizações passadas são importantes para explicar as realizações presentes e/ou quando os regressores do modelo são endógenos e não dispomos de uma variável instrumental exógena para contornar o problema.

Segundo Roodman (2006), os estimadores de painel dinâmico de Arellano-Bond (1991) e Arellano-Bover (1995) / Blundell-Bond (1998) são cada vez mais populares. Ambos são estimadores gerais projetados para situações:

 1.  Poucos períodos de tempo e muitos indivíduos; 
 2. Relação linear funcional;
 3. A variável dependente com características dinâmicas;
 4. Variáveis explicativas que não são estritamente exógenas, e portanto, correlacionadas com suas  realizações passadas e possivelmente com atuais do erro;
 5. Necessidade de utilização de efeitos fixos individuais;  
 6. Heteroscedasticidade e  autocorrelação nos indivíduos, porém não entre eles.
 

## Modelos de  Painel Dinâmicos

Em uma breve revisão sobre  painel dinâmicos, veremos como se deu a evolução dos principais estimadores. Para modelar a dinâmica, ou seja, a persistência das series, não podemos simplesmente utilizar a a variável dependente defasada dentro de uma estrutura de painel e estimar um ols pois estaremos incorporando uma variável endógena ao modelo, diante dessas considerações:


**Anderson-Hsiao (1981):**

Propõem eliminar o efeito fixo tirando a primeira diferença. Ademais os autores propõem utilizar as variáveis defasadas como instrumentos para as variáveis endógenas.
 
$$Y_{it}={\gamma}Y_{it-1} + X'_{it}{\beta} + {\epsilon}_{it}$$          

$$(Y_{it} - Y_{it-1})={\gamma}(Y_{it} - Y_{it-2} )+ (X'_{it} - X'_{it-1}){\beta} + ({\epsilon}_{it}- {\epsilon}_{it-1})$$           

$${\Delta}Y_{it}={\gamma}{\Delta}Y_{it-1} + {\Delta}X'_{it}{\beta} + {\Delta}{\epsilon}_{it}$$                          
$${i=1,...,N}$$                       
$${T=2,...,T}$$           

Como $Y_{it-2}$ ou $(Y_{it-2}-Y_{it-3})$ são correlacionados com  $(Y_{it-1}-Y_{it-2})$ mas não são correlacionados com $({\epsilon}_{it}-{\epsilon}_{it-1})$ eles podem ser utilizados como instrumento para $(Y_{it-1}-Y_{it-2})$. A estimação é feita pelo estimador de variáveis instrumentais, pois o modelo será exatamente identificado.
Apesar do estimador ser mais preciso a medida que aumenta o número de defasagens, ele gera um _tradeoff_, pois ao aumentar o número de defasagens reduz-se o tamanho da amostra.

**Arellano-bond (1991) - difference-GMM**  

Arellano e Bond ao observarem o estimador de Anderson-Hsiao (1981), propõem utilizar mais defasagens como instrumentos por exemplo: $(Y_{it-2},Y_{it-3},...,)$  tornando o estimador mais eficiente, resultando em um modelo sobreidentificado, que pode ser estimado em dois estágios ou por Painel GMM.

| T |      Defasagens       | Diferença         | Instrumentos      | Nº(iv) |
|---|-----------------------|-------------------|-------------------|--------|
| 3 |$$Y_{it-1},...,Y_{it-3}$$|$$Y_{it-2}-Y_{it-3}$$|    $$Y_{it-1}$$    |   1    |
| 4 |$$Y_{it-1},...,Y_{it-4}$$|$$Y_{it-3}-Y_{it-4}$$|$$Y_{it-1},Y_{it-2}$$|   2    |
| 5 |$$Y_{it-1},...,Y_{it-5}$$|$$Y_{it-4}-Y_{it-5}$$|$$Y_{it-1},Y_{it-2},Y_{it-3}$$|3|


Portanto, Arellano e bond (1991) propuseram um estimador em painel GMM utilizando esse conjunto de instrumentos, ou seja, todas as defasagens como instrumentos. No entanto Arellano e Bover (1995) mostram que o estimador _Diff-GMM_ performa fracamente quando a variável dependente se aproxima de um passeio aleatório. Em outras palavras, quando as realizações passadas de Y não explicam as realizações contemporâneas de Y,  os instrumentos defasados são fracos, e o Diff-GMM é ineficiente.  

Ademais, o estimador mostrou ter fracas propriedades para amostra finita (em termos de viés e imprecisão). E os valores faltantes _missings values_ acabam excluindo muitos instrumentos.

**Arellano e Bover (1995)**       

Diante dos problemas do _Diff-GMM_ , Arellano e Bover (1995) propõem a utilização dos “Desvios Ortogonais”, ou seja, em vez de utilizar apenas a primeira diferença, eles propõem utilizar também a média das observações futuras. Em outras palavras, ao invés de subtrair das observações passadas a contemporânea, eles propõem, subtrair a média das observações futuras em relação a contemporânea. “Estes são chamados de instrumentos de variáveis em nível”

Os desvios ortogonais se mostraram uma boa opção quando o conjunto de dados apresenta muitos missings,  minimizando a perda de informações quando o painel é desbalanceado.


**Blundell e Bond (1998)**   
      
Já Blundell e Bond (1998), observam que  se as variáveis em diferença são não correlacionadas com os efeitos fixos individuais (condição adicional), logo, mais instrumentos podem ser considerados, melhorando a eficiência do estimador de Arellano-Bond (1991), e fornecendo condições de momentos adicionais para a regressão em nível de Arellano-Bover (1995).

Assim, Blundell e Bond (1998) propõem o _System-GMM_, que é formado pela equação em nível, a qual utiliza as defasagens como instrumentos, e a equação em diferença, que utiliza as diferenças defasadas como instrumentos.

Cabe destacar que tanto, o _System-GMM_ como o _Diff-GMM_ podem ser estimados em _One-Step_ e _Two-Step_.

One-Step: nesta abordagem, pressupõe-se que os termos de erros são independentes e identicamente distribuídos (iid) ao longo do tempo (homocedásticos) para cada cross-section.

Two-Step: nesta abordagem, os resíduos obtidos da primeira etapa são empregados para construir uma estimativa consistente da matriz de variância covariância, possibilitando que os termos de erros sejam heteroscedásticos.

Em geral, o estimador Two-Step é assintoticamente mais eficiente que o One-Step, porém em amostras pequenas os erros-padrão decorrentes podem ser subestimados. Para contornar esse problema, evitando que o estimador _Two-Step System GMM_ subestime as verdadeiras variâncias em amostra finita, é utilizado a correção proposta por Windmeijer (2005), tornando o estimador _Two-Step_ assintoticamente mais eficiente.


## Quais as desvantagens do System-GMM?

O System-GMM apresenta o problema de proliferação de muitos instrumentos internos que ocorre de forma quadrática na dimensão temporal, incorrendo em um _trade-off_ entre viés de _overfitting_  ou eficiência do estimador. Em outras palavras, o estimador produz mais instrumentos do que o ideal,  reduzindo os graus de liberdade, gerando um _trade-off_ entre viés e eficiência do estimador.

É importante destacar que além dos instrumentos internos gerados, ainda é possível utilizar instrumentos exógenos externos para melhorar a eficiência do estimador.

## Como controlar a quantidade de  instrumentos utilizados?

Para mitigar  o _trade-off_ entre viés _overfitting_ e a eficiência do estimador, existem três abordagens: Laglimits, Collapse e PCA.

***Laglimits***      

_Laglimits_ ou truncamento da matriz de instrumentos, consiste em limitar as defasagens que serão utilizadas para construção dos instrumentos. Basicamente o pesquisador define previamente a profundidade dos _lags_ que serão utilizados como instrumentos.

***Collapse***        

O _Collapse_ consiste no estreitamento horizontal da matriz de instrumentos, exemplo:

$$
\left(\begin{array}{cc} 
0         &        0 & 0 & ... & 0\\
Y_{i1}  &       0 & 0 & ... & 0\\
0         & Y_{i2} & 0 & ... & 0\\
.         &           . &  . & ... & .\\
.         &           . &  . & ... & .\\
0        &          0 &  0& ... &Y_{iT}\\
\end{array}\right)
$$ 

Quando a matriz é colapsada, é feito um estreitamento horizontal deixando-a com uma única coluna, a qual incorpora a mesma expectativa anterior, produzindo uma única condição de momento.
$$
\left(\begin{array}{cc} 
0         \\
Y_{i1}  \\
0        \\
.         \\
.         \\
Y_{iT}\\
\end{array}\right)
$$

**Principal Components Analysis (PCA)**         

A abordagem de extração de componentes principais consiste no processo de fatoração que minimiza a perda informacional da matriz de instrumentos.
O Método PCA tem a vantagem de apresentar um menor viés, maior robustez, uma vez, que é uma técnica estatisticamente fundamentada e orientada por dados, reduzindo a arbitrariedade do pesquisador na delimitação dos instrumentos, gerando um número menor de instrumentos maximamente representativo.


**Resumo**            

Dentre os métodos para controlar a proliferação de instrumentos, o PCA se destaca, dado que ele reduz a  arbitrariedade  na delimitação dos instrumentos, contudo, ainda é possível especificar quantos componentes principais serão utilizados, o que é muito útil  quando o número de grupos é pequeno.


## Quais são os principais testes do estimador Diff-GMM e System-GMM?              

Quanto aos testes de especificação,  os principais são: teste de sobreidentificação de Sargan (1958) e Hansen (1982), Difference-in-Hansen, testes de autocorrelação de primeira ordem AR(1) e segunda ordem AR(2).

#### Testes de sobreidentificação de Sargan (1958) e Hansen (1982)          

Os testes de sobreidentificação têm como objetivo verificar a validade dos instrumentos internos gerados.  A hipótese nula  é que os instrumentos são não correlacionados com o termo de erro. Logo, a aceitação do H0 corrobora a validade dos instrumentos.

• O teste de **Sargan (1958)** é apropriado quando se utiliza o procedimento de _One-Step_ (ou seja, quando, a matriz de variancia-covariancia é homocedástica).

• O teste de **Hansen (1982)** é apropriado quando se utiliza o procedimento de _Two-Step_ (ou seja, quando, estimação com matriz de variancia-covariancia é heteroscedástica).

Em suma: se utilizar erros robustos a heterocedasticidade _Two-Step_, deve-se relatar os coeficientes do teste de Hansen, caso contrário, deve relatar os coeficientes do teste de Sargan.

#### Testes de autocorrelação de primeira e segunda ordem de Arellano Bond (1991)       

Os testes de autocorrelação de primeira ordem AR (1) e segunda ordem AR (2) tem o objetivo de verificar a consistência do estimador. Para que o estimador seja consistente espera-se que exista correlação serial de primeira ordem e não exista  correção serial de segunda ordem. 

Os testes possuem a seguinte estrutura:
AR (1)
H0: Ausência de autocorrelação de primeira ordem.
H1: Presença de autocorrelação de primeira ordem.

AR (2)
H0: Ausência de autocorrelação de segunda ordem.
H1: Presença de autocorrelação de segunda ordem

Em suma:  espera-se que rejeite H0 em AR (1) e aceite H0 em AR (2), para que o estimador seja consistente.

#### Teste de Difference-in-Hansen       

O teste de diferença de Hansen, tem o objetivo de verificar se os instrumentos adicionais são válidos.

H0: os instrumentos adicionais são válidos;
H1: os instrumentos adicionais não são válidos;

## Exemplo de interpretação dos testes.            

***output OK***
Considere a seguinte saída do _Two-Step System GMM_: 

A quantidade de grupos, ou seja, a quantidade de ids é 27 (Unidadades da Federação); 
A quantidade  de instrumentos gerados foi 26. 
total de observações N=390.


|Testes      | Coef  |P-values|
|------------|-------|--------|
|AR(1)       | -3.13 | 0.000  |
|AR(2)       | 1.45  | 0.312  |
|Sargan      | 63.96 | 0.000  |
|J-Hansen    | 16.81 | 0.157  |
|Diff-Hansen | 8.93  | 0.338  |


**Comentando os testes:**          

- Rejeitamos a hipótese nula de ausência de autocorrelação de primeira ordem AR (1) e não rejeitam a hipótese nula de ausência de autocorrelação de segunda ordem AR (2) indicando que os instrumentos são validos e não são correlacionados com o termo de erro.
- O teste Sargan deve ser reportado somente para estimação _One-Step_, não sendo valido para a estimação _Two-Step_, pois podem indicar erros do tipo I e II.
- O teste J-Hansen não rejeita a hipótese nula de que os instrumentos são validos (P-value >0,05).
- O teste Difference-in-Hansen, não rejeita a hipótese nula que os instrumentos adicionais são válidos (P-value >0,05).
- O número de instrumentos é menor que o número de grupos.

Em suma: o output indica que os instrumentos são válidos e não são correlacionados com o termo de erro. Outra coisa que deve ser observado


***output RUIM***             

Considere a seguinte saída do _Two-Step System GMM_: 

A quantidade de grupos, ou seja, a quantidade de ids é 27 (Unidadades da Federação); 
A quantidade de instrumentos gerados foi 156 (não foi controlado a proliferação dos instrumentos); 
total de observações N=390.

|Testes      | Coef  |P-values|
|------------|-------|--------|
|AR(1)       | -3.13 | 0.000  |
|AR(2)       | 1.45  | 0.312  |
|Sargan      | 636.96| 0.999  |
|J-Hansen    | 166.81| 1.000  |
|Diff-Hansen | 81.93 | 0.998  |

**Comentando os testes:**         

- Rejeitamos a hipótese nula de ausência de autocorrelação de primeira ordem AR (1) e não rejeitam a hipótese nula de ausência de autocorrelação de segunda ordem AR (2) indicando que os instrumentos são validos e não são correlacionados com o termo de erro.
 
- A principio os resultados dos testes de Sargan e J-Hansen parecem estar melhores. No entanto, esses resultados implausivelmente bons, P-valores próximos 1.000, são frutos da proliferação de muitos instrumentos. Os testes de Sargan e Hansen são sensíveis a proliferação dos instrumentos, a ponto de gerar resultados enganosos (Anderson e Sørenson 1996 e Bowsher 2002). O próprio Sargan (1958) sem o auxílio de computadores determinou que o erro em seu teste é “proporcional ao número de variáveis instrumentais” (ROODMAN 2006, 2009ab). Portanto, devemos ter muito cuidado com P-valores muito altos, para isso siga a orientação de Labra e Torrecillas (2014) e Lillo e Torrecillas (2018), mantendo o número de instrumentos menor ou igual ao número de grupos, por meio dos métodos Laglimits, Collapse ou PCA.

## Aplicando System GMM no Stata          

Como exemplo de aplicação, utilizarei o artigo no qual sou coautor: [Economic Growth Channels From Human Capital: A Dynamic Panel Analysis for Brazil](https://www.scielo.br/j/rbe/a/KkYHXdsxP7nXzLRBCbY64Vq/?lang=en), neste estudo, avaliamos como o capital humano básico e superior afeta o crescimento econômico das unidades federativas do Brasil, no período de 1996 a 2015. Como fundamentação teórica utilizamos os modelos de crescimento econômico de  Solow (1956) aumentado e Nelson e Phelps (1966). Na estratégia empírica utilizamos _Two-Step System GMM_, com a correção dos erros padrão para amostra finita de Windmeijer (2005), e análise dos componentes principais PCA para controlar a proliferação dos instrumentos. O software utilizado foi o Stata.


#### Sintaxe do pacote xtabond2.

In [None]:
 xtabond2 Y L.Y X, gmm(L.Y) iv(X, lag(2 6) collapse) twostep robust pca components (10) orthogonal

Onde: 
* xtabond2  - é o nome da função que será executada.           

* Y - representa a variável dependente         

* L.Y - representa a primeira defasagem da variável dependente (Nota: é possível utilizar mais defasagens, (L2.Y), (L3.Y), porém, isso acarretará em mais testes de autocorrelação.            

* gmm(L.Y) - no gmm( ) são especificadas as variáveis endógenas do modelo.         

* iv(X) - no iv( ) são especificados as variáveis que serão utilizadas como instrumentos (Nota: também é possível utilizar instrumentos adicionais que não foram especificados na regressão.            

* twostep - indica que será utilizado o estimador em duas etapas, conforme visto anteriormente.            

* robust - especifica a correção dos erros padrão para amostra finita de Windmeijer (2005).           

* lag(2 6) - especifica  quantas defasagens dos instrumentos serão utilizadas nas estimações. Neste exemplo significa que estamos utilizando da segunda a sexta defasagem como instrumentos.        

* collapse - indica que a matriz dos instrumentos selecionados serão colapsados.         

* pca - é a abordagem de extração de componentes principais. Neste exemplo estamos solicitando a utilização de apenas 10 componentes principais.         

* orthogonal - indica se queremos utilizar os desvios ortogonais dos instrumentos (Nota: é utilizado quando os dados possuem muitos missings).        

ver mais detalhes em: http://repec.org/bocode/x/xtabond2.html 

#### Exemplo prático.

Instalando os pacotes necessários 

In [None]:
ssc install xtabond2      // Pacote para rodar o GMM
net install st0085_2.pkg  // Pacote para exportar resultados
ssc install asdoc         // Pacote exportar tabelas de outros resultados

Configurações do stata

In [None]:
mata: mata set matafavor speed, perm // Necessário para rodar o xtabond2
set more off, perm                   // Não interromper tabelas de resultados


Carregar base de dados

In [None]:
 use "D:\OneDrive\Documentos\BASE_CH.dta", clear

Declarar que estamos trabalhando com um painel de dados

In [None]:
 xtset id Ano

### Regressões 

**Table 3. Two-step System-GMM with PCA**

In [None]:
#Taxa de de crescimento
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC) iv(ln_Gec popgr D_Crisis Trend n_prof_ah) twostep robust pca components (21) 
estimates store reg1
    
#Log natural
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L) iv(ln_Gec popgr D_Crisis Trend ln_HC) twostep robust pca components (21)
estimates store reg2
    
#Log natural e Taxa de de crescimento
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC Tx_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC) iv(ln_Gec popgr D_Crisis Trend ln_HC n_prof_ah) twostep robust pca components (20)
estimates store reg3
    
#Taxa crescimento Educação Basica 
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_bh) iv(ln_Gec popgr D_Crisis Trend n_prof_bh) twostep robust pca components (21) 
estimates store reg4
    
#Log Educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L) iv(ln_Gec popgr D_Crisis Trend ln_HC_ah) twostep robust pca components (21) 
estimates store reg5
    
#Log Educação Avanççada & taxa educação Basica 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_ah Tx_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_bh) iv(ln_Gec popgr D_Crisis Trend ln_HC_ah n_prof_bh) twostep robust pca components (20) 
estimates store reg6
    
#Taxa crescimento Educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_ah) iv(ln_Gec popgr D_Crisis Trend n_prof_ah) twostep robust pca components (21)
estimates store reg7
    
#Log Educação Basica  
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L) iv(ln_Gec popgr D_Crisis Trend ln_HC_bh) twostep robust pca components (21)
estimates store reg8
    
#Log Educação Basica & taxa educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_bh Tx_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_ah) iv(ln_Gec popgr D_Crisis Trend ln_HC_bh n_prof_ah) twostep robust pca components (20) 
estimates store reg9
    
*Exportar tabela de resultados
esttab reg1 reg2 reg3 reg4 reg5 reg6 reg7 reg8 reg9 using "RESULTADOS_PCA.rtf", b(%12.2f) se(2) star(* 0.10 ** 0.05 *** 0.01 ) scalars(sargan sarganp hansen hansenp ar1 ar1p ar2 ar2p j) replace


**Table 4. Long-term effects.**

Aqui são estimados os efeitos de longo-prazo dado pela expressão $\frac{\hat{\beta}}{1 - {\gamma}}$.
Nesta etapa podem surgir algumas dúvidas no leitor, portando, adianto a explicação dos resultados encontrados.       

*"Conforme exposto nas páginas 100 e 101 da revista, as equações (21, 22 e 23) podem ser escritas como as equações (24, 25 e 26), contudo, optamos por utilizar as equações (21, 22 e 23) para estimar os efeitos "diretos" da tabela 3, e as equações (24, 25 e 26) para estimar os impactos de longo-prazo da tabela 4, dado que  as equações (21, 22 e 23) geram um sinal negativo do coeficiente estimado da variável dependente defasada."*

In [None]:
#Taxa de de crescimento
xtabond2 lnY_L L.lnY_L Tx_K_L Tx_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC) iv(ln_Gec popgr D_Crisis Trend n_prof_ah) twostep robust pca components (21)

#Exportar efeito LP
asdoc nlcom _b[Tx_HC] / (1 - _b[L.lnY_L]), replace title(Tx_HC) save(Efeito_LP.rtf) fs(10) dec(3) tzok
    
#Log natural
xtabond2 lnY_L L.lnY_L Tx_K_L ln_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L) iv(ln_Gec popgr D_Crisis Trend ln_HC) twostep robust pca components (21)

#Exportar efeito LP
asdoc nlcom _b[ln_HC] / (1 - _b[L.lnY_L]), append title(ln_HC) save(Efeito_LP.rtf) fs(10) dec(3) tzok
    
#Log natural e Taxa de de crescimento
xtabond2 lnY_L L.lnY_L Tx_K_L ln_HC Tx_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC) iv(ln_Gec popgr D_Crisis Trend ln_HC n_prof_ah) twostep robust pca components (20)

#Exportar efeito LP
asdoc nlcom _b[ln_HC] / (1 - _b[L.lnY_L]), append title(ln_HC & Tx_HC) save(Efeito_LP.rtf) fs(10) dec(3) tzok
asdoc nlcom _b[Tx_HC] / (1 - _b[L.lnY_L]), append title(ln_HC & Tx_HC) save(Efeito_LP.rtf) fs(10) dec(3) tzok
    
#Taxa crescimento Educação Basica 
xtabond2 lnY_L L.lnY_L Tx_K_L Tx_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_bh) iv(ln_Gec popgr D_Crisis Trend n_prof_bh) twostep robust pca components (21) 

#Exportar efeito LP
asdoc nlcom _b[Tx_HC_bh] / (1 - _b[L.lnY_L]), append title(Tx_HC_bh) save(Efeito_LP.rtf) fs(10) dec(3) tzok
    
#Log Educação Avançada 
xtabond2 lnY_L L.lnY_L Tx_K_L ln_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L) iv(ln_Gec popgr D_Crisis Trend ln_HC_ah) twostep robust pca components (21) 

#Exportar efeito LP
asdoc nlcom _b[ln_HC_ah] / (1 - _b[L.lnY_L]), append title(Tx_HC_bh) save(Efeito_LP.rtf) fs(10) dec(3) tzok
    
#Log Educação Avanççada & taxa educação Basica 
xtabond2 lnY_L L.lnY_L Tx_K_L ln_HC_ah Tx_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_bh) iv(ln_Gec popgr D_Crisis Trend ln_HC_ah n_prof_bh) twostep robust pca components (20) 

#Exportar efeito LP
asdoc nlcom _b[ln_HC_ah] / (1 - _b[L.lnY_L]), append title(ln_HC_ah & Tx_HC_bh) save(Efeito_LP.rtf) fs(10) dec(3) tzok
asdoc nlcom _b[Tx_HC_bh] / (1 - _b[L.lnY_L]), append title(ln_HC_ah & Tx_HC_bh) save(Efeito_LP.rtf) fs(10) dec(3) tzok
    
#Taxa crescimento Educação Avançada 
xtabond2 lnY_L L.lnY_L Tx_K_L Tx_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_ah) iv(ln_Gec popgr D_Crisis Trend n_prof_ah) twostep robust pca components (21)

#Exportar efeito LP
asdoc nlcom _b[Tx_HC_ah] / (1 - _b[L.lnY_L]), append title(Tx_HC_ah) save(Efeito_LP.rtf) fs(10) dec(3) tzok
    
#Log Educação Basica  
xtabond2 lnY_L L.lnY_L Tx_K_L ln_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L) iv(ln_Gec popgr D_Crisis Trend ln_HC_bh) twostep robust pca components (21)

#Exportar efeito LP
asdoc nlcom _b[ln_HC_bh] / (1 - _b[L.lnY_L]), append title(ln_HC_bh) save(Efeito_LP.rtf) fs(10) dec(3) tzok
    
#Log Educação Basica & taxa educação Avançada 
xtabond2 lnY_L L.lnY_L Tx_K_L ln_HC_bh Tx_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_ah) iv(ln_Gec popgr D_Crisis Trend ln_HC_bh n_prof_ah) twostep robust pca components (20) 

#Exportar efeito LP
asdoc nlcom _b[ln_HC_bh] / (1 - _b[L.lnY_L]), append title(ln_HC_bh & Tx_HC_ah) save(Efeito_LP.rtf) fs(10) dec(3) tzok
asdoc nlcom _b[Tx_HC_ah] / (1 - _b[L.lnY_L]), append title(ln_HC_bh & Tx_HC_ah) save(Efeito_LP.rtf) fs(10) dec(3) tzok

**Table 5. Two-Step System-GMM with laglimits and collapse.**

In [None]:
#Taxa de de crescimento
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC, lag(2 6) collapse) iv(ln_Gec popgr D_Crisis Trend n_prof_ah) twostep robust
estimates store reg1LC
    
#Log natural
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L, lag(2 10) collapse) iv(ln_Gec popgr D_Crisis Trend ln_HC) twostep robust
estimates store reg2LC
    
#Log natural e Taxa de de crescimento
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC Tx_HC ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC, lag(2 6) collapse) iv(ln_Gec popgr D_Crisis Trend ln_HC n_prof_ah) twostep robust
estimates store reg3LC
    
#Taxa crescimento Educação Basica 
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_bh, lag(2 6) collapse) iv(ln_Gec popgr D_Crisis Trend n_prof_bh) twostep robust
estimates store reg4LC
    
#Log Educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L, lag(2 10) collapse) iv(ln_Gec popgr D_Crisis Trend ln_HC_ah) twostep robust
estimates store reg5LC
    
#Log Educação Avanççada & taxa educação Basica 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_ah Tx_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_bh, lag(2 6) collapse) iv(ln_Gec popgr D_Crisis Trend ln_HC_ah n_prof_bh) twostep robust
estimates store reg6LC
    
#Taxa crescimento Educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_ah, lag(2 6) collapse) iv(ln_Gec popgr D_Crisis Trend n_prof_ah) twostep robust
estimates store reg7LC
    
#Log Educação Basica  
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_bh ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L, lag(2 10) collapse) iv(ln_Gec popgr D_Crisis Trend ln_HC_bh) twostep robust
estimates store reg8LC
    
#Log Educação Basica & taxa educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_bh Tx_HC_ah ln_Gec popgr D_Crisis Trend, gmm(L.lnY_L Tx_K_L Tx_HC_ah, lag(2 6) collapse) iv(ln_Gec popgr D_Crisis Trend ln_HC_bh n_prof_ah) twostep robust 
estimates store reg9LC
    
*Exportar tabela de resultados
esttab reg1LC reg2LC reg3LC reg4LC reg5LC reg6LC reg7LC reg8LC reg9LC using "RESULTADOS_LAG_COLLAPSE.rtf", b(%12.2f) se(2) star(* 0.10 ** 0.05 *** 0.01 ) scalars(sargan sarganp hansen hansenp ar1 ar1p ar2 ar2p j) replace

**Table 6. Two-Step System-GMM with laglimits.**

In [None]:
#Taxa de de crescimento
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  n_prof_ah) twostep robust
estimates store reg1L
    
#Log natural
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  ln_HC) twostep robust
estimates store reg2L
    
#Log natural e Taxa de de crescimento
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC Tx_HC ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  ln_HC n_prof_ah) twostep robust
estimates store reg3L
    
#Taxa crescimento Educação Basica 
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC_bh ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC_bh, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  n_prof_bh) twostep robust
estimates store reg4L
    
#Log Educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_ah ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  ln_HC_ah) twostep robust
estimates store reg5L
    
#Log Educação Avanççada & taxa educação Basica 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_ah Tx_HC_bh ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC_bh, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  ln_HC_ah n_prof_bh) twostep robust
estimates store reg6L
    
#Taxa crescimento Educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC_ah ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC_ah, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  n_prof_ah) twostep robust
estimates store reg7L
    
#Log Educação Basica  
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_bh ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  ln_HC_bh) twostep robust
estimates store reg8L
    
#Log Educação Basica & taxa educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_bh Tx_HC_ah ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC_ah, lag(2 2)) iv(ln_Gec popgr D_Crisis Trend  ln_HC_bh n_prof_ah) twostep robust 
estimates store reg9L
    
*Exportar tabela de resultados
esttab reg1L reg2L reg3L reg4L reg5L reg6L reg7L reg8L reg9L using "RESULTADOS_LAG.rtf", b(%12.2f) se(2) star(* 0.10 ** 0.05 *** 0.01 ) scalars(sargan sarganp hansen hansenp ar1 ar1p ar2 ar2p j) replace

**Table 7. Two-Step System-GMM with collapse**

In [None]:
#Taxa de de crescimento
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC, collapse) iv(ln_Gec popgr D_Crisis Trend  n_prof_ah) twostep robust
estimates store reg1C
    
#Log natural
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L, collapse) iv(ln_Gec popgr D_Crisis Trend  ln_HC) twostep robust
estimates store reg2C
    
#Log natural e Taxa de de crescimento
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC Tx_HC ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC, collapse) iv(ln_Gec popgr D_Crisis Trend  ln_HC n_prof_ah) twostep robust
estimates store reg3C
    
#Taxa crescimento Educação Basica 
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC_bh ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC_bh, collapse) iv(ln_Gec popgr D_Crisis Trend  n_prof_bh) twostep robust
estimates store reg4C
    
#Log Educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_ah ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L, collapse) iv(ln_Gec popgr D_Crisis Trend  ln_HC_ah) twostep robust
estimates store reg5C
    
#Log Educação Avanççada & taxa educação Basica 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_ah Tx_HC_bh ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC_bh, collapse) iv(ln_Gec popgr D_Crisis Trend  ln_HC_ah n_prof_bh) twostep robust
estimates store reg6C
    
#Taxa crescimento Educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L Tx_HC_ah ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC_ah, collapse) iv(ln_Gec popgr D_Crisis Trend  n_prof_ah) twostep robust
estimates store reg7C
    
#Log Educação Basica  
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_bh ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L, collapse) iv(ln_Gec popgr D_Crisis Trend  ln_HC_bh) twostep robust
estimates store reg8C
    
#Log Educação Basica & taxa educação Avançada 
xtabond2 DlnY_L L.lnY_L Tx_K_L ln_HC_bh Tx_HC_ah ln_Gec popgr D_Crisis Trend , gmm(L.lnY_L Tx_K_L Tx_HC_ah, collapse) iv(ln_Gec popgr D_Crisis Trend  ln_HC_bh n_prof_ah) twostep robust 
estimates store reg9C
    
* Exportar tabela de resultados
esttab reg1C reg2C reg3C reg4C reg5C reg6C reg7C reg8C reg9C using "RESULTADOS_COLLAPSE.rtf", b(%12.2f) se(2) star(* 0.10 ** 0.05 *** 0.01 ) scalars(sargan sarganp hansen hansenp ar1 ar1p ar2 ar2p j) replace

## Referências 

Anderson, T. G., and B. E. Sørenson. 1996. GMM estimation of a stochastic volatility model: A Monte Carlo study. Journal of Business & Economic Statistics 328–352. [link](https://uh.edu/~bsorense/AndersenSorensenGMMJBES1996.pdf)

ANDERSON, Theodore Wilbur; HSIAO, Cheng. Estimation of dynamic models with error components. **Journal of the American statistical Association**, v. 76, n. 375, p. 598-606, 1981. [link](https://authors.library.caltech.edu/82241/1/sswp336.pdf)

Arellano, M., & Bond, S. (1991). Some tests of specification for panel data: Monte Carlo  
evidence and an application to employment equations. The Review of Economic Studies,  
[link](http://dx.doi.org/10.2307/2297968)  

Arellano, M., & Bover, O. (1995). Another look at the instrumental variable estimation of  
error-components model. Journal of Econometrics, 68(1), 29–52.  [link](http://dx.doi.org/10.1016/0304-4076(94)01642-D)

Blundell, R., & Bond, S. (1998). Initial conditions and moment restrictions in dynamic panel  
data models. Journal of Econometrics, 87(1), 115–143.  [link](http://dx.doi.org/10.1016/S0304-4076(98)00009-8)

Hansen, L. P. (1982). Large sample properties of generalized method of moments estimators.  
Econometrica, 50(4), 1029–1054. [link](http://dx.doi.org/10.2307/1912775)

Labra, R., & Torrecillas, C. (2014). Guía CERO para datos de panel: Un enfoque práctico  
(Working Paper No. 2014/16). Madrid: UAM–Accenture. [link](https://www.catedrauam-innova.com/documents/Working%20papers/WP2014_16_Guia%20CERO%20para%20datos%20de%20panel_Un%20enfoque%20practico.pdf)

Lillo, R. L., & Torrecillas, C. (2018). Estimating dynamic panel data: A practical approach to  
perform long panels. Revista Colombiana de Estadística, 41(1), 31–52.  [link ](http://dx.doi.org/10.15446/rce.v41n1.61885)

Nelson, R. R., & Phelps, E. S. (1966). Investment in humans, technological diffusion, and  
economic growth. The American Economic Review, 56(1/2), 69–75.  [link](http://dx.doi.org/https://www.jstor.org/stable/1821269)

Roodman, D. (2009a). How to do Xtabond2: An introduction to Difference and System GMM  
in Stata (No. 9). [link](http://dx.doi.org/10.1177/1536867X0900900106 )

Roodman, D. (2009b). A note on the theme of too many instruments. Oxford Bulletin of  
Economics and Statistics, 71(1), 135–158. [link](https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1468-0084.2008.00542.x)

Sargan, J. D. (1958). The estimation of economic relationships using instrumental variables.  
Econometrica, 26(3), 393–415. [link](http://dx.doi.org/10.2307/1907619) 

SOLOW, Robert M. A contribution to the theory of economic growth. **The quarterly journal of economics**, v. 70, n. 1, p. 65-94, 1956.[link](
http://piketty.pse.ens.fr/files/oldfichiers051211/enseig/ecoineg/articl/Solow1956.pdf)

UHR, Daniel de Abreu Pereira et al. Economic Growth Channels From Human Capital: A Dynamic Panel Analysis for Brazil. **Revista Brasileira de Economia**, v. 74, p. 95-118, 2020. [link](https://www.scielo.br/j/rbe/a/KkYHXdsxP7nXzLRBCbY64Vq/?lang=en)

Windmeijer, F. (2005). A finite sample correction for the variance of linear efficient two-step  
GMM estimators. Journal of Econometrics, 126(1), 25–51.  
[link](http://dx.doi.org/10.1016/j.jeconom.2004.02.005)
