In [1]:
!pip install openpyxl



In [2]:
import openpyxl
import numpy as np
import statsmodels.api as sm
import statsmodels.formula.api as smf
import pandas as pd

In [3]:
estm1 = pd.read_csv("DeMoedaDriveDani.csv")

In [4]:
estm1.head(5)

Unnamed: 0,obs,M1,Y,PI,R
0,1966Q1,44.472,38.098,1.12,29.0
1,1966Q2,41.89,39.948,1.098,29.3
2,1966Q3,40.606,41.118,1.077,33.1
3,1966Q4,40.971,39.802,1.054,31.4
4,1967Q1,40.753,37.205,1.076,34.2


In [5]:
estim = smf.ols('np.log(M1)~ np.log(Y)+ np.log(PI) + np.log(R)',data = estm1).fit()

In [6]:
print(estim.summary())

                            OLS Regression Results                            
Dep. Variable:             np.log(M1)   R-squared:                       0.954
Model:                            OLS   Adj. R-squared:                  0.952
Method:                 Least Squares   F-statistic:                     519.8
Date:                Tue, 08 Dec 2020   Prob (F-statistic):           1.55e-50
Time:                        21:32:12   Log-Likelihood:                 90.407
No. Observations:                  80   AIC:                            -172.8
Df Residuals:                      76   BIC:                            -163.3
Df Model:                           3                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
Intercept      2.0214      0.158     12.826      0.0

### Na análise dos p-valores do F-Statistics e dos testes T são rejeitadas as hipóteses nulas por serem menores que a significância.

### As mesma estimação também pode ser obtida no e-views com a seguinte equação: log(m1) c log(y) log(r) log(pi) que é equivalente à equação 'np.log(M1)~ np.log(Y)+ np.log(PI) + np.log(R)' usada no stasmodels.

### Abaixo mostro a mesma estimação feita no e-views com a equação acima, para quem não conhece este software, observe a semelhança do layout dos resultados com o statsmodels e o R

![tabela1](tab1.1.PNG)

In [7]:
estm1['DUMMYDIF'] = estm1['obs'].apply(lambda x: 0 if pd.Period(x) < pd.Period('1985Q4') else 1)

In [8]:
estm1.tail()

Unnamed: 0,obs,M1,Y,PI,R,DUMMYDIF
75,1984Q4,35.823,128.161,1.37,349.4,0
76,1985Q1,32.339,121.971,1.38,372.2,0
77,1985Q2,34.381,136.722,1.29,289.2,0
78,1985Q3,40.406,145.049,1.322,192.6,0
79,1985Q4,45.268,143.876,1.383,262.1,1


In [9]:
estimDummy = smf.ols('np.log(M1)~ np.log(Y)+ np.log(PI) + np.log(R) + DUMMYDIF',data = estm1).fit()

In [10]:
print(estimDummy.summary())

                            OLS Regression Results                            
Dep. Variable:             np.log(M1)   R-squared:                       0.954
Model:                            OLS   Adj. R-squared:                  0.952
Method:                 Least Squares   F-statistic:                     391.2
Date:                Tue, 08 Dec 2020   Prob (F-statistic):           2.13e-49
Time:                        21:32:13   Log-Likelihood:                 91.043
No. Observations:                  80   AIC:                            -172.1
Df Residuals:                      75   BIC:                            -160.2
Df Model:                           4                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
Intercept      2.0136      0.158     12.780      0.0

### Abaixo também temos a mesma estimação feita com e-views:
![tab2](tab1.2.PNG)

### A equação equivalente no e-views é a seguinte: log(m1) c log(Y) log(R) log(PI) DUMMYDIF com método Least Squares (MQO). Contudo, diferente do statsmodels, onde eu inseri uma nova coluna e usei uma função lambda para inserção da coluna DUMMYDIF na estimação, no e-views esta nova coluna é aplicada na janela de comando com o seguinte código: series dummydif = @recode(@date<@dateval("1985q4"),0,1)


#### Mas por quê inserir uma variável dummy?
#### Neste caso para confirmar que uma variável dummy, mesmo que em somente uma observação força a regressão a passar por ela.
#### Num estudo sócio-econômico por exemplo, ela nos ajuda a perceber o padrão de vida das famílias, como por exemplo: tem geladeira? Tem carro? Tem internet? Tem água encanada? Se sim a dummy é 1, se não a dummy é 0.
 

In [11]:
estim79obs = smf.ols('np.log(M1)~ np.log(Y)+ np.log(PI) + np.log(R)',data = estm1.iloc[:-1]).fit()
# a mesma estimação excluindo apenas a última observação(1985Q3)

In [12]:
print(estim79obs.summary())

                            OLS Regression Results                            
Dep. Variable:             np.log(M1)   R-squared:                       0.954
Model:                            OLS   Adj. R-squared:                  0.952
Method:                 Least Squares   F-statistic:                     513.5
Date:                Tue, 08 Dec 2020   Prob (F-statistic):           6.89e-50
Time:                        21:32:13   Log-Likelihood:                 89.408
No. Observations:                  79   AIC:                            -170.8
Df Residuals:                      75   BIC:                            -161.3
Df Model:                           3                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
Intercept      2.0136      0.158     12.780      0.0

### Da mesma forma a estimação acima também realizada no e-views:
![tab3](tab1.3.PNG)

aqui foi usada a mesma equação da tabela 1, porém, no e-views para se excluir a última linha fui na janela 
"sample" do software e troquei 1985Q4 por 1985Q3

É importante observar que aqui na tabela 1.3, quando retiramos a última observação, os regressores permanecem iguais em seus valores da mesma forma que quando colocamos a variável dummy apenas na última observação como na tabela 1.2. Chega a ser desprezível as alterações que ocorrem nos valores dos coeficientes de determinação e das probabilidades de dos testes F e T. Não alterando os 

### Também com uso do E-views, abaixo a estimação do modelo não linear nas variáveis. Em outras palavras, sem o uso de log.
### Desta forma não temos a elasticidade, mas sim o impacto direto na variável dependente da variação de cada estimador.
### Embora seja visto a mudança nos números, a conclusão da estimação e explicação do modelo permanecem as mesmas.

![tab4](LinearNosParametrosLeastSquares.PNG)