In [None]:
'''
Introdução à Econometria - Uma abordagem moderna (Tradução da 6 edição norte-americana)
Autor: WOOLDRIDGE, J. M.
Editora: CENGAGE LEARNING

Cap. 6: Análise de regressão múltipla: problemas adicionais (Multiple Regression Analysis: Further Issues)
Item 6.2a: Um pouco mais sobre o uso de formas funcionais logarítmicas
             (More on Using Logarithmic Functional Forms)
             
Arquivo com os dados: hprice2.xls

Arquivo com dados em:
http://students.cengage.com.br/dashboard/private/livroView.jsf;jsessionid=95E9AD889A4A4B7ABBD2A5251F1E14BE?id=104577

Em caso de dúvidas ou problemas, solicitamos, por gentileza, entrar em contato pelo e-mail:
python.economia@gmail.com
'''

In [1]:
import pandas as pd
import numpy as np
import statsmodels.formula.api as smf

In [2]:
df = pd.read_excel('hprice2.xls',
                   header=None,
                   usecols=[3, 7, 9, 10],
                   names=['rooms', 'stratio','lprice', 'lnox'])

In [3]:
df.head()

Unnamed: 0,rooms,stratio,lprice,lnox
0,6.57,15.3,10.08581,1.682688
1,6.42,17.8,9.980402,1.545433
2,7.18,17.8,10.4545,1.545433
3,7.0,18.7,10.41631,1.521699
4,7.15,18.7,10.49679,1.521699


### Comandos sugeridos

In [4]:
# Regressão pelo Método de Mínimos Quadrados Ordinários (MQO ou OLS na sigla em inglês)
modelo_1 = smf.ols(formula='lprice ~ lnox + rooms', data=df)
reg_1 = modelo_1.fit()
reg_1.summary()

0,1,2,3
Dep. Variable:,lprice,R-squared:,0.514
Model:,OLS,Adj. R-squared:,0.512
Method:,Least Squares,F-statistic:,265.7
Date:,"Fri, 08 Jul 2022",Prob (F-statistic):,1.7900000000000002e-79
Time:,19:23:18,Log-Likelihood:,-83.009
No. Observations:,506,AIC:,172.0
Df Residuals:,503,BIC:,184.7
Df Model:,2,,
Covariance Type:,nonrobust,,

0,1,2,3,4,5,6
,coef,std err,t,P>|t|,[0.025,0.975]
Intercept,9.2337,0.188,49.183,0.000,8.865,9.603
lnox,-0.7177,0.066,-10.818,0.000,-0.848,-0.587
rooms,0.3059,0.019,16.086,0.000,0.269,0.343

0,1,2,3
Omnibus:,52.327,Durbin-Watson:,0.603
Prob(Omnibus):,0.0,Jarque-Bera (JB):,327.011
Skew:,0.042,Prob(JB):,9.780000000000001e-72
Kurtosis:,6.937,Cond. No.,102.0


In [5]:
reg_1.params

Intercept    9.233737
lnox        -0.717673
rooms        0.305918
dtype: float64

In [None]:
'''
Estimamos que um cômodo a mais aumenta o preço em APROXIMADAMENTE 30,59% (=100*0,3059)
'''

In [6]:
'''
Quanto maior as mudanças percentuais estimadas, a aproximação da célula acima (com o uso direto do coeficiente estimado de
rooms) se torna cada vez mais imprecisa. 
Neste exemplo, a mudança exata estimada em "price" quando "rooms" aumenta em 1 é: 100 * [exp(b_rooms * 1) - 1]
'''
100 * (np.exp(reg_1.params['rooms']) - 1)

35.78713947404548

In [None]:
'''
Conclusão: a mudança exata estimada em "price" quando "rooms" aumenta em 1 é 35,79%. Note que a mudança estimada aproximada 
quando utilizamos diretamente o coeficiente calculado de rooms é 30,59%.
'''

In [7]:
# Neste exemplo, a mudança exata estimada em "price" quando "rooms" diminui em 1 é: 100 * [exp(b_rooms * -1) - 1]
100 * (np.exp(reg_1.params['rooms'] * -1) - 1)

-26.35532320119748

In [None]:
# Conclusão: a mudança exata estimada em "price" quando "rooms" diminui em 1 (um cômodo a menos) é -26,36%

### Inclusão da relação aluno-professor no modelo anterior (variável stratio)

In [9]:
# Regressão pelo Método de Mínimos Quadrados Ordinários (MQO ou OLS na sigla em inglês)
modelo_2 = smf.ols(formula='lprice ~ lnox + rooms + stratio', data=df)
reg_2 = modelo_2.fit()
reg_2.params

Intercept    10.359458
lnox         -0.645329
rooms         0.256727
stratio      -0.050873
dtype: float64

In [None]:
'''
Estimamos que se "stratio" aumenta em um, o preço diminui em APROXIMADAMENTE 5.09% (=100*-0,05087)
(no livro, consta uma diminuição estimada no preço de aproximadamente 5,2%)
'''

In [10]:
# Neste exemplo, a mudança exata estimada em "price" quando "stratio" aumenta em 1 é: 100 * [exp(b_stratio * 1) - 1]
100 * (np.exp(reg_2.params['stratio']) - 1)

-4.96009893733993

In [None]:
# Assim, a mudança exata estimada em "price" quando "stratio" aumenta em 1 é -4,96%
# (no livro, consta uma diminuição estimada (exata) no preço de 5,1%)

In [11]:
# Se aumentamos "stratio" em 5, estimamos que o preço varia em APROXIMADAMENTE -25,44% (no livro consta -26%)
5 * (reg_2.params['stratio'] * 100)

-25.43668569083151

In [12]:
# a mudança exata estimada em "price" quando "stratio" aumenta em 5 é: 100 * [exp(b_stratio * 5) - 1]
100 * (np.exp(reg_2.params['stratio'] * 5) - 1)

-22.45927136583613

In [None]:
# Assim, a mudança exata estimada em "price" quando "stratio" aumenta em 5 é -22,46% (no livro consta -22,9%)