In [None]:
'''
Introdução à Econometria - Uma abordagem moderna (Tradução da 6 edição norte-americana)
Autor: WOOLDRIDGE, J. M.
Editora: CENGAGE LEARNING

Cap. 2: Modelo de regressão simples (The Simple Regression Model)
Exemplo 2.5: Resultados eleitorais e despesas de campanha
             (VOTING OUTCOMES AND CAMPAIGN EXPENDITURES)
             
Arquivo com os dados: vote1.xls

Arquivo com dados em:
http://students.cengage.com.br/dashboard/private/livroView.jsf;jsessionid=95E9AD889A4A4B7ABBD2A5251F1E14BE?id=104577

Em caso de dúvidas ou problemas, solicitamos, por gentileza, entrar em contato pelo e-mail:
python.economia@gmail.com
'''

In [1]:
import pandas as pd
import statsmodels.formula.api as smf

In [2]:
df = pd.read_excel('vote1.xls',
                   header=None,
                   usecols=[3, 9],
                   names=['voteA', 'shareA'])

In [3]:
df.head()

Unnamed: 0,voteA,shareA
0,68,97.41
1,62,60.88
2,73,97.01
3,69,92.4
4,75,72.61


### Comandos sugeridos

#### Regressão por Mínimos Quadrados Ordinários (MQO ou OLS na sigla em inglês)

In [None]:
'''
Para rodar a regressão por MQO seguimos dois passos:
Passo 1) Com a função "smf.ols()" geramos um objeto do tipo "OLS". O retorno atribuímos para uma variável.
Passo 2) Com a variável criada no passo 1, utilizamos o método "fit()". O retorno, atribuímos à uma outra variável. 
         É neste Passo 2 que os cálculos para rodar a regressão são executados. 
'''

In [4]:
# Regressão pelo Método de Mínimos Quadrados Ordinários (MQO ou OLS na sigla em inglês)
modelo = smf.ols('voteA ~ shareA', data=df) # Passo 1
reg = modelo.fit()                          # Passo 2 

In [None]:
# Abaixo, utilizamos a variável criada no Passo 2 (reg) para acessar os resultados da regressão

In [5]:
# Com o método summary() obtemos uma tabela com os principais resultados da regressão 
reg.summary()

0,1,2,3
Dep. Variable:,voteA,R-squared:,0.856
Model:,OLS,Adj. R-squared:,0.855
Method:,Least Squares,F-statistic:,1018.0
Date:,"Wed, 06 Jul 2022",Prob (F-statistic):,6.6099999999999995e-74
Time:,18:46:29,Log-Likelihood:,-565.2
No. Observations:,173,AIC:,1134.0
Df Residuals:,171,BIC:,1141.0
Df Model:,1,,
Covariance Type:,nonrobust,,

0,1,2,3,4,5,6
,coef,std err,t,P>|t|,[0.025,0.975]
Intercept,26.8125,0.887,30.222,0.000,25.061,28.564
shareA,0.4638,0.015,31.901,0.000,0.435,0.493

0,1,2,3
Omnibus:,20.743,Durbin-Watson:,1.826
Prob(Omnibus):,0.0,Jarque-Bera (JB):,44.6
Skew:,0.525,Prob(JB):,2.07e-10
Kurtosis:,5.255,Cond. No.,112.0


In [6]:
# Com o atributo params, podemos acessar as estimativas dos parâmetros populacionais.
reg.params

Intercept    26.812537
shareA        0.463824
dtype: float64

In [7]:
# Com o método predict(), obtemos os valores ajustados (y_chapeu) para diferentes valores das variáveis explicativas.
reg.predict({'shareA': 50})       # Obteremos o valor ajustado (% de votos previsto para o candidato A) se shareA = 50

0    50.00373
dtype: float64

In [None]:
# Se shareA = 50, prevê-se voteA = 50, ou seja, que o candidato A terá metade da votação. 