In [None]:
'''
Introdução à Econometria - Uma abordagem moderna (Tradução da 6 edição norte-americana)
Autor: WOOLDRIDGE, J. M.
Editora: CENGAGE LEARNING

Cap. 8: Heterocedasticidade (Heteroskedasticity)
Exemplo 8.2: Estatística F robusta em relação à heterocedasticidade
             (HETEROSKEDASTICITY-ROBUST F STATISTIC)
             
Arquivo com os dados: gpa3.xls

Arquivo com dados em:
http://students.cengage.com.br/dashboard/private/livroView.jsf;jsessionid=95E9AD889A4A4B7ABBD2A5251F1E14BE?id=104577

Em caso de dúvidas ou problemas, solicitamos, por gentileza, entrar em contato pelo e-mail:
python.economia@gmail.com
'''

In [1]:
import pandas as pd
import statsmodels.formula.api as smf

import statsmodels.iolib.summary2 as sis

In [2]:
df = pd.read_excel('gpa3.xls',
                   header=None,
                   usecols=[1, 2, 3, 12, 13, 14, 15, 21],
                   names=['sat', 'tothrs', 'cumgpa', 'spring','female','black', 'white', 'hsperc'])

In [3]:
df.head()

Unnamed: 0,sat,tothrs,cumgpa,spring,female,black,white,hsperc
0,920,31,2.25,0,1,0,0,40.0
1,920,43,2.04,1,1,0,0,40.0
2,780,28,2.03,0,0,0,1,82.92683
3,780,43,2.09,1,0,0,1,82.92683
4,810,0,0.0,0,0,0,1,35.29412


### Solução sugerida

In [4]:
spring = (df['spring'] == 1)    # Apenas "spring semester"

model = smf.ols('cumgpa ~ sat + hsperc + tothrs + female + black + white', data=df, subset=spring)
reg = model.fit()
reg_robust = model.fit(cov_type='HC0')    # implementa procedimento robusto em relação à heterocedasticidade

In [5]:
results_table = sis.summary_col(results=[reg,reg_robust],
                            float_format='%0.4f',
                            stars = False,
                            model_names=['se_usual',
                                         'se_robusto'])

results_table.add_title('Exemplo 8.2')
results_table.add_text(f'Núm. de obs.: {int(model.nobs)}')
print(results_table)

           Exemplo 8.2
               se_usual se_robusto
----------------------------------
Intercept      1.4701   1.4701    
               (0.2298) (0.2186)  
sat            0.0011   0.0011    
               (0.0002) (0.0002)  
hsperc         -0.0086  -0.0086   
               (0.0012) (0.0014)  
tothrs         0.0025   0.0025    
               (0.0007) (0.0007)  
female         0.3034   0.3034    
               (0.0590) (0.0586)  
black          -0.1283  -0.1283   
               (0.1474) (0.1181)  
white          -0.0587  -0.0587   
               (0.1410) (0.1103)  
R-squared      0.4006   0.4006    
R-squared Adj. 0.3905   0.3905    
Standard errors in parentheses.
Núm. de obs.: 366


In [6]:
'''
Estatística-F usual

H0: B_black = B_white = 0
H1: pelo menos um dos parâmetros na hipótese nula é diferente de zero
'''

hipotese = 'black = 0, white = 0'
teste_f_usual = reg.f_test(hipotese)
print(f"Estatística F: {teste_f_usual.fvalue[0]}")
print(f"Valor p: {teste_f_usual.pvalue}")

Estatística F: [0.67960436]
Valor p: 0.5074682802133217


In [7]:
'''
Estatística-F robusta em relação à heterocedasticidade

H0: B_black = B_white = 0
H1: pelo menos um dos parâmetros na hipótese nula é diferente de zero
'''

hipotese = 'black = 0, white = 0'
teste_f_robust = reg_robust.f_test(hipotese)
print(f"Estatística F: {teste_f_robust.fvalue[0]}")
print(f"Valor p: {teste_f_robust.pvalue}")

Estatística F: [0.74779717]
Valor p: 0.4741441812838151
