In [None]:
'''
Introdução à Econometria - Uma abordagem moderna (Tradução da 6 edição norte-americana)
Autor: WOOLDRIDGE, J. M.
Editora: CENGAGE LEARNING

Cap. 8: Heterocedasticidade (Heteroskedasticity)
Exemplo 8.5: Forma especial do teste de White na equação log dos preços de imóveis
             (SPECIAL FORM OF THE WHITE TEST IN THE LOG HOUSING PRICE EQUATION)
             
Arquivo com os dados: hprice1.xls

Arquivo com dados em:
http://students.cengage.com.br/dashboard/private/livroView.jsf;jsessionid=95E9AD889A4A4B7ABBD2A5251F1E14BE?id=104577

Em caso de dúvidas ou problemas, solicitamos, por gentileza, entrar em contato pelo e-mail:
python.economia@gmail.com
'''

In [1]:
import pandas as pd
import statsmodels.formula.api as smf
import numpy as np
import statsmodels.stats.diagnostic

In [2]:
df = pd.read_excel('hprice1.xls',
                   header=None,
                   usecols=[0, 2, 3, 4],
                   names=['price', 'bdrms', 'lotsize', 'sqrft'])

In [3]:
df.head(5)

Unnamed: 0,price,bdrms,lotsize,sqrft
0,300.0,4,6126,2438
1,370.0,3,9903,2076
2,191.0,3,5200,1374
3,195.0,3,4600,1448
4,373.0,4,6095,2514


### Solução sugerida

In [4]:
modelo_log = smf.ols('np.log(price) ~ np.log(lotsize) + np.log(sqrft) + bdrms', data=df)
reg_log = modelo_log.fit()

In [None]:
'''
Forma especial do teste de White para heterocedasticidade
H0: O Erro u é Homocedástico
H1: Violação da homocedasticidade (presença de heterocedasticidade)
'''

In [5]:
# cria DataFrame necessário para executar o teste
white_especial = pd.DataFrame()                             # Cria um DataFrame 
white_especial['y_chapeu'] = reg_log.fittedvalues           # Coluna de valores ajustados
white_especial['y_chapeu_2'] = reg_log.fittedvalues**2      # Coluna de valores ajustados elevados ao quadrado
white_especial['const'] = 1                                 # Coluna com valores 1

# Executa o teste
teste_white_especial = statsmodels.stats.diagnostic.het_breuschpagan(reg_log.resid, exog_het=white_especial)
print(f"Estatística LM: {teste_white_especial[0]}")
print(f"valor-p (LM): {teste_white_especial[1]}")
print(f"Estatística F: {teste_white_especial[2]}")
print(f"valor-p (F): {teste_white_especial[3]}")

Estatística LM: 3.4472864598132666
valor-p (LM): 0.17841495570789132
Estatística F: 1.7327613557006645
valor-p (F): 0.1829815512905127


In [None]:
'''
Conclusão:
Seguindo o exemplo do livro, vamos olhar para o valor p da estatística LM.
Como o valor-p de 17,84% é maior do que qualquer valor padrão para o nível de significância (1%, 5% ou 10%), não poderíamos
rejeitar a hipótese nula de homocedasticidade para quaisquer destes valores padrão.
Assim, não há evidência de que a heterocedasticidade seja um problema neste exemplo.
'''

In [None]:
# Por que usamos a função do teste de Breusch-Pagan para executar o caso especial do teste de White?

In [None]:
'''
As três células abaixo reproduzem (parcialmente) os passos indicados por Wooldridge para realizar o teste de Breusch-Pagan
para heterocedasticidade e também os passos para o caso especial do teste de White.
Note que os passos para realizar ambos os testes são os mesmos, exceto pela regressão a ser executada no passo 2.

Então:

- Como os passos são os mesmos para os dois testes, podemos utilizar a função do teste de Breusch-Pagan também para o caso 
especial do Teste de White.

- Como utilizamos (8.14) no passo 2 do teste de Breusch-Pagan, na função "het_breuschpagan", ao parâmetro "exog_het", 
atribuiríamos o comando "reg_log.model.exog".

- Como utilizamos (8.20) no passo 2 do caso especial do teste de White, na função "het_breuschpagan", ao parâmetro 
"exog_het" atribuímos o dataframe "white_especial".
'''

In [None]:
'''
Considere o modelo linear (hipóteses RLM1 a RLM4 válidas:

y = B0 + B1*x1 + B2*x2 + ... + Bk*xk + u       (8.10)

'''

In [None]:
'''
Passos para realizar o teste de Breusch-Pagan da Heterocedasticidade:
P1. Estime o modelo (8.10) por Mínimos Quadrados Ordinários (MQO) e obtenha o quadrado dos residuos de MQO (resid_quad)
P2. Execute a regressão abaixo (8.14) por MQO e guarde o R-quadrado dessa regressão 
    
    resid_quad = sigma0 + sigma1*x1 + sigma2*x2 + ... + sigmak*xk + erro    (8.14)
    
P3. Construa a estatística F ou a Estatística LM e calcule o p-valor.

'''

In [None]:
'''
Passos para realizar o caso especial do teste de White para a Heterocedasticidade:
P1. Estime o modelo (8.10) por Mínimos Quadrados Ordinários (MQO) e obtenha o quadrado dos residuos de MQO (resid_quad)
P2. Execute a regressão abaixo (8.20) por MQO e guarde o R-quadrado dessa regressão 
    
    resid_quad = sigma0 + sigma1*y_chapeu + sigma2*y_chapeu_quad + erro    (8.20)
    
    [y_chapeu: representa os valores ajustados]
    [y_chapeu: y_chapeu elevado ao quadrado]
    
P3. Construa a estatística F ou a Estatística LM e calcule o p-valor.
'''