# Resumo de Econometria I

***

O modelo de regressão linear clássico (foco do curso) se baseia nas seguintes hipóteses (para estimação e para inferência):

- ***Hipótese 1:*** O modelo de regressão é linear nos parâmetros.
- ***Hipótese 2:*** Os valores dos regressores, os $X$, são fixos, ou valores de $X$ são independentes do termo de erro. Aqui, isso significa que exigimos covariância zero entre $u_i$ e cada variável X.
- ***Hipótese 3:*** Para os $X$ dados, o valor médio do erro $u_i$ é zero ($E[u_i | X] = 0$).
- ***Hipótese 4:*** Para os $X$ dados, a variância de $u_i$ é constante ou homocedástica.
- ***Hipótese 5:*** Para os $X$ dados, não há autocorrelação, nem correlação serial, entre os termos de erro.
- ***Hipótese 6:*** O número de observações $n$ deve ser maior que o número de parâmetros a serem estimados.
- ***Hipótese 7:*** Deve haver variação suficiente nos valores das variáveis $X$.
- ***Hipótese 8:*** Não há colinearidade exata entre as variáveis $X$.
- ***Hipótese 9:*** O modelo está especificado corretamente, logo não há viés de especificação.
- ***Hipótese 10:*** O termo estocástico (de erro) $u_i$ é distribuído normalmente.

In [2]:
import pandas as pd
import numpy as np
import statsmodels.api as sm

df = pd.read_csv("data/raw/exercicio-empirico-01.csv")
df = df[["genero", "idade", "nota1", "nota2", "fuvest", "gosta_curso", "frequencia"]]

## Regressão Linear Simples

- Estimadores:

$$\hat{\beta_1} = \frac{\sum (X_i - \overline{X}) (Y_i - \overline{Y})}{\sum (X_i - \overline{X})^2} = \frac{cov(X, Y)}{var(X)}$$

$$\hat{\beta_0} = \overline{Y} - \hat{\beta_1} \overline{X}$$

- Precisão dos estimadores:

$$var(\hat{\beta_1}) = \frac{\sigma^2}{\sum x_i^2}$$

$$var(\hat{\beta_0}) = \frac{\sum X_i^2}{n \sum x_i^2} \sigma^2$$

$$\hat{\sigma^2} = \frac{\sum \hat{u}_i^2}{n - 2}$$

- Ajuste da regressão:

In [36]:
x = df['nota1']
x_mean = df['nota1'].mean()

y = df['nota2']
y_mean = df['nota2'].mean()

cov = sum((x - x_mean) * (y - y_mean))
var = sum((x - x_mean) ** 2)

# Coeficientes
beta_1 = cov / var
beta_0 = y_mean - beta_1 * x_mean

# Y-previsto e termo de erro 
y_hat = (beta_0 + beta_1 * x)
u = y - y_hat

# Variancia do termo de erro
sigma_sq_u = sum(u ** 2) / (len(x) - 2)

# SQT, SQE E SQR
SQT = sum((y - y_mean) ** 2)
SQE = sum((y_hat - y_hat.mean()) ** 2)
SQR = sum(u ** 2)

# R-quadrado
r_quadrado = 1 - (SQR/SQT) 


In [37]:
r_quadrado

0.19805757467824991

## Teste de Hipóteses na Regressão Simples

In [2]:
# Calcular variâncias, erros padrão e realizar teste-t

## Regressão Linear Múltipla

In [3]:
# Calcular regressão usando notação matricial

## Teste de Hipóteses na Regressão Múltipla

In [4]:
# Calcular variâncias, erros padrão, realizar teste-t e teste-F

## Demonstrar Viés na Regressão

In [5]:
# Mostrar caso onde o parâmetro contém viés por conta de variável omitida

## Testes de Heterocedasticidade 

In [6]:
# Mostrar cálculo dos testes de heterocedasticidade

## Correções p/ Heterocedasticidade

## Mínimos Quadrados Generalizados