# Регрессия с Statsmodels. Диагностика

In [None]:
import numpy as np
import pandas as pd

import statsmodels.formula.api as smf
from statsmodels.stats import diagnostic # диагностика модели
from statsmodels.stats.stattools import durbin_watson

## Пример: гетероскедастичность для sleep equation

In [None]:
df = pd.read_csv('sleep75.csv')

На датасете/датафрейме `df` подгоним регрессия `sleep` на `totwrk, age, age^2, male, smsa, marr`.

In [None]:
# инициализация/спецификация модели через формулу
# создаём объект класса OLS
mod = smf.ols(formula='sleep~totwrk+age+I(age**2)+male+smsa+marr', data=df)

# подгонка специфицированной модели на данных с неробастной ковариационной матрицей для коэффициентов
# создаём объект класса RegressionResults
res = mod.fit()

In [None]:
# тест на гетероскедастичность
diagnostic.het_breuschpagan(res.resid, exog_het=mod.exog)

## Пример: серийная корреляция

In [None]:
df= pd.read_csv('Mishkin.csv')

На датасете/датафрейме `df` подгоним регрессия `pai3` на `tb1, tb3`.

In [None]:
# инициализация/спецификация модели через формулу
# создаём объект класса OLS
mod = smf.ols(formula='pai3~tb1+tb3', data=df)

# подгонка специфицированной модели на данных с неробастной ковариационной матрицей для коэффициентов
# создаём объект класса RegressionResults
res = mod.fit()

In [None]:
diagnostic.acorr_breusch_godfrey(res=res, nlags=2)

In [None]:
# Статистика Durbin-Watson
durbin_watson(resids=res.resid)