# Линейная регрессия с Statsmodels. Свойства подогнанной модели

In [None]:
import numpy as np
import pandas as pd

import statsmodels.formula.api as smf

In [None]:
df = pd.read_csv('sleep75.csv')

## Пример: sleep equation

На датасете/датафрейме `df` подгоним регрессия `sleep` на `totwrk, age`. Спецификация (как уравнение)
$$
	sleep=\beta_0+\beta_1 totwrk+\beta_2 age+u
$$

In [None]:
# инициализация/спецификация модели через формулу
# создаём объект класса OLS
mod = smf.ols(formula='sleep~totwrk+age', data=df)

# подгонка специфицированной модели на данных с неробастной ковариационной матрицей для коэффициентов
# создаём объект класса RegressionResults
res = mod.fit()

В результате подгонки создаётся объект `res` класса [`RegressionResults`](https://www.statsmodels.org/stable/generated/statsmodels.regression.linear_model.RegressionResults.html#statsmodels.regression.linear_model.RegressionResults)

Объект `res` содержит
- основные свойства (характеристики) подогнанной модели
- методы для дальнейшей работы с моделью (прогнозирование, тестирование гипотез, вывод результатов и проч)

Посмотрим на основные свойства подогнанной модели

### Коэффициенты

In [None]:
res.params

### Число наблюдений

In [None]:
res.nobs

### $R^2$ и $R^2_{adj}$

In [None]:
res.rsquared, res.rsquared_adj

### F-тест на значимость регрессии

F-статистика и её P-значение

In [None]:
res.fvalue, res.f_pvalue

Степени свободы для критического значения $df_1=k$, $df_2=n-k-1$

In [None]:
res.df_model, res.df_resid

### t-тест для коэффициентов

стандартные ошибки коэффициентов

In [None]:
res.bse

t-статистики

In [None]:
res.tvalues

их P-значения

In [None]:
res.pvalues

### Разное

In [None]:
# Информационные критерии AIC & BIC
res.aic, res.bic

In [None]:
# остатки
res.resid

In [None]:
# предсказанные значения
res.fittedvalues