# Доверительные интервалы для коэффициентов

In [None]:
import pandas as pd
import numpy as np

import statsmodels.formula.api as smf

# Не показывать Warning
import warnings
warnings.simplefilter(action='ignore', category=Warning)

<div style="background-color:Bisque; color:DarkBlue; padding:30px;">

<i><b><span style="color: purple">Доверительные интервалы для коэффициентов</span> </b><br>

Пусть $\gamma$ - доверительная вероятность (обычно 90%, 95%, 99%). Ей соответствует уровень значимости $\alpha=1-\gamma$

Доверительный интервал для коэффициента $\beta$
$$
	\mathcal{I}_\gamma=\left(\hat{\beta}-s.e.(\beta)\cdot t_{cr}\; ;\;\hat{\beta}+s.e.(\beta)\cdot t_{cr}\right)
$$

где $t_{cr}=t_{df=n-k-1}(\alpha)$

__Интерпретация:__ $P(\beta\in\mathcal{I}_\gamma)=\gamma$. 

__Замечание 1:__ доверительный интервал можно рассматривать как "точно оценивания" коэффициента

__Замечание 2__: в зависимости от используемых $s.e.(\beta)$ доверительный интервал м.б. неробастным и робастным 

**<span style="color:purple">Доверительный интервал и t-тест:</span>** доверительный интервал можно использовать для тестирования гипотезы 

$$
\begin{aligned}
	H_0:\beta&=\theta & &vs & H_1:\beta&\ne\theta
\end{aligned}
$$

__Вывод__: при уровне значимости $\alpha$ не отвергаем гипотезу $\iff \theta\in \mathcal{I}_\gamma$. В частности, коэффициент незначим $\iff 0\in \mathcal{I}_\gamma$

</div>

Для датасета `sleep75` рассмотрим регрессию `sleep~1+totwrk+age+I(age**2)+smsa+male+south+marr+union`

In [None]:
# загрузим данные
df = pd.read_csv('sleep75.csv')

## Неробастный доверительный интервал

Подгноим модель выведем протокол подгонки с `90%` доверительными интервала для коэффициентов

In [None]:
# спецификация модели
mod = smf.ols(formula='sleep~1+totwrk+age+I(age**2)+smsa+male+south+marr+union', data=df)
# подгонка модели с ковариационной матрицей по умолчанию (неробастной)
res_ols = mod.fit()

res_ols.summary(slim=True, alpha=0.1)

In [None]:
# неробастные доверительные интервалы
res_ols.conf_int(alpha=0.1).round(3)

## Робастный доверительный интервал

Подгноим модель выведем протокол подгонки с `99%` доверительными интервала для коэффициентов

In [None]:
# спецификация модели
mod = smf.ols(formula='sleep~1+totwrk+age+I(age**2)+smsa+male+south+marr+union', data=df)
# подгонка модели с ковариационной матрицей по умолчанию (неробастной)
res_hc = mod.fit(cov_type='HC3')

res_hc.summary(slim=True, alpha=0.01)

In [None]:
# неробастные доверительные интервалы
res_hc.conf_int(alpha=0.01).round(3)