# logit/probit-регрессия: LR-тест, совместная значимость

In [None]:
import numpy as np
import pandas as pd
from statsmodels.formula.api import logit, probit

from scipy.stats import chi2 # критические значения chi2-распределения

# Не показывать Warning
import warnings
warnings.simplefilter(action='ignore', category=Warning)
# Не показывать ValueWarning, ConvergenceWarning из statsmodels
from statsmodels.tools.sm_exceptions import ValueWarning, ConvergenceWarning
warnings.simplefilter('ignore', category=ValueWarning)
warnings.simplefilter('ignore', category=ConvergenceWarning)

In [None]:
# импорт данных
df = pd.read_csv('Filename.csv')

## Спецификация и подгонка

In [None]:
mod = logit(formula = 'your specification', data = df)
# mod = probit(formula = 'your specification', data = df)
res = mod.fit()

## LR-тест: значимость регрессии
Тестируем совместную значимость нескольких коэффициентов. 

Пусть уровень значимости $\alpha=0.05=5\%$

Тестовая статистика $LR=2(\log L-\log L_{r})$ где 
- $\log L$ – лог-правдоподобие для исходной регрессии
- $\log L_{r}$ - лог-правдоподобие для регрессии с ограничениями (без переменных из гипотезы)

Для вычисления тестовой статистики нужно оценить две вложенных модели: без ограничений и с ограничениями

**Важно** обе регрессии д.б. оценены на одном и том же датасете!

In [None]:
# подгонка модели с ограничениями
df_mod = df[['vars from model']].dropna()
mod_r = logit(formula = 'your specification', data = df_mod)
# mod_r = smf.probit(formula = 'your specification', data = df_mod)
res_r = mod_r.fit(disp=False) 

тестовая статистика

In [None]:
2*(res.llf-res_r.llf)

Степени свободы

In [None]:
res.df_model-res_r.df_model

критическое значение распределения $\chi^2_{df}$

In [None]:
sign_level = 0.05
chi2.isf(q=sign_level, df=res.df_model-res_r.df_model)