# Бинарная регрессия с Statsmodels. Предельные значения

In [None]:
import numpy as np
import pandas as pd

import statsmodels.formula.api as smf

In [None]:
df = pd.read_csv('TableF5-1.csv')

## Пример: logit-регрессия
На датасете/датафрейме `df` подгоним регрессия `LFP` на `WA, WE, log(FAMINC)`. Спецификация (как уравнение)
$$
	P(LFP=1)=\Lambda(\beta_0+\beta_1 WA+\beta_2 WE+\beta_4\log(FAMINC))
$$

In [None]:
mod = smf.logit(formula='LFP~WA+WE+np.log(FAMINC)', data=df)

res = mod.fit()

res.summary()

## Предельные значения
Для вычисления используем метод `.get_margeff(at='overall')`. Параметр `at`:
* `mean` для вычисления предельного значения в средней точке
* `overall` для вычисления среднего по выборке предельного значения

В первом случаем считается 
$$ 
	\left(\frac{\partial P(LFP=1)}{\partial x_j}\right)_{mean}=\lambda(\bar{x}'\beta)\beta_j
$$
Во втором случае
$$ 
	\left(\frac{\partial P(LFP=1)}{\partial x_j}\right)_{overall}=\overline{\lambda(x_i'\beta)\beta_j}
$$

In [None]:
# для среднего наблюдения
marg_mean = res.get_margeff(at='mean')
marg_mean.summary()

In [None]:
# среднее предельное значения
marg_overall = res.get_margeff(at='overall')
marg_overall.summary()