# Бинарная регрессия с Statsmodels. Подгонка регрессии через матрицы дизайна (количественные переменные)

In [None]:
import numpy as np
import pandas as pd

import statsmodels.api as sm

In [None]:
df = pd.read_csv('TableF5-1.csv')
df.shape

## Пример 1: logit-регрессия
На датасете/датафрейме `df` подгоним регрессия `LFP` на `WA, WA^2, WE, log(FAMINC)`. Спецификация (как уравнение)
$$
	P(LFP=1)=\Lambda(\beta_0+\beta_1 WA+\beta_2 WA^2+\beta_3 WE+\beta_4\log(FAMINC))
$$

In [None]:
# инициализация/спецификация модели через матрицы регрессионного дизайна
# задаём вектор наблюдений зависимой переменной y 
y = df['LFP']
# и матрицу наблюдений регрессоров X (с первым столбом из единиц), в которую вручную нужно добавить квадрат регрессора
X = sm.add_constant(df[['WE', 'WA']])
X['WA**2'] = df['WA']**2
X['log(FAMINC)'] = np.log(df['FAMINC'])
X

In [None]:
mod = sm.Logit(endog=y, exog=X, missing='drop')

res = mod.fit()

res.summary()

## Пример 2: probit-регрессия
На датасете/датафрейме `df` подгоним регрессия `LFP` на `WA, WA^2, WE, log(FAMINC)+CIT`. Спецификация (как уравнение)
$$
	P(LFP=1)=\Phi(\beta_0+\beta_1 WA+\beta_2 WA^2+\beta_3 WE+\beta_4\log(FAMINC)+\beta_5 CIT)
$$

In [None]:
# инициализация/спецификация модели через матрицы регрессионного дизайна
# задаём вектор наблюдений зависимой переменной y 
y = df['LFP']
# и матрицу наблюдений регрессоров X (с первым столбом из единиц), в которую вручную нужно добавить квадрат регрессора
X = sm.add_constant(df[['WE', 'CIT', 'WA']])
X['WA**2'] = df['WA']**2
X['log(FAMINC)'] = np.log(df['FAMINC'])
X

In [None]:
mod = sm.Probit(endog=y, exog=X, missing='drop')

res = mod.fit()

res.summary()