# Регрессия со структурными сдвигами

<div style="background-color:Bisque; color:DarkBlue; padding:30px;">

<i><b><span style="color: purple"> Регрессия со структурными сдвигами </span> </b><br>

Пусть

* бинарная переменная $D$ отвечает за структурный сдвиг
* $y$ – зависимая эндогенная переменная
* $x=\begin{pmatrix} 1 & x_1 & \cdots & x_k \end{pmatrix}$ – экзогенные регрессоры/предикторы

Спецификация регрессии со структурными сдвигам вдоль переменной $D$

$$
	y=x^\top\beta+(D\cdot x)^\top\gamma+u=\beta_0+\beta_1x_1+\cdots+\gamma_0D+\gamma_1 Dx_1+\cdots+u
$$

Тогда
* $\gamma_0$ – структурный сдвиг константы
* $\gamma_j$ – структурный сдвиг "отдачи" от регрессора $x_j$ ($j=1,\ldots$)

</div>

In [None]:
import pandas as pd
import numpy as np

import statsmodels.formula.api as smf
import statsmodels.api as sm

import seaborn as sns

In [None]:
df = pd.read_csv('sleep75.csv')

Рассмотрим регрессию __sleep на totwrk, age, smsa__ со сдвигами относительно гендерной переменной

$$
	sleep=\beta_0+\beta_1totwrk+\beta_2age+\beta_3smsa+\gamma_0 male+\gamma_1 totwrk*male+\gamma_2age*male+\gamma_3smsa*male+u
$$

In [None]:
mod = smf.ols(formula='sleep~1+totwrk+age+smsa+male+totwrk:male+age:male+smsa:male', data=df)
#mod = smf.ols(formula='sleep~1+totwrk+age+smsa+male+totwrk*male+age*male+smsa*male', data=df) # тоже самое

res = mod.fit()

res.params

Визуализация структурных сдвигов

In [None]:
sns.lmplot(data=df, x='totwrk', y='sleep', hue='male', ci=False, scatter_kws={'s':6})

In [None]:
sns.lmplot(data=df, x='age', y='sleep', hue='male', ci=False, scatter_kws={'s':6})