# Sleep Equation

На датасете `sleep75` рассмотрим региессию **sleep на totwrk, male**

Спецификация: $sleep=\beta_0+\beta_1totwrk+\beta_2male+u$

In [1]:
import numpy as np # linear algebra 
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
# stats models: regression fitting via formulas
import statsmodels.formula.api as smf
# stats models: regression fitting via matrices of regression design
import statsmodels.api as sm

In [2]:
df = pd.read_csv('https://raw.githubusercontent.com/artamonoff/Econometrica/master/python-notebooks/data-csv/sleep75.csv')

## Первый способ оценивания: 
через спецификацию

In [3]:
# специфицируем модель через формулу
sleep_eq1 = smf.ols(formula='sleep~totwrk+male', data=df).fit()
# Коэфициенты модели с округление
sleep_eq1.params.round(2)

Intercept    3573.20
totwrk         -0.17
male           88.84
dtype: float64

In [4]:
# Альтеративно
sleep_eq2 = sm.OLS.from_formula(formula='sleep~totwrk+male', data=df).fit()
# Коэфициенты модели с округление
sleep_eq2.params.round(2)

Intercept    3573.20
totwrk         -0.17
male           88.84
dtype: float64

## Второй способ оценивания: 
через матрицы ргерессионного дизайна $\mathbf{y}, \mathbf{X}$

In [5]:
# Зададим матрицы регрессионного дизайна
y = df['sleep'] # зависимая переменная
X = sm.add_constant(df[['totwrk', 'male']]) # регрессоры с добавленным столбом единиц
X.head(n=7)

Unnamed: 0,const,totwrk,male
0,1.0,3438,1
1,1.0,5020,1
2,1.0,2815,1
3,1.0,3786,0
4,1.0,2580,1
5,1.0,1205,1
6,1.0,2113,1


In [6]:
# Погоним модель
sleep_eq3 = sm.OLS(y, X).fit()
# Коэфициенты модели с округление
sleep_eq3.params.round(2)

const     3573.20
totwrk      -0.17
male        88.84
dtype: float64