In [3]:
import numpy as np # linear algebra 
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
# stats models: regression fitting via formulas
import statsmodels.formula.api as smf
# stats models: regression fitting via matrices of regression design
import statsmodels.api as sm

# 1 Sleep equation

In [9]:
df = pd.read_csv('https://raw.githubusercontent.com/artamonoff/Econometrica/master/python-notebooks/data-csv/sleep75.csv')
df

Unnamed: 0,age,black,case,clerical,construc,educ,earns74,gdhlth,inlf,leis1,...,spwrk75,totwrk,union,worknrm,workscnd,exper,yngkid,yrsmarr,hrwage,agesq
0,32,0,1,0.000000,0.000000,12,0,0,1,3529,...,0,3438,0,3438,0,14,0,13,7.070004,1024
1,31,0,2,0.000000,0.000000,14,9500,1,1,2140,...,0,5020,0,5020,0,11,0,0,1.429999,961
2,44,0,3,0.000000,0.000000,17,42500,1,1,4595,...,1,2815,0,2815,0,21,0,0,20.529997,1936
3,30,0,4,0.000000,0.000000,12,42500,1,1,3211,...,1,3786,0,3786,0,12,0,12,9.619998,900
4,64,0,5,0.000000,0.000000,14,2500,1,1,4052,...,1,2580,0,2580,0,44,0,33,2.750000,4096
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
701,45,0,702,0.182331,0.030075,12,5500,1,0,5069,...,1,2026,0,2026,0,27,0,18,,2025
702,34,0,703,0.182331,0.030075,10,2500,0,0,5885,...,0,675,1,465,210,18,0,4,,1156
703,37,0,704,0.182331,0.030075,12,3500,1,0,4719,...,1,1851,0,1851,0,19,0,17,,1369
704,54,0,705,0.182331,0.030075,17,32500,1,0,5149,...,1,1961,1,1481,480,31,0,22,,2916


## 1.1 Модель 1

### Cпецификация

In [5]:
# специфицируем модель через формулу
sleep_eq1 = smf.ols(formula='sleep~totwrk+male', data=df).fit()
# Коэфициенты модели с округление
sleep_eq1.params.round(2)

Intercept    3573.20
totwrk         -0.17
male           88.84
dtype: float64

$$
sleep = 3573.2 - 0.17*totwrk + 88.84 *male
$$ 

1. При увеличении количества рабочего времени на 1 минуту в неделю, количество сна уменьшается на 0.17 минут в неделю, при прочих равных
2. Мужчины спят на 88.84 минуты в неделю больше женщин, при прочих равных

## 1.2 Модель 2

### Cпецификация

In [4]:
# специфицируем модель через формулу
sleep_eq1 = smf.ols(formula='sleep~totwrk+male+smsa+age+south+yngkid+marr+union', data=df).fit()
# Коэфициенты модели с округление
sleep_eq1.params.round(2)

Intercept    3446.83
totwrk         -0.17
male           87.11
smsa          -54.19
age             2.71
south         102.27
yngkid        -13.05
marr           31.36
union          11.87
dtype: float64

$$
sleep = 3446.83 - 0.17*totwrk + 87.11*male - 54.19*smsa + 2.71*age + 102.27*south - 13.05*yngkid + 31.36*marr + 11.87*union
$$ 

1. При увеличении количества рабочего времени на 1 минуту в неделю, количество сна уменьшается на 0,17 минут в неделю, при прочих равных
2. Мужчины спят на 87,11 минуты в неделю больше женщин, при прочих равных

## 1.3 Модель 3

### Cпецификация

In [6]:
# специфицируем модель через формулу
sleep_eq1 = smf.ols(formula='sleep~np.log(hrwage)+smsa+totwrk+male+marr+age+south+yngkid', data=df).fit()
# Коэфициенты модели с округление
sleep_eq1.params.round(2)

Intercept         3440.19
np.log(hrwage)      -1.39
smsa               -36.96
totwrk              -0.16
male                36.87
marr                53.34
age                  2.37
south               76.27
yngkid              47.92
dtype: float64

$$
sleep = 3440.19 - 1.39*log(hrwage) - 36.96*smsa - 0.16*totwrk + 36.87*male + 53.34*marr + 2.37*age + 76.27*south + 47.92*yngkid
$$ 

1. При увеличении почасовой оплаты на 1%, количество сна уменьшается на 0,0139 минут в неделю, при прочих равных
2. Человек, живущий в мегаполисе, спит на 1,39 минуты меньше, чем тот, кто не живет в мегаполисе, при прочих равных

# 2 Wage equation

In [4]:
df = pd.read_csv('https://raw.githubusercontent.com/artamonoff/Econometrica/master/python-notebooks/data-csv/wage2.csv')
df

Unnamed: 0,wage,hours,IQ,KWW,educ,exper,tenure,age,married,black,south,urban,sibs,brthord,meduc,feduc,lwage
0,769,40,93,35,12,11,2,31,1,0,0,1,1,2.0,8.0,8.0,6.645091
1,808,50,119,41,18,11,16,37,1,0,0,1,1,,14.0,14.0,6.694562
2,825,40,108,46,14,11,9,33,1,0,0,1,1,2.0,14.0,14.0,6.715384
3,650,40,96,32,12,13,7,32,1,0,0,1,4,3.0,12.0,12.0,6.476973
4,562,40,74,27,11,14,5,34,1,0,0,1,10,6.0,6.0,11.0,6.331502
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
930,520,40,79,28,16,6,1,30,1,1,1,0,0,1.0,11.0,,6.253829
931,1202,40,102,32,13,10,3,31,1,0,1,1,7,7.0,8.0,6.0,7.091742
932,538,45,77,22,12,12,10,28,1,1,1,0,9,,7.0,,6.287858
933,873,44,109,25,12,12,12,28,1,0,1,0,1,1.0,,11.0,6.771935


## 2.1 Модель 1

### Спецификация

In [8]:
# специфицируем модель через формулу
wage_eq1 = smf.ols(formula='np.log(wage)~age+IQ', data=df).fit()
# Коэфициенты модели с округление
wage_eq1.params.round(3)

Intercept    5.077
age          0.024
IQ           0.009
dtype: float64

$$
log(wage) = 5.077 + 0.024*age + 0.009*IQ
$$

1. При взрослении на 1 год, зарплата увеличивается на 2,4%, при прочих равных
2. При увеличении IQ на 1 пункт, зарплата увеличивается на 0,9%, при прочих равных

## 2.2 Модель 2

### Спецификация

In [5]:
# специфицируем модель через формулу
wage_eq1 = smf.ols(formula='np.log(wage)~age+IQ+south+urban+married+KWW', data=df).fit()
# Коэфициенты модели с округление
wage_eq1.params.round(3)

Intercept    5.126
age          0.014
IQ           0.007
south       -0.101
urban        0.165
married      0.191
KWW          0.007
dtype: float64

$$
log(wage) = 5.126 + 0.014*age + 0.007*IQ - 0.101*south + 0.165*urban + 0.191*married + 0.007*KWW
$$

1. При взрослении на один год, зартплата увеличивается на 1,4%, при прочих равных
2. При увеличении IQ на 1 пункт, зарплата увеличивается на 0,7%, при прочих равных

# 3 Output equation

In [6]:
df = pd.read_csv('https://raw.githubusercontent.com/artamonoff/Econometrica/master/python-notebooks/data-csv/Labour.csv')
df

Unnamed: 0,capital,labour,output,wage
0,2.606563,184,9.250759,43.080307
1,1.323237,91,3.664310,27.780016
2,22.093692,426,28.781516,44.467748
3,10.737851,72,4.124642,39.734710
4,1.161365,46,2.890150,34.650709
...,...,...,...,...
564,2.625403,20,1.424376,33.477545
565,1.276386,61,2.109048,26.300732
566,1.953869,117,6.241870,41.153979
567,1.318527,46,7.902237,66.720139


## 3.1 Модель 1

### Спецификация

In [7]:
# специфицируем модель через формулу
output_eq1 = smf.ols(formula='np.log(output)~np.log(capital)+np.log(labour)', data=df).fit()
# Коэфициенты модели с округление
output_eq1.params.round(3)

Intercept         -1.711
np.log(capital)    0.208
np.log(labour)     0.715
dtype: float64

$$
log(output) = -1.711 + 0.208*log(capital) + 0.715*log(labour)
$$

1. При увеличении капитала на 1%, выпуск увеличивается на 0,208%, при прочих равных
2. При увеличении числа сотрудников на 1%, выпуск увеличивается на 0,715%, при прочих равных

## 3.2 Модель 2

### Спецификация

In [8]:
# специфицируем модель через формулу
output_eq1 = smf.ols(formula='np.log(output)~np.log(capital)+np.log(labour)+np.log(wage)', data=df).fit()
# Коэфициенты модели с округление
output_eq1.params.round(3)

Intercept         -5.007
np.log(capital)    0.149
np.log(labour)     0.720
np.log(wage)       0.921
dtype: float64

$$
log(output) =  -5.007 + 0.149*log(capital) + 0.720*log(labour) + 0.921*log(wage)
$$

1. При увеличении капитала на 1%, выпуск увеличивается на 0,149%, при прочих равных
2. При увеличении числа сотрудников на 1%, выпуск увеличивается на 0,72%, при прочих равных