# Задачи по Эконометрике: интерпретация коэффициентов
# Wage Equation

## Wage Equation (Модель 2)

На датасете `` рассмотрим региессию **log(wage) на age, IQ**

Спецификация: $log(wage)=\beta_0+\beta_1age+\beta_2IQ+u$

In [2]:
import numpy as np # linear algebra 
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
# stats models: regression fitting via formulas
import statsmodels.formula.api as smf
# stats models: regression fitting via matrices of regression design
import statsmodels.api as sm

In [4]:
df = pd.read_csv('/Users/maria/Downloads/Econometrica-master-2/python-notebooks/data-csv/wage2.csv')
df.head()

Unnamed: 0,wage,hours,IQ,KWW,educ,exper,tenure,age,married,black,south,urban,sibs,brthord,meduc,feduc,lwage
0,769,40,93,35,12,11,2,31,1,0,0,1,1,2.0,8.0,8.0,6.645091
1,808,50,119,41,18,11,16,37,1,0,0,1,1,,14.0,14.0,6.694562
2,825,40,108,46,14,11,9,33,1,0,0,1,1,2.0,14.0,14.0,6.715384
3,650,40,96,32,12,13,7,32,1,0,0,1,4,3.0,12.0,12.0,6.476973
4,562,40,74,27,11,14,5,34,1,0,0,1,10,6.0,6.0,11.0,6.331502


### Первый способ оценивания: 
через спецификацию

In [7]:
# специфицируем модель через формулу
wage_eq1 = smf.ols(formula='np.log(wage)~age+IQ', data=df).fit()
# Коэфициенты модели с округление
wage_eq1.params.round(3)

Intercept    5.077
age          0.024
IQ           0.009
dtype: float64

In [11]:
# Альтеративно
wage_eq2 = sm.OLS.from_formula(formula='lwage~age+IQ', data=df).fit()
# Коэфициенты модели с округление
wage_eq2.params.round(3)

Intercept    5.077
age          0.024
IQ           0.009
dtype: float64

### Второй способ оценивания: 
через матрицы ргерессионного дизайна $\mathbf{y}, \mathbf{X}$

In [12]:
# Зададим матрицы регрессионного дизайна
y = df['lwage'] # зависимая переменная
X = sm.add_constant(df[['age', 'IQ']]) # регрессоры с добавленным столбом единиц
X.head(n=7)

Unnamed: 0,const,age,IQ
0,1.0,31,93
1,1.0,37,119
2,1.0,33,108
3,1.0,32,96
4,1.0,34,74
5,1.0,35,116
6,1.0,30,91


In [13]:
# Погоним модель
wage_eq3 = sm.OLS(y, X).fit()
# Коэфициенты модели с округление
wage_eq3.params.round(3)

const    5.077
age      0.024
IQ       0.009
dtype: float64

## Wage Equation (Модель 2)

На датасете `` рассмотрим региессию **log(wage) на age, IQ, south, urban, married, KWW**

Спецификация: $log(wage)=\beta_0+\beta_1age+\beta_2IQ+\cdots+u$

In [14]:
# Описательные статистики по переменным модели
df[['lwage', 'age', 'IQ', 'south', 'urban', 'married', 'KWW']].describe()

Unnamed: 0,lwage,age,IQ,south,urban,married,KWW
count,935.0,935.0,935.0,935.0,935.0,935.0,935.0
mean,6.779004,33.080214,101.282353,0.341176,0.717647,0.893048,35.744385
std,0.421144,3.107803,15.052636,0.474358,0.450385,0.309217,7.638788
min,4.744932,28.0,50.0,0.0,0.0,0.0,12.0
25%,6.505783,30.0,92.0,0.0,0.0,1.0,31.0
50%,6.807935,33.0,102.0,0.0,1.0,1.0,37.0
75%,7.056175,36.0,112.0,1.0,1.0,1.0,41.0
max,8.032035,38.0,145.0,1.0,1.0,1.0,56.0


### Первый способ оценивания: 
через спецификацию

In [23]:
# специфицируем моделл через формулу
wage_eq1 = smf.ols(formula='lwage~age+IQ+south+urban+married+KWW', data=df).fit()
# Коэфициенты модели с округление
wage_eq1.params.round(3)

Intercept    5.126
age          0.014
IQ           0.007
south       -0.101
urban        0.165
married      0.191
KWW          0.007
dtype: float64

In [18]:
# Число наблюдений, под которые подгонялась модель
wage_eq1.nobs

935.0

In [26]:
# Альтеративно
sleep_eq2 = sm.OLS.from_formula(formula='lwage~age+IQ+south+urban+married+KWW', data=df).fit()
# Коэфициенты модели с округление
sleep_eq2.params.round(3)

Intercept    5.126
age          0.014
IQ           0.007
south       -0.101
urban        0.165
married      0.191
KWW          0.007
dtype: float64

### Второй способ оценивания: 
через матрицы регрессионного дизайна $\mathbf{y}, \mathbf{X}$

In [27]:
# Зададим матрицы регрессионного дизайна
y = df['lwage'] # зависимая переменная
# регрессоры с добавленным столбом единиц
X = sm.add_constant(df[['age', 'IQ', 'south', 'urban', 'married', 'KWW']])  
X.tail(n=7)

Unnamed: 0,const,age,IQ,south,urban,married,KWW
928,1.0,31,100,1,0,1,33
929,1.0,34,82,1,1,1,30
930,1.0,30,79,1,0,1,28
931,1.0,31,102,1,1,1,32
932,1.0,28,77,1,0,1,22
933,1.0,28,109,1,0,1,25
934,1.0,35,107,1,0,1,32


In [30]:
# Погоним модель
wage_eq3 = sm.OLS(y, X).fit()
# Коэфициенты модели с округлением
wage_eq3.params.round(3)

const      5.126
age        0.014
IQ         0.007
south     -0.101
urban      0.165
married    0.191
KWW        0.007
dtype: float64