# Задачи по Эконометрике: интерпретация коэффициентов
# Output Equation

## Output Equation (Модель 1)

На датасете `Labour` рассмотрим региессию **log(output) на log(capital), log(labour)**

Спецификация: $\log(output)=\beta_0+\beta_1\log(capital)+\beta_2log(labour)+u$

In [33]:
import numpy as np # linear algebra 
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
# stats models: regression fitting via formulas
import statsmodels.formula.api as smf
# stats models: regression fitting via matrices of regression design
import statsmodels.api as sm

In [34]:
df = pd.read_csv('/Users/maria/Downloads/Econometrica-master-2/python-notebooks/data-csv/Labour.csv')
df.head()

Unnamed: 0,capital,labour,output,wage
0,2.606563,184,9.250759,43.080307
1,1.323237,91,3.66431,27.780016
2,22.093692,426,28.781516,44.467748
3,10.737851,72,4.124642,39.73471
4,1.161365,46,2.89015,34.650709


### Первый способ оценивания: 
через спецификацию

In [35]:
# специфицируем модель через формулу
output_eq1 = smf.ols(formula='np.log(output)~np.log(capital)+np.log(labour)', data=df).fit()
# Коэфициенты модели с округление
output_eq1.params.round(3)

Intercept         -1.711
np.log(capital)    0.208
np.log(labour)     0.715
dtype: float64

### Второй способ оценивания: 
через матрицы ргерессионного дизайна $\mathbf{y}, \mathbf{X}$

**Проблема**: При составлении матриц регрессионного дизайна нужно преобразовать данные (логарифмировать)

In [36]:
# Зададим матрицы регрессионного дизайна
y = np.log(df['output']) # зависимая переменная
# логаримируем данные
X = pd.DataFrame(data={'l_capital': np.log(df['capital']), 'l_labour': np.log(df['labour'])} )
X = sm.add_constant(X)
#X = sm.add_constant(df[['totwrk', 'male']]) # регрессоры с добавленным столбом единиц
X.head(n=7)

Unnamed: 0,const,l_capital,l_labour
0,1.0,0.958033,5.214936
1,1.0,0.280081,4.51086
2,1.0,3.095292,6.054439
3,1.0,2.373775,4.276666
4,1.0,0.149596,3.828641
5,1.0,5.623283,8.941415
6,1.0,0.518174,3.871201


In [37]:
# Погоним модель
output_eq2 = sm.OLS(y, X).fit()
# Коэфициенты модели с округление
output_eq2.params.round(3)

const       -1.711
l_capital    0.208
l_labour     0.715
dtype: float64

## Output Equation (Модель 2)

На датасете `Labour` рассмотрим региессию **log(output) на log(capital), log(labour), log(wage)**

Спецификация: $\log(output)=\beta_0+\beta_1\log(capital)+\beta_2log(labour)+\beta_3log(wage)+u$

### Первый способ оценивания: 
через спецификацию

In [38]:
# специфицируем модель через формулу
output_eq1 = smf.ols(formula='np.log(output)~np.log(capital)+np.log(labour)+np.log(wage)', data=df).fit()
# Коэфициенты модели с округление
output_eq1.params.round(3)

Intercept         -5.007
np.log(capital)    0.149
np.log(labour)     0.720
np.log(wage)       0.921
dtype: float64

### Второй способ оценивания: 
через матрицы ргерессионного дизайна $\mathbf{y}, \mathbf{X}$

**Проблема**: При составлении матриц регрессионного дизайна нужно преобразовать данные (логарифмировать)

In [39]:
# Зададим матрицы регрессионного дизайна
y = np.log(df['output']) # зависимая переменная
# логаримируем данные
X = pd.DataFrame(data={'l_capital': np.log(df['capital']), 'l_labour': np.log(df['labour']), 'l_wage': np.log(df['wage'])} )
X = sm.add_constant(X)
#X = sm.add_constant(df[['totwrk', 'male']]) # регрессоры с добавленным столбом единиц
X.head(n=7)

Unnamed: 0,const,l_capital,l_labour,l_wage
0,1.0,0.958033,5.214936,3.763066
1,1.0,0.280081,4.51086,3.324317
2,1.0,3.095292,6.054439,3.794764
3,1.0,2.373775,4.276666,3.682225
4,1.0,0.149596,3.828641,3.545318
5,1.0,5.623283,8.941415,3.890591
6,1.0,0.518174,3.871201,3.47995


In [40]:
# Погоним модель
output_eq2 = sm.OLS(y, X).fit()
# Коэфициенты модели с округление
output_eq2.params.round(3)

const       -5.007
l_capital    0.149
l_labour     0.720
l_wage       0.921
dtype: float64