# Задачи по Эконометрике: интерпретация коэффициентов
# Cost Equation

## Cost Equation (Модель 1)

На датасете `Electricity` рассмотрим региессию **log(cost) на log(q)**

Спецификация: $\log(cost)=\beta_0+\beta_1\log(q)+u$

In [11]:
import numpy as np # linear algebra 
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
# stats models: regression fitting via formulas
import statsmodels.formula.api as smf
# stats models: regression fitting via matrices of regression design
import statsmodels.api as sm

In [12]:
df = pd.read_csv('/Users/maria/Downloads/Econometrica-master-2/python-notebooks/data-csv/Electricity.csv')
df.head()

Unnamed: 0,cost,q,pl,sl,pk,sk,pf,sf
0,0.213,8.0,6869.47,0.3291,64.945,0.4197,18.0,0.2512
1,3.0427,869.0,8372.96,0.103,68.227,0.2913,21.067,0.6057
2,9.4059,1412.0,7960.9,0.0891,40.692,0.1567,41.53,0.7542
3,0.7606,65.0,8971.89,0.2802,41.243,0.1282,28.539,0.5916
4,2.2587,295.0,8218.4,0.1772,71.94,0.1623,39.2,0.6606


### Первый способ оценивания: 
через спецификацию

In [13]:
# специфицируем модель через формулу
cost_eq1 = smf.ols(formula='np.log(cost)~np.log(q)', data=df).fit()
# Коэфициенты модели с округление
cost_eq1.params.round(3)

Intercept   -3.841
np.log(q)    0.836
dtype: float64

### Второй способ оценивания: 
через матрицы ргерессионного дизайна $\mathbf{y}, \mathbf{X}$

**Проблема**: При составлении матриц регрессионного дизайна нужно преобразовать данные (логарифмировать)

In [14]:
# Зададим матрицы регрессионного дизайна
y = np.log(df['cost']) # зависимая переменная
# логаримируем данные
X = pd.DataFrame(data={'l_q': np.log(df['q'])} )
X = sm.add_constant(X)
#X = sm.add_constant(df[['totwrk', 'male']]) # регрессоры с добавленным столбом единиц
X.head(n=7)

Unnamed: 0,const,l_q
0,1.0,2.079442
1,1.0,6.767343
2,1.0,7.252762
3,1.0,4.174387
4,1.0,5.686975
5,1.0,5.209486
6,1.0,3.912023


In [15]:
# Погоним модель
cost_eq2 = sm.OLS(y, X).fit()
# Коэфициенты модели с округление
cost_eq2.params.round(3)

const   -3.841
l_q      0.836
dtype: float64

## Cost Equation (Модель 2)

На датасете `Electricity` рассмотрим региессию **log(cost) на log(q), log(pl), log(pf), log(pk)**

Спецификация: $\log(cost)=\beta_0+\beta_1\log(q)+\beta_2\log(pl)+\beta_3\log(pf)+\beta_4\log(pk)+u$

### Первый способ оценивания: 
через спецификацию

In [16]:
# специфицируем модель через формулу
cost_eq1 = smf.ols(formula='np.log(cost)~np.log(q)+np.log(pl)+np.log(pf)+np.log(pk)', data=df).fit()
# Коэфициенты модели с округление
cost_eq1.params.round(3)

Intercept    -7.472
np.log(q)     0.838
np.log(pl)    0.044
np.log(pf)    0.713
np.log(pk)    0.188
dtype: float64

### Второй способ оценивания: 
через матрицы ргерессионного дизайна $\mathbf{y}, \mathbf{X}$

**Проблема**: При составлении матриц регрессионного дизайна нужно преобразовать данные (логарифмировать)

In [17]:
# Зададим матрицы регрессионного дизайна
y = np.log(df['cost']) # зависимая переменная
# логаримируем данные
X = pd.DataFrame(data={'l_q': np.log(df['q']), 'l_pl': np.log(df['pl']), 'l_pf': np.log(df['pf']), 'l_pk': np.log(df['pk'])} )
X = sm.add_constant(X)
#X = sm.add_constant(df[['totwrk', 'male']]) # регрессоры с добавленным столбом единиц
X.head(n=7)

Unnamed: 0,const,l_q,l_pl,l_pf,l_pk
0,1.0,2.079442,8.834842,2.890372,4.173541
1,1.0,6.767343,9.032763,3.047708,4.22284
2,1.0,7.252762,8.982297,3.726416,3.706032
3,1.0,4.174387,9.101852,3.351272,3.719481
4,1.0,5.686975,9.014131,3.668677,4.275832
5,1.0,5.209486,8.529811,3.569814,4.309859
6,1.0,3.912023,9.12742,3.467921,4.505018


In [18]:
# Погоним модель
cost_eq2 = sm.OLS(y, X).fit()
# Коэфициенты модели с округление
cost_eq2.params.round(3)

const   -7.472
l_q      0.838
l_pl     0.044
l_pf     0.713
l_pk     0.188
dtype: float64