# TSS, RSS, ESS

### Решение задачи 1.1.1 из [Листка 03](https://nbviewer.org/github/artamonoff/Econometrica/blob/master/%D0%97%D0%B0%D0%B4%D0%B0%D1%87%D0%B8/List03-Goodness-of-Fit.html)

In [None]:
import numpy as np
import pandas as pd
import io
import statsmodels.formula.api as smf

In [None]:
# определяем данные
data_string ='''log(output) log(capital) log(labour) y.hat
2.22            0.96        5.21     2.19 
1.30            0.28        4.51     1.47 
3.36            3.10        6.05     3.23 
1.42            2.37        4.28     1.56 
1.06            0.15        3.83     0.85 
6.17            5.62        8.94     6.15 
0.77            0.52        3.87     0.94 
1.42            0.15        4.68     1.61 
0.90           -0.13        3.56     0.57 
1.35            1.25        4.28     1.40 '''

In [None]:
# создаём DataFrame
df = pd.read_csv(io.StringIO(data_string), sep='\s+')
df

In [None]:
# Переименуем столбцы, так как log(output) интерпреитуется как функция логарифма от outpu
df =df.rename(columns={"log(output)": "LOGoutput", "log(capital)": "LOGcapital", "log(labour)":'LOGlabour'})
df

#### Первый способ вычисления парамметров регрессии. Согласно определению

In [None]:
# Вычислим общую сумму квадратов
TSS = ((df['LOGoutput'] - np.mean(df['LOGoutput']))**2).sum()
TSS.round(3)

In [None]:
# Вычислим объяснённую сумму квадратов
ESS = ((df['y.hat']- np.mean(df['LOGoutput']))**2).sum()

In [None]:
# Вычисли остаточную сумму квадртов
RSS = ((df['LOGoutput'] - df['y.hat'])**2).sum()
RSS.round(3)

In [None]:
# Коэффициент детерминации равен
R2 = ESS.round(3)/TSS.round(3)
R2.round(3)

In [None]:
# Вычислим исправленный коэффициенте детерминации
n = len(df) # количество измерений равно длине строк в исходной таблице минус 1, т.к. присутствует строка заголовака 
k = 2 # количество регрессорово
RSS_adj = 1 - (RSS/TSS)*((n-1)/(n-k))
RSS_adj

#### Второй способ вычисления парамметров регрессии

In [None]:
# Построем регрессионную модель. Обратите внимание, что так как в таблице даны значения логарифмом, то функция
# np.log() мы не применяем
fitted_line = smf.ols(formula='LOGoutput~LOGcapital+LOGlabour', data=df).fit()

In [None]:
# Предсказанные значения регрессии 
fitted_line.predict().round(2)

In [None]:
# Предсказанные значения регрессии в исходной таблице
np.array(df['y.hat'])

In [None]:
# Параметры регрессии
fitted_line.params

In [None]:
# Вычислим объяснённую сумму квадратов, используя регрессионную модель
fitted_line.ess.round(3)

In [None]:
# Вычислим полную сумму квадратов, используя регрессионную модель
fitted_line.centered_tss.round(3)

In [None]:
# Вычислим остаточную сумму квадратов, используя регрессионную модель
fitted_line.ssr.round(3)

In [None]:
# Вычислим коэффициент детерминации, используя регрессионную модель
fitted_line.rsquared.round(3)

In [None]:
fitted_line.rsquared_adj