# Визуализация подгонки линейной регрессии методом OLS

In [None]:
import numpy as np
import pandas as pd

from statsmodels.formula.api import ols

import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

# Не показывать Warnings
import warnings
warnings.simplefilter(action='ignore', category=Warning)

In [None]:
# импорт данных из файла как DataFrame
df = pd.read_csv('../datasets/Labour.csv')

## Пример 1: регрессия без константы

Рассмотрим регрессию `output на capital` __без константы__

In [None]:
# спецификация модели через формулу
mod1 = ols(formula='output~0+capital', data=df)
# подгонка модели
res1 = mod1.fit()
# параметры оптимальной прямой
res1.params

In [None]:
# выделем зависимую и объясняющую переменные
y, X = df['output'], df['capital']
# метрика подгонки
MSE = np.vectorize(lambda coef: np.sum((y-coef*X)**2)/len(y) )
# диапазон для параметра
slope = np.arange(0, 2, 0.05)

fig = px.line(x=slope, y=MSE(slope), title='Life expectancy in Canada')
fig.add_traces(go.Scatter(x=res1.params, y=MSE(res1.params)))
fig.show()

## Пример 2: регрессия с константой

ассмотрим регрессию `output на capital` __c константой__

In [None]:
# спецификация модели через формулу
mod2 = ols(formula='output~1+capital', data=df)
# подгонка модели
res2 = mod2.fit()
# параметры оптимальной прямой
res2.params

In [None]:
# выделем зависимую и объясняющую переменные
y, X = df['output'], df['capital']
# метрика подгонки
MSE = np.vectorize(lambda coef0, coef1: np.sum((y-coef0-coef1*X)**2)/len(y) )

# диапазон для параметра
slope = np.arange(0.5, 1, 0.05)
intercept = np.arange(-2, 15, 0.05)

coef0, coef1 = np.meshgrid(intercept, slope)
# coef0
Z = MSE(coef0, coef1)

fig = go.Figure(data=[go.Surface(x=coef0, y=coef1, z=Z)])
# fig.add_trace({'type':'Scatter3d', 'x':res.params[0], 'y':res.params[1], 'z':MSE(res.params[0], res.params[1])})
fig.add_trace(go.Scatter3d(x=[res2.params[0]], y=[res2.params[1]], z=[MSE(res2.params[0], res2.params[1])]))
fig.show()