In [47]:
def predict(alpha: float, beta: float, x_i: float) -> float:
    return beta * x_i + alpha

In [48]:
def error(alpha: float, beta: float, x_i: float, y_i: float) -> float:
    """Ошибка предсказания beta * x_i + alpha, когда фактическое значение равно y_i"""
    return predict(alpha, beta, x_i) - y_i

In [49]:
# Для того, чтобы узнать суммарную ошибку по набору, суммируем квадратические ошибки
from typing import List
Vector = List[float]

def sum_of_sqerrors(alpha: float, beta: float, x: Vector, y: Vector) -> float:
    return sum(error(alpha, beta, x_i, y_i) ** 2 for x_i, y_i in zip(x, y))

In [50]:
from typing import Tuple
import numpy as np

def least_squares_fit(x, y) -> Tuple[float, float]:
    """Учитывая векторы x и y, найдем значения alpha и beta по наименьшим квадратам"""
    beta = np.corrcoef(x, y)[0][0] * np.std(y) / np.std(x)
    alpha = np.mean(y) - beta * np.mean(x)
    return alpha, beta
# alpha - когда видим среднее значение независимой переменной x, предсказываем среднее значение y
# beta - когда входное значение увеличивается на стандартное отклонение, предсказание 
# увеличивается на корреляцию * стандартное отклонение

In [51]:
x = [i for i in range(-100, 110, 10)]
y = [3 * i - 5 for i in x]

print(least_squares_fit(x, y))

(-5.0, 2.9999999999999996)


In [54]:
# Коэффициент детерминации, измерение доли суммарной вариации в зависимой переменной, улавливаемой моделью
def total_sum_of_squares(y) -> float:
    """Полная сумма квадратов отклонений y_i от их среднего"""
    return sum(np.mean(v) ** 2 for v in y)

def r_squarred(alpha: float, beta: float, x, y) -> float:
    """Доля отклонения в y, улавливаемая моделью, которая равна '1 - доля отклонения в y, не улавливаемая моделью'"""
    return 1.0 - (sum_of_sqerrors(alpha, beta, x, y) / total_sum_of_squares(y))

In [60]:
rsq = r_squarred(-5, 3, x, y)
print(rsq)

1.0


Как видно, коэффициент детерминации для заданных выборок x, y и параметров alpha и beta равен 1, следовательно составленная регрессионная модель максимально точна