#### Линейная регрессия и градиентный спуск

In [1]:
import numpy as np

In [2]:
np.random.seed(42) 

# создаём np-массив из 1000 случайных чисел в диапазоне 0..1
sz = 1000
x = np.random.rand(sz, 1) 

# строим линейную функцию y = f(x) и добавляем шум к зависимой переменной
y = 1 + 2 * x  + 0.1 * np.random.randn(sz, 1) 

# формируем индексы от 0 до 999 и случайным образом их распределяем
idx = np.arange(sz)
np.random.shuffle(idx)
train_idx = idx

In [3]:
# формируем обучающие выборки зависимой и независимой переменных
x_train, y_train = x[train_idx], y[train_idx]

In [4]:
# задаём начальные случайные значения коэффициентам линейной регрессии
a = np.random.randn(1)
b = np.random.randn(1)
print(a,b)

[-1.11714133] [-1.01209489]


In [5]:
# задаем скорость обучения
lr = 0.01
# задаем количество итераций
n_iters = 10000

In [6]:
for iter in range(n_iters):

    # рассчитываем результирующий массив с текущими коэффициентами a и b на основе обучающей выборки 
    yhat = a + b * x_train
    
    # считаем отклонение нового результата от обучающего, то есть определяем потери 
    error = (y_train - yhat)
    
    # считаем градиенты для коэффициентов a и b
    a_grad = -2 * error.mean()
    b_grad = -2 * (x_train * error).mean()

    # обновляем значения коэффициентов уравнения линейной регрессии, используя коэффициент скорости обучения
    a = a - lr * a_grad
    b = b - lr * b_grad
    
print(a,b)   

[1.01747902] [1.9845196]
