In [20]:
import numpy as np
import matplotlib.pyplot as plt
import math as math

In [21]:
np.random.seed(1234)

In [22]:
# Возьмем 2 признака и 1000 объектов
n_features = 2
n_objects = 1000

# сгенерируем вектор истинных весов
w_true = np.random.normal(size=(n_features, ))

# сгенерируем матрицу X, вычислим Y с добавлением случайного шума
X = np.random.uniform(-7, 7, (n_objects, n_features))
Y = X.dot(w_true) + np.random.normal(0, 0.5, size=(n_objects))

# возьмем нулевые начальные веса
w = np.zeros(n_features)

In [23]:
Y

array([-5.71937308e+00,  6.42200487e+00, -6.22754907e+00, -3.61309248e+00,
       -1.24952278e+00, -2.10667534e+00, -1.87408546e+00,  8.06711862e+00,
       -4.75602542e+00, -2.03931948e+00, -5.77773483e-01,  8.32648436e-01,
       -5.55413438e+00, -1.84424278e+00,  3.29500371e+00,  8.02004094e+00,
       -1.64093596e+00, -8.35192303e+00, -6.93743921e+00,  2.59477266e+00,
       -5.89712012e+00,  1.15446630e-01, -4.28621134e+00, -1.65799764e+00,
       -4.20035318e+00,  8.65844888e+00, -5.58161780e+00, -5.24268607e+00,
       -1.93540562e+00, -4.29251150e+00,  6.18523295e+00,  6.04222590e+00,
       -8.96774218e+00,  3.69668619e+00,  3.48567877e-01,  6.04312911e+00,
       -7.57478182e+00, -1.19004926e+00,  8.83052162e-01, -2.55849924e+00,
        1.38656102e-01,  7.32546475e+00, -4.77011812e+00,  2.18687354e+00,
       -2.72725941e+00, -6.67982807e+00, -1.24453429e+00, -4.56700595e+00,
       -5.33599657e+00, -2.02454680e+00, -1.12923894e-01,  8.47399702e+00,
       -4.36753898e+00, -

In [24]:
# реализуем функцию, определяющую среднеквадратичную ошибку
def mserror(X, w, y_pred):
    y = X.dot(w)
    return (sum((y - y_pred)**2)) / len(y)

Реализуем функцию, вычисляющую вектор весов по нормальному уравнению линейной регрессии, и применим ее.

In [25]:
def normal_equation(X, y):
    return np.linalg.solve((X.T).dot(X), (X.T).dot(y))

normal_eq_w = normal_equation(X, Y)
print(f'В случае использования нормального уравнения функционал ошибки составляет {round(mserror(X, normal_eq_w, Y), 8)}')
normal_error = round(mserror(X, normal_eq_w, Y), 8)

В случае использования нормального уравнения функционал ошибки составляет 0.24134031


Обучим линейную регрессию путем градиентного спуска и получим графики изменения весов и ошибки

In [26]:
def f_alpha(etab, max_iterb):    

    # список векторов весов после каждой итерации
    global w
    wn = w.copy()
    w_list = [w.copy()]
    
    # список значений ошибок после каждой итерации
    errors = []

    # шаг градиентного спуска
    eta = etab

    # максимальное число итераций
    max_iter = max_iterb

    # критерий сходимости (разница весов, при которой алгоритм останавливается)
    min_weight_dist = 1e-8

    # зададим начальную разницу весов большим числом
    weight_dist = np.inf

    # счетчик итераций
    iter_num = 0

    # ход градиентного спуска
    while weight_dist > min_weight_dist and iter_num < max_iter:
        new_w = wn - 2 * eta * np.dot(X.T, (np.dot(X, wn) - Y)) / Y.shape[0]
        weight_dist = np.linalg.norm(new_w - wn, ord=2)

        w_list.append(new_w.copy())
        errors.append(mserror(X, new_w, Y))

        iter_num += 1
        wn = new_w

    w_list = np.array(w_list)
    
    return iter_num-1, round(errors[-1], 8)


#    print(f'В случае использования градиентного спуска функционал ошибки составляет {round(errors[-1], 8)}')
#    print(iter_num)

In [27]:
iter_num, error = f_alpha(0.0287, 9)
print(iter_num, error)


8 0.24134031


In [None]:
eta_beg = 0.5
eta_step = 1.1
max_iter_beg = 10000
eta_f = 0
iter_f = 0
error_f = 0
while True:
    iter_1, error_1 = f_alpha(eta_beg, max_iter_beg)
    eta_beg_2 = eta_beg/eta_step
        
    if math.isnan(error_1) == True:
        eta_beg = eta_beg_2
        #print('NaN: ', eta_beg,iter_1, error_1)
    else:
        #print(eta_beg,iter_1, error_1)
        iter_2, error_2 = f_alpha(eta_beg_2, max_iter_beg)
        #print(eta_beg_2,iter_2, error_2)
        if error_1 == error_2 and iter_2 < iter_1:
            eta_beg = eta_beg_2
            eta_f = eta_beg
            iter_f = iter_2
            error_f = error_1
        elif error_1 == error_f and iter_f < iter_2:
            eta_f = eta_beg
            error_f = error_1
            #print('yes')
            break
        elif iter_2 > max_iter_beg*0.9 or iter_1 > max_iter_beg*0.9:
            max_iter_beg = max_iter_beg*1.5
            
print('eta: ', round(eta_f,4), ', iter_max: ', iter_f, ', mserror: ', round(error_f,8))        

Результат:
eta:  0.0287 , iter_max:  8 , mserror:  0.24134031

Задача 2

In [None]:
for i in range(1000):
    y_pred = np.dot(W, X)
    err = calc_mse(y, y_pred)
    W -= (alpha * 1/n * np.sum(X * (y_pred - y)))
    if err < = 1e-8:
        print(i, W, err)
        break