In [None]:
# Расчет модели методом градиентного спуска
def eval_model(X, y, iterations, alpha=1e-4):
    # начальные весовые коэффициенты
    W = np.random.randn(X.shape[0])

    # число наблюдений в выборке
    n = X.shape[1]

    for i in range(1, iterations+1):
        y_pred = W @ X
        err = calc_mse(y, y_pred)
        W -= 2 * alpha * X @ (y_pred - y) / n
        if i % (iterations / 10) == 0:
            print(i, W, err)
    return W

In [None]:
# Расчет модели методом стохастического градиентного спуска
def eval_sgd_model(X, y, iterations, qty_in_batch, alpha=1e-4):
    # начальные весовые коэффициенты
    W = np.random.randn(X.shape[0])

    # число наблюдений в выборке
    n = X.shape[1]
    
    # число наблюдений в батче
    n_batch = n // qty_in_batch   
    if n % qty_in_batch != 0:
        n_batch += 1
        
    for i in range(1, iterations+1):
        for b in range(n_batch):
            start_ = qty_in_batch*b
            end_ = qty_in_batch*(b+1)

            X_tmp = X[:, start_ : end_]
            y_tmp = y[start_ : end_]

            y_pred_tmp = np.dot(W, X_tmp)
            err = calc_mse(y_tmp, y_pred_tmp)

            W -= 2 * alpha * X_tmp @ (y_pred_tmp - y_tmp) / n
        
        if i % (iterations / 10) == 0:
            print(i, W, err)
    return W

In [2]:
# Расчет модели методом градиентного спуска с использованием L2 регуляризации
def eval_model_reg_l2(X, y, iterations, alpha=1e-4, lambda_=1e-8, qty_in_batch=4):
    # начальные весовые коэффициенты
    W = np.random.randn(X.shape[0])

    # размер выборки
    n = X.shape[1]

    # число батчей
    n_batch = n // qty_in_batch
    if n % qty_in_batch != 0:
        n_batch += 1

    # шаг градиентного спуска
    for i in range(1, iterations+1):
        for b in range(n_batch):
            start_ = qty_in_batch*b
            end_ = qty_in_batch*(b+1)

            X_tmp = X[:, start_ : end_]
            y_tmp = y[start_ : end_]

            y_pred_tmp = np.dot(W, X_tmp)
            
            W -= alpha * 2 * X_tmp @ (y_pred_tmp - y_tmp) / n + lambda_ * W
    return W

In [None]:
# Расчет модели методом градиентного спуска с использованием L1 регуляризации
def eval_model_reg_l1(X, y, iterations, alpha=1e-4, lambda_=1e-8, qty_in_batch=4):
    # начальные весовые коэффициенты
    W = np.random.randn(X.shape[0])

    # размер выборки
    n = X.shape[1]

    # число батчей
    n_batch = n // qty_in_batch
    if n % qty_in_batch != 0:
        n_batch += 1

    # шаг градиентного спуска
    for i in range(1, iterations+1):
        for b in range(n_batch):
            start_ = qty_in_batch*b
            end_ = qty_in_batch*(b+1)

            X_tmp = X[:, start_ : end_]
            y_tmp = y[start_ : end_]

            y_pred_tmp = np.dot(W, X_tmp)
            
            W -= alpha * 2 * X_tmp @ (y_pred_tmp - y_tmp) / n + lambda_ * np.sign(W)
    return W

In [None]:
# число наблюдений
n = X.shape[1]

# шаг градиентного спука
alpha = 1e-2

# текущие весовые коэффициенты
W = np.array([1, 0.5])

# начальная разница весов
weight_dist = np.inf

# счетчик итераций
i = 0

# критерий сходимости
e = 1e-8

while weight_dist > e:
    i += 1
    y_pred = np.dot(W, X)
    err = calc_mse(y, y_pred)
    new_W = W - 2 * alpha * X @ (y_pred - y) / n

    weight_dist = np.linalg.norm(W - new_W, ord=2)
    W = new_W
    if i % 100 == 0:
        print(i, W, err, weight_dist)

        
print(f'\n\nРассчитанные весовые коэффициенты: {round(W[0],3)}, {round(W[1], 3)}.')

In [None]:
# Расчет модели методом стохастического градиентного спуска с критерием остановки и с использованием L2 регуляризации
def eval_model_reg2(X, y, min_weight_dist=1e-8, alpha=1e-4, max_iter=1e5, lambda_=1e-8):
    # начальные весовые коэффициенты
    w = np.random.randn(X.shape[0])

    # размер выборки
    n = X.shape[1]

    # начальная разница весов
    weight_dist = np.inf

    # счетчик итераций
    iter_num = 0

    # ход градиентного спуска
    while weight_dist > min_weight_dist and iter_num < max_iter:
        # генерируем случайный индекс объекта выборки
        index = np.random.randint(n)
        
        y_pred = np.dot(X[:,index], w)

        new_w = w - 2 * alpha * X[:,index] * (y_pred - y[index]) / n + lambda_ * w

        weight_dist = np.linalg.norm(new_w - w, ord=2)
        err = calc_mse(y, y_pred)

        iter_num += 1
        w = new_w

        if iter_num % (max_iter / 10) == 0:
            print(iter_num, w, err, weight_dist)

    return w

In [1]:
# Перемешивание выборки
def shuffle(X, y):
    index = np.random.permutation(y.size)
    X_shuffled = X[index]
    y_shaffled = y[index]
    return X, y

In [2]:
# Сигмойд
sigmoid = lambda z: 1 / (1 - np.exp(-z))

In [3]:
# Функционал ошибки при логарифмической регрессии
calc_logloss = lambda y, y_pred: -np.mean(y * np.log(y_pred) + (1 - y) * np.log(1 - y_pred))