### Домашняя работа

**Задача высокого уровня** В реализацию функции `gradient` добавьте параметр $\lambda$, чтобы получить регуляризованный градиентный спуск

Формула поменяется следующим образом:
$$
\left\{
\begin{array}{cc}
\frac{\partial L}{\partial w_0} = \frac{2}{n}\cdot(-1)\cdot \sum_{i=1}^{n} (1\cdot \left(y_i - \sum_{j=1}^{m}w_jx_j^i\right) + \lambda\cdot 2\cdot w_0)&\\
\frac{\partial L}{\partial w_k} = \frac{2}{n}\cdot(-1)\cdot \sum_{i=1}^{n} (x_k^i \cdot\left(y_i - \sum_{j=1}^{m}w_jx_j^i\right) + \lambda\cdot 2\cdot w_k)& k\neq 0 \\
\end{array}
\right.
$$

In [1]:
import numpy as np

def custom_regularized_gradient(X, y, weights, lmbda):
    n, m = X.shape 
    gradients = np.zeros_like(weights)
    
    # Расчет градиента для w0
    for i in range(n):
        sum_wx = np.sum(weights[1:] * X[i, 1:])
        gradients[0] += -2 / n * (1 * (y[i] - sum_wx) + lmbda * 2 * weights[0])
    
    # Расчет градиентов для остальных весов
    for k in range(1, m):
        for i in range(n):
            sum_wx = np.sum(weights[1:] * X[i, 1:])
            gradients[k] += -2 / n * (X[i, k] * (y[i] - sum_wx) + lmbda * 2 * weights[k])
    
    return gradients

В этом модуле мы узнали, как  обучать линейную регрессию, не "упираясь" в аппаратные ресурсы: использовать градиентный спуск.
Мы узнали, как детектировать переобучение модели и закрепили свои знания на примере полиномиальной регрессии и выяснили, как увеличить качество решения с помощью механизма регуляризации. Познакомились с двумя видами регуляризации -  Ridge и Lasso.

Однако, формула не совсем корректная, если мы хотим реализовать гребневую регрессию или L2-регуляризацию, то верные формулы для градиентов выглядят следующим образом:

$$
\left\{
\begin{array}{ll}
\frac{\partial L}{\partial w_0} = \frac{2}{n}\cdot \sum_{i=1}^{n} \left(-\left(y_i - \left(\sum_{j=0}^{m}w_jx_j^i\right)\right)\right)&\\
\frac{\partial L}{\partial w_k} = \frac{2}{n}\cdot \sum_{i=1}^{n} \left(-x_k^i \left(y_i - \left(\sum_{j=0}^{m}w_jx_j^i\right)\right) + \lambda\cdot w_k\right)& k\neq 0 \\
\end{array}
\right.
$$

In [None]:
def regularized_gradient(X, y, weights, lmbda):
    n = len(y)
    gradients = np.zeros_like(weights)
    
    # Расчет градиента для w0
    predictions = np.dot(X, weights)
    error = y - predictions
    gradients[0] = -2 * np.mean(error)
    
    # Расчет градиентов для остальных весов
    for k in range(1, len(weights)):
        gradients[k] = -2 * np.mean(X[:, k] * error) + 2 * lmbda * weights[k]
    
    return gradients