<a href="https://colab.research.google.com/github/Tkaheva/MO/blob/main/homework_practice_3_3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Домашняя работа

**Задача высокого уровня** В реализацию функции `gradient` добавьте параметр $\lambda$, чтобы получить регуляризованный градиентный спуск

Формула поменяется следующим образом:
$$
\left\{
\begin{array}{cc}
\frac{\partial L}{\partial w_0} = \frac{2}{n}\cdot(-1)\cdot \sum_{i=1}^{n} (1\cdot \left(y_i - \sum_{j=1}^{m}w_jx_j^i\right) + \lambda\cdot 2\cdot w_0)&\\
\frac{\partial L}{\partial w_k} = \frac{2}{n}\cdot(-1)\cdot \sum_{i=1}^{n} (x_k^i \cdot\left(y_i - \sum_{j=1}^{m}w_jx_j^i\right) + \lambda\cdot 2\cdot w_k)& k\neq 0 \\
\end{array}
\right.
$$

In [2]:
import numpy as np
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score
from sklearn.preprocessing import StandardScaler

class RegularizedGradientDescent:
    def __init__(self, learning_rate=0.01, max_iter=1000, lambda_reg=0.1):
        self.learning_rate = learning_rate
        self.max_iter = max_iter
        self.lambda_reg = lambda_reg

    def gradient(self, X, y, weights):
        n_samples = X.shape[0]
        y_pred = X.dot(weights)
        error = y_pred - y

        gradient = (2 / n_samples) * X.T.dot(error)
        gradient[1:] += 2 * self.lambda_reg * weights[1:]

        return gradient

    def fit(self, X, y):
        self.weights = np.zeros(X.shape[1])

        for i in range(self.max_iter):
            grad = self.gradient(X, y, self.weights)
            self.weights -= self.learning_rate * grad

        return self

    def predict(self, X):
        return X.dot(self.weights)

# Загрузка California housing dataset
housing = fetch_california_housing()
X, y = housing.data, housing.target

# Разделение данных
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=10)

# Масштабирование и добавление intercept
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

X_train_scaled = np.column_stack([np.ones(X_train_scaled.shape[0]), X_train_scaled])
X_test_scaled = np.column_stack([np.ones(X_test_scaled.shape[0]), X_test_scaled])

# Обучение модели
model = RegularizedGradientDescent(learning_rate=0.1, max_iter=1000, lambda_reg=0.1)
model.fit(X_train_scaled, y_train)

# Предсказание и оценка
y_pred = model.predict(X_test_scaled)
r2 = r2_score(y_test, y_pred)

print(f"R² score: {r2:.4f}")
print(f"Количество итераций: {model.max_iter}")
print(f"Веса модели: {model.weights}")

R² score: 0.5673
Количество итераций: 1000
Веса модели: [ 2.06456048  0.72797861  0.15763154 -0.07556575  0.09668285  0.01074828
 -0.03447743 -0.41092374 -0.37071179]


В этом модуле мы узнали, как  обучать линейную регрессию, не "упираясь" в аппаратные ресурсы: использовать градиентный спуск.
Мы узнали, как детектировать переобучение модели и закрепили свои знания на примере полиномиальной регрессии и выяснили, как увеличить качество решения с помощью механизма регуляризации. Познакомились с двумя видами регуляризации -  Ridge и Lasso.