In [1]:
import pandas as pd 
import numpy as np
from sklearn.datasets import make_regression


In [13]:
X, y = make_regression(n_samples=600, n_features=5, n_informative=5, noise=15, random_state=41)
X = pd.DataFrame(X, columns=['f1', 'f2', 'f3', 'f4', 'f5'])
y = pd.Series(y, name='target')

In [15]:
X

Unnamed: 0,f1,f2,f3,f4,f5
0,-0.986257,1.745565,-1.200874,-0.047218,0.267876
1,2.015698,0.488657,0.996674,0.653400,0.065277
2,1.701293,-1.477120,2.039221,-0.025737,0.205535
3,-0.301803,-1.172736,0.528437,0.770789,0.158079
4,1.176931,0.894768,-0.556505,-0.974740,-1.182949
...,...,...,...,...,...
595,-1.451426,-0.050116,-0.249363,-0.384609,0.653114
596,-0.482776,-0.501015,0.504170,-1.131012,0.970515
597,1.880913,-0.866513,0.057113,-0.284894,1.084699
598,1.116665,-0.965840,-1.428672,0.140047,1.800045


In [17]:
y

0      -37.051235
1      355.137614
2      210.941483
3      -38.814320
4       99.142999
          ...    
595   -195.632726
596    -99.735042
597    112.311375
598    -73.126157
599    148.894350
Name: target, Length: 600, dtype: float64

# В этой части нужно реализовать Регуляризацию
- Добавьте в класс MyLineReg три параметра:
- reg – принимает одно из трех значений: l1, l2, elasticnet. По умолчанию: None
- l1_coef – принимает значения от 0.0 до 1.0. По умолчанию: 0
- l2_coef – принимает значения от 0.0 до 1.0. По умолчанию: 0
- Добавьте регуляризацию к вычислению лоса.
- Добавьте регуляризацию к вычислению градиента По умолчанию: None

========================================================================================

### Примечания:

     Для вычисления регуляризации L1 вам нужно задать reg="l1" и указать только l1_coef.
     
     Для вычисления L2 вам нужно задать reg="l2" и указать только l2_coef.
     
     Для вычисления Elasticnet вам нужно задать reg="elasticnet" и указать оба параметра l1_coef и l2_coef.


##### Добавлю пару слов про регулярищацию и веса модели

регуляризация выполняется ко всем весам модели, кроме w0

1. Смысловая нагрузка intercept
Свободный член (w₀) отвечает за базовый уровень предсказания, когда все признаки равны нулю. Его регуляризация:

Искусственно сместит предсказания модели

Нарушит естественную интерпретируемость модели

Не улучшит обобщающую способность

2. Масштабируемость данных
Если мы стандартизируем данные (что рекомендуется для регуляризации), то:

Признаки будут иметь mean=0

Intercept будет точно соответствовать среднему значению целевой переменной

Регуляризация intercept исказит это важное свойство

3. Технические причины
Регуляризация intercept сделает решение зависимым от выбора начала координат

Модель потеряет свойство инвариантности к сдвигу данных

Не улучшает качество регуляризации признаков

In [272]:
class MyLineReg():
    def __init__(self, n_iter=100, learning_rate=0.1, reg=None, l1_coef=0, l2_coef=0, metric=None, weights=None):
        self.n_iter = n_iter
        self.learning_rate = learning_rate
        self.metric = metric
        self.weights = weights
        self.reg = reg
        self.l1_coef = l1_coef
        self.l2_coef = l2_coef
        self.best_score = None

        # Проверям на входные параметры подсчета метрики
        if self.metric is not None and self.metric not in ['mae', 'mse', 'rmse', 'mape', 'r2']:
            raise ValueError("metric must be 'mae', 'mse', 'rmse', 'mape' or 'r2'")
        # Проверям на входные параметры регулиризации 
        if self.reg is not None and self.reg not in ['l1', 'l2', 'elasticnet']:
            raise ValueError("reg must be 'l1', 'l2', or 'elasticnet'")
        # Проверка коэффициентов (должны быть от 0 до 1)
        if self.l1_coef < 0 or self.l1_coef > 1:
            raise ValueError("l1_coef must be in [0, 1]")
        if self.l2_coef < 0 or self.l2_coef > 1:
            raise ValueError("l2_coef must be in [0, 1]")

    def __str__(self):
        return f'MyLineReg class: n_iter={self.n_iter}, learning_rate={self.learning_rate}'

    # Напишем метод с приватным модификатором доступа для подсчета разнных метрик 
    def __calculate_metric(self, pred: pd.DataFrame, y_true: pd.Series, metric:'str'):
        """
        Вычисляет значение метрики.

        Параметры:
        pred (np.array): Предсказанные значения.
        y_true (np.array): Фактические значения.
        metric (str): Название метрики.

        Возвращает:
        float: Значение метрики.
        """
        if metric == 'mae':
            return np.mean(np.abs(pred - y_true))
        elif metric == 'mse':
            return np.mean((pred - y_true)**2)
        elif metric == 'rmse':
            return np.sqrt(np.mean((pred - y_true)**2))
        elif metric == 'mape':
            return 100 * np.mean(np.abs((pred - y_true) / y_true))
        elif metric == 'r2':
            ss_residual = np.sum((pred - y_true)**2)
            ss_total = np.sum((y_true - np.mean(y_true))**2)
            return 1 - (ss_residual / ss_total)
        else:
            raise ValueError(f"Unknown metric: {metric}")

    def fit(self, X: pd.DataFrame, y:pd.Series, verbose=False):
        """
        Обучение модели линейной регрессии.

        Параметры:
        X (pd.DataFrame): Матрица признаков.
        y (pd.Series): Вектор целевых значений.
        verbose (bool): Флаг для вывода информации о процессе обучения.
        """
        X_copy = X.copy()               # создадим копию нашей матрицы фичей, что бы не изменить изначальный
        X_copy.insert(0, 'base', 1)     # допишем слева столбик из 1 для свободного члела
        w = np.ones(X_copy.shape[1])    # составим вектор весов, заполненный из 1

        # Напишем подсчет ошибки до начала обучения
        if verbose:                   
            initial_MSE = np.mean((np.dot(X_copy, w) - y)**2)          # ошибка MSE + L1 
            if self.reg == 'l1':
                initial_MSE += self.l1_coef * np.sum(np.abs(w[1:]))    # ошибка MSE + L2
            if self.reg == 'l2':
                initial_MSE += self.l2_coef * np.sum(w[1:]**2)         # ошибка MSE + elasticnet
            if self.reg == 'elasticnet':
                initial_MSE += self.l1_coef * np.sum(np.abs(w[1:])) + self.l2_coef * np.sum(w[1:]**2)
                
            if self.metric is None:                          # Если не задана метрика, то в логи выводим только MSE
                print(f'start | loss: {initial_MSE:0.2f}')   
            else:                                            # Если задана, то выводим ошибку на MSE и на выбранной нами метрике
                print(f'start | loss: {initial_MSE:0.2f} | {self.metric}: {self.__calculate_metric(pred=X_copy.dot(w), y_true=y, metric=self.metric):0.2f}')
            
        for i in range(self.n_iter): # Напишем цикл обучения
            pred = np.dot(X_copy, w) # cчитаем предасказания модели 
            error = pred - y         # вычисляем ошибку (предсказания - реальные значения)
            grad = (2/len(X_copy)) * np.dot(error, X_copy) # вычисляем градиенты по весам  (Градиент MSE)

            # добавим градиент регуляризации к весам модели, если она установлена
            if self.reg == 'l1':                                         # градиент MSE с L1 регуляризацией 
                grad[1:] += self.l1_coef * np.sign(w[1:])
            elif self.reg == 'l2':                                       # градиент MSE с L2 регуляризацией 
                grad[1:] += 2 * self.l2_coef * w[1:]
            elif self.reg == 'elasticnet':                               # градиент MSE c elasticnet регуляризацией
                grad[1:] += self.l1_coef * np.sign(w[1:]) + 2 * self.l2_coef * w[1:]
                
            if self.metric:         # Если задана метрика, то считаем его и обновляем self.best_score
                metric_loss = self.__calculate_metric(pred = X_copy.dot(w), y_true=y, metric=self.metric) # Считаем выбранную метрику
                self.best_score = metric_loss

            if verbose:     # выводим логи 
                loss = np.mean(error**2)
                if self.reg == 'l1':                             # Если L1 то к ошибке MSE + L1
                    loss += self.l1_coef * np.sum(np.abs(w[1:])) 
                if self.reg == 'l2':                            
                    loss += self.l2_coef * np.sum((w[1:])**2)   # Если L2 то к ошибке MSE + L2
                if self.reg == 'elasticnet':                     # Есле elasticnet то к ошибке MSE + elasticnet
                    loss += self.l1_coef * np.sum(np.abs(w[1:])) + self.l2_coef * np.sum((w[1:])**2)
                if self.metric is None and i % 10 == 0:        # Eсли метрика не указана, то в логи выыодим итерацию и ошибку на MSE
                    print(f'Iteration {i}| loss: {loss}')
                elif self.metric and (i % 10 == 0 or self.n_iter - 1 == i): # Если указана метрика, то выводим ошибку MSE и на метрике
                    print(f'Iteration {i}| loss: {loss:0.2f} | {self.metric}: {metric_loss:0.2f}')
                    
            w -= self.learning_rate * grad  # обновляем веса, обновляем тут, чтобы ошибка считалась правильно        
        # сохроняем веса
        self.weights = w 
    def predict(self, X: pd.DataFrame)->np.array:
        """
        Предсказание целевых значений.

        Параметры:
        X (pd.DataFrame): Матрица признаков.

        Возвращает:
        np.array: Предсказанные значения.
        """
        X_copy = X.copy()            # делаем копию матрицы фичей, чтобы не менять изначальный датафрейм
        X_copy.insert(0, 'base', 1)  # допишем слева столбик из 1 для свободного члена
        predict = X_copy.dot(self.weights) # делаем предсказания X_copy @ self.weights
        return predict 

    def get_best_score(self):  # Метод для вывода лучшего качетва на выбранной метрике
        if self.metric is None:
            raise ValueError("Metric was not set during model initialization.")
        return self.best_score

    def get_coef(self):
        return self.weights[1:] # метод для вывода весов начиная с 1го заначения            

In [344]:
model = MyLineReg(n_iter=200, learning_rate=0.01, metric='mse')

In [346]:
print(model)

MyLineReg class: n_iter=200, learning_rate=0.01


In [348]:
model.fit(X, y, verbose=True)

start | loss: 33311.28 | mse: 33311.28
Iteration 0| loss: 33311.28 | mse: 33311.28
Iteration 10| loss: 21769.14 | mse: 21769.14
Iteration 20| loss: 14262.50 | mse: 14262.50
Iteration 30| loss: 9376.88 | mse: 9376.88
Iteration 40| loss: 6194.80 | mse: 6194.80
Iteration 50| loss: 4120.73 | mse: 4120.73
Iteration 60| loss: 2767.86 | mse: 2767.86
Iteration 70| loss: 1884.76 | mse: 1884.76
Iteration 80| loss: 1307.89 | mse: 1307.89
Iteration 90| loss: 930.77 | mse: 930.77
Iteration 100| loss: 684.05 | mse: 684.05
Iteration 110| loss: 522.53 | mse: 522.53
Iteration 120| loss: 416.70 | mse: 416.70
Iteration 130| loss: 347.31 | mse: 347.31
Iteration 140| loss: 301.78 | mse: 301.78
Iteration 150| loss: 271.88 | mse: 271.88
Iteration 160| loss: 252.24 | mse: 252.24
Iteration 170| loss: 239.32 | mse: 239.32
Iteration 180| loss: 230.81 | mse: 230.81
Iteration 190| loss: 225.22 | mse: 225.22
Iteration 199| loss: 221.83 | mse: 221.83


In [336]:
model.weights

array([-0.87394267, 71.20827165, 72.53128488, 70.71997003, 36.79030694,
        6.85575486])

In [338]:
model.get_coef()

array([71.20827165, 72.53128488, 70.71997003, 36.79030694,  6.85575486])

-1.13104352, 97.62387217, 98.59045611, 96.23437016, 49.54280024,
       11.68589899

In [242]:
model.get_best_score()

68.43374543035218

In [244]:
def mse(pred, y):
    return np.mean((pred - y)**2)
rmse = lambda pred, y: np.sqrt(np.mean((pred - y)**2))

In [246]:
mse(model.predict(X), y)

4683.176670778619

In [248]:
rmse(model.predict(X), y)

68.43373927222316