<a href="https://colab.research.google.com/github/tintubiel/MSU_ML_MFK/blob/main/logistic_regression_l2_regularization.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# L2-регуляризация

Регуляризация - это один из способов борьбы с переобучением моделей. Делается это в основном при помощи добавления к функции потерь некоторых слагаемых. Существуют стандартные методы регуляризации. Один из таких методов - это так называемая L2-регуляризация. Состоит идея L2-регуляризации в следующем:

Мы добавляем к функции потерь специальное слагаемое, равное половине квадрата 2-нормы (длины вектора) весов модели, умноженного на некоторый коэффициент. То есть наша новая лосс функция выглядит так:

$$\hat{H} = H + \frac{β}{2}|\vec{\omega}|^2$$

Градиенты такой функции тоже нехитрым образом преобразуются:
$$\frac{∂ \hat{H}}{∂ \omega} = \frac{∂H}{∂ \omega} + β\omega$$
Поскольку $|\vec{\omega}|^2 = \omega_0^2 + \omega_1^2 + ... + \omega_n^2$

Реализуйте класс LogisticRegression для решения задачи бинарной классификации с L2-регуляризацией.

Напоминание:

* Функция .fit(x, y) производит обучение модели. В рамках этой функции необходимо реализовать подбор оптимальных параметров модели/сконфигурировать модель для дальнейшего использования на основе данной тренировочной выборки, где x - это матрица признакового описания выборки, а y - вектор ответов

* Функция .predict(x) осуществляет предсказание для каждого из объектов, чьи векторные описания представлены строками матрицы x. Выполняется строго после .fit(). Ради безопасности можно даже реализовать механизм отказа в виде выбрасывания специальной ошибки UnfittedError в случае попытки вызова функции .predict() до вызова функции .fit()

Шаблон класса:

In [69]:

import numpy as np

class LogisticRegression(object):
  def __init__(self):
    self.alpha = None

  def fit(self, x_train, y_train,  lr, betta, num_epoch):
    self.alpha = np.ones(x_train.shape[1]+1)
    x_train=np.hstack((x_train,np.ones(x_train.shape[0]).reshape(x_train.shape[0],1)))

    for epo in range(num_epoch):
      for i,x in enumerate(x_train):
          y_pred = 1/(1 + np.exp(-np.dot(self.alpha, x)))
          grad = x * ((1 - y_train[i]) * y_pred - y_train[i] * (1 - y_pred)) + betta * self.alpha
          self.alpha = self.alpha - lr * grad
    return self.alpha

  def predict(self, X):
      preds=[]
      X=np.hstack((X,np.ones(X.shape[0]).reshape(X.shape[0],1)))
      print(self.alpha)
      for i,x in enumerate(X):
        preds.append(1/(1 + np.exp(-np.dot(self.alpha, x))))
      return preds

  def predict_proba(self,X):
      X=np.hstack((X,np.ones(X.shape[0]).reshape(X.shape[0],1)))
      probabilities=[]
      for i,x in enumerate(X):
        y_pred = 1/(1 + np.exp(-np.dot(self.alpha, x)))
        probabilities.append([1-y_pred, y_pred])
      return(probabilities)


In [72]:
x_train=np.array([[-1,-1],[-1,4],[-2,-5],[-3,10],[1,2],[3,-1],[3,10],[2,-3]])
y_train=np.array([0,0,0,0,1,1,1,1])

x_test=np.array([[-0.5,1],
                 [-2.5,4.5],
                 [0.5,2],
                 [3.5,-1.5]])
lr=0.1
num_epoch=20
betta=0

model=LogisticRegression()

model.fit(x_train, y_train, lr, betta, num_epoch)
print(np.array(model.predict_proba(x_test)))

[[7.42959562e-01 2.57040438e-01]
 [9.98267821e-01 1.73217861e-03]
 [2.01690896e-01 7.98309104e-01]
 [1.02587929e-04 9.99897412e-01]]


In [73]:
from sklearn.linear_model import LogisticRegression
model=LogisticRegression()
model.fit(x_train, y_train)
model.predict_proba(x_test)

array([[0.70817739, 0.29182261],
       [0.96431016, 0.03568984],
       [0.41401579, 0.58598421],
       [0.01832846, 0.98167154]])

# Замечание

По большому счету Вам нужно внести соответствующие изменения в класс LogisticRegression, который Вы реализовали в предыдущем задании. В качестве шаблона кода можно также взять код из предыдущего задания. Главное требование - реализация функций `.fit()`,  `.predict()` и `predict_proba()`