# 3.1 Градиентный спуск

В этом задании нам предстоит реализовать классический алгоритм градиентного спуска для обучения модели логистической регрессии.

Алгоритм выполнения этого задания следующий:

* На основе частных производных, посчитанных на лекции, напишем функцию подсчета градиента бинарной кросс-энтропии по параметрам модели

* Напишем функцию обновления весов по посчитанным градиентам

* Напишем функцию тренировки модели

Замечание:
Тренировка модели проводится в несколько циклов, в рамках каждого из которых мы обновим веса модели, основываясь на предсказании для **каждого** объекта из датасета. Такие циклы называются *эпохами*. То есть одна эпоха - это набор обновлений весов, реализованный согласно посчитанным для каждого объекта из датасета ошибкам модели.

Вам необходимо реализовать обучение модели в несколько эпох. Их количество задается параметром функции. В рамках каждой эпохи необходимо пройти циклом по всем объектам обучающей выборки и обновить веса модели.

Шаблон кода для заполнения:

In [17]:
import numpy as np

np.random.seed(42)

def gradient(y_true: int, y_pred: float, x: np.array) -> np.array:
    """
    Вычисление градиента бинарной кросс-энтропии по параметрам модели
    
    Параметры:
    y_true - истинное значение ответа (0 или 1)
    y_pred - предсказанная вероятность принадлежности классу 1
    x - вектор признаков объекта
    
    Возвращает:
    Вектор градиента (той же размерности, что и x + 1 для свободного члена)
    """
    # Добавляем 1 в начало вектора признаков для свободного члена a0
    x_extended = np.append(x, 1)
    # Градиент кросс-энтропии по параметрам
    grad = (y_pred - y_true) * x_extended
    return grad

def update(alpha: np.array, gradient: np.array, lr: float) -> np.array:
    """
    Обновление весов модели по градиенту
    
    Параметры:
    alpha - текущие веса модели
    gradient - вычисленный градиент
    lr - скорость обучения
    
    Возвращает:
    Новые значения весов
    """
    alpha_new = alpha - lr * gradient
    return alpha_new

def train(
    alpha0: np.array, x_train: np.array, y_train: np.array, lr: float, num_epoch: int
) -> np.array:
    """
    Обучение модели логистической регрессии методом градиентного спуска
    
    Параметры:
    alpha0 - начальные веса модели
    x_train - матрица объект-признак
    y_train - вектор истинных ответов
    lr - скорость обучения
    num_epoch - количество эпох обучения
    
    Возвращает:
    Обученные веса модели
    """
    alpha = alpha0.copy()
    for epo in range(num_epoch):
        for i in range(len(x_train)):
            x = x_train[i]
            y_true = y_train[i]
            
            # Вычисляем предсказание (сигмоиду от линейной комбинации)
            z = np.dot(alpha[:-1], x) + alpha[-1]  # alpha[-1] - свободный член
            y_pred = 1 / (1 + np.exp(-z))
            
            # Вычисляем градиент
            grad = gradient(y_true, y_pred, x)
            
            # Обновляем веса
            alpha = update(alpha, grad, lr)
            
    return alpha

# Замечания:

1. В случае, если у Вас возникли сложности с выполнением первого задания и, как следствие, у Вас не выходит сделать это, мы рекомендуем подробно ознакомиться с главой **Производные $\frac{\partial H}{\partial \omega_i}$** нашей [лекции](https://colab.research.google.com/drive/1xjX_YnXcRr8HSiYLByMHxEIAADqs7QES?usp=sharing).

2. Обращайте внимание на названия и порядок аргументов в сдаваемых на проверку функциях - они должны совпадать с тем, что указано в шаблоне кода.

3. Обратите внимание, что матрица объект-признак в описании параметров функций обозначает переменную типа numpy.array(), каждый элемент которой - объект типа numpy.array() - вектор признаков соответствующего объекта.

4. Считайте, что свободный коэффициент a0 находится **в конце** списка alpha.

# 4.1 Линейная регрессия

Вам предложен шаблон класса LinearRegression. Реализуйте методы  .fit() и .predict() соответствующие изложенной выше модели. В рамках выполнения этого задания можно пользоваться только библиотекой numpy. Использование любых других библиотек приведёт к ошибке при проверке задания автоматизированной системой. Также мы просим Вас не менять название класса и обозначенных методов, это также приведёт к ошибке. Добавлять свои методы в класс можно.

Полученные коэффициенты модели должны храниться в поле .coef_


Шаблон класса LinearRegression приведён ниже. Заполните все необходимые пропуски и отправьте получившийся файл в яндекс.контест. Не забудьте про все необходимые импорты.


In [18]:
import numpy as np

np.random.seed(42)

class LinearRegression:
    def __init__(self, **kwargs):
        self.coef_ = None  # Вектор коэффициентов (включая свободный член в конце)

    def fit(self, x: np.array, y: np.array):
        """
        Обучение модели линейной регрессии
        
        Параметры:
        x - матрица объект-признак (n_samples, n_features)
        y - вектор целевых значений (n_samples,)
        """
        # Добавляем столбец единиц для свободного члена
        X = np.column_stack([x, np.ones(x.shape[0])])
        
        # Вычисляем коэффициенты по нормальному уравнению
        XT = X.T
        XTX = np.dot(XT, X)
        XTX_inv = np.linalg.inv(XTX)
        XTy = np.dot(XT, y)
        self.coef_ = np.dot(XTX_inv, XTy)

    def predict(self, x: np.array) -> np.array:
        """
        Предсказание значений по обученной модели
        
        Параметры:
        x - матрица объект-признак (n_samples, n_features)
        
        Возвращает:
        Вектор предсказанных значений (n_samples,)
        """
        if self.coef_ is None:
            raise ValueError("Model is not fitted yet. Call fit() first.")
            
        # Добавляем столбец единиц для свободного члена
        X = np.column_stack([x, np.ones(x.shape[0])])
        return np.dot(X, self.coef_)

## Примечания

1. Не забывайте добавлять столбец единиц (он нужен для добавления смещений).
2. При использовании различных матричных операций не забывайте проверять соответствие размерностей матриц-операндов. Не забывайте делать транспонирование там, где это требуется
3. Обращайте внимание на названия полей (self.coef_), методов (fit, predict) и порядка их параметров в предлагаемом шаблоне (см. выше). Сдаваемый на проверку код должен соответствовать предлагаемому шаблону.


## Примеры входных и выходных данных

In [19]:
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split

X, y = load_diabetes(return_X_y=True) #Этот датасет уже предобработан
print(X[:5])

[[ 0.03807591  0.05068012  0.06169621  0.02187239 -0.0442235  -0.03482076
  -0.04340085 -0.00259226  0.01990749 -0.01764613]
 [-0.00188202 -0.04464164 -0.05147406 -0.02632753 -0.00844872 -0.01916334
   0.07441156 -0.03949338 -0.06833155 -0.09220405]
 [ 0.08529891  0.05068012  0.04445121 -0.00567042 -0.04559945 -0.03419447
  -0.03235593 -0.00259226  0.00286131 -0.02593034]
 [-0.08906294 -0.04464164 -0.01159501 -0.03665608  0.01219057  0.02499059
  -0.03603757  0.03430886  0.02268774 -0.00936191]
 [ 0.00538306 -0.04464164 -0.03638469  0.02187239  0.00393485  0.01559614
   0.00814208 -0.00259226 -0.03198764 -0.04664087]]


In [20]:
# Разбиение датасета на тренировочную и тестовую часть
X_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3, shuffle=True, random_state=42)

In [21]:
# Прогноз на тестовом датасете
predictions = LinReg.predict(x_test)
predictions

NameError: name 'LinReg' is not defined

In [None]:
# Оценка качества прогноза

from sklearn.metrics import r2_score

r2_score(y_test, predictions)

NameError: name 'predictions' is not defined