# Данные

In [56]:
from sklearn.datasets import make_regression
from sklearn.linear_model import LinearRegression

X, y = make_regression(n_features=100, n_samples=1000)
model_sk =  LinearRegression( )
model_sk.fit(X, y)
w = model_sk.coef_

X.shape, y.shape, w.shape

((1000, 100), (1000,), (100,))

# Собираем корпус под модель


In [57]:
from sklearn.base import RegressorMixin, BaseEstimator
import numpy as np

class AwesomeRegression(RegressorMixin, BaseEstimator):
    
    def __init__(self, tol=1e-6, lr=0.001):
        self.w = None
        self.tol = tol
        self.lr = lr
        self.iter = 0
        
    def mse_loss(self, X, y):
        return ((y - X@self.w).T)@(y - X@self.w)/y.size

    def grad_loss(self, X, y):
        return -2*X.T@(y - X@self.w)/y.size
           
    def fit(self, X, y):
        self.w = np.random.normal(size=(X.shape[1]))
        
        new_w = self.w - self.lr*self.grad_loss(X, y)
        
        while np.any(abs(new_w - self.w) > self.tol):
            self.iter += 1
            self.w = new_w
            new_w = self.w - self.lr*self.grad_loss(X, y)

    def fit_formula(X, y):
        self.w = np.linalg.inv(X.T@X)@(X.T@y)
     
    def predict(self, X):
        return X@self.w

In [58]:
model = AwesomeRegression()
model.fit(X, y)

model.iter

9454

In [65]:
np.linalg.norm(model_sk.coef_ - model.w, ord=2)

0.0028147674322374604

## Задание 1 (добить линейную регрессию): 

__а)__ Добавить в обучение параметр `num_iter`, чтобы не возникало такого, что из-за неадекватно подобранного параметра `tol` цикл работает вечно. Установить параметр по дефолту в `1000` шагов.

__б)__ Добавить в модель возможность вводить l1 и l2 регуляризаторы (elstic_net), для этого придется выписать на бумажке фукнцию потерь и найти её дифференциал. Для l2 проблем быть не должно, для l1 придется быть поосторожнее с нулём. 

__в)__ Реализовать вместо текущего обычного градиентного спуска стохастический градиентный спуск по мини-батчам. Надо на каждой итерации отбирать $m$ случайных наблюдений и делать шаг градиентного спуска по ним. Параметр $m$ задаётся при объявлении модели.

__г)__ Сейчас обучение идёт с помощью функции потерь MSE. Хочется, чтобы была возможность выбора. 

- Добавьте такую возможность в виде функций потерь MAE
- Добавьте MAPE

__HINT:__ подсказка как добавить MAPE прямо через MAE: https://yadi.sk/i/WpIWG_PYeQkLVQ

- Добавьте функцию потерь Хубера

__HINT:__ про неё можно почитать либо в [главе про функции потерь Дьяконова](https://alexanderdyakonov.files.wordpress.com/2018/10/book_08_metrics_12_blog1.pdf) либо в [первой главе Магнуса Катышева Персецкого.](https://yadi.sk/i/K8P9rL1eDK0Dqg)

Склёрновская реализация такой модели [тут.](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.HuberRegressor.html)

- Придумайте свою функцию потерь с логарифмами такую, чтобы она была робастной к выбросам. 


__д)__ Протестировать модель на сгенерированном датасете. Сравнить результаты с пакетной реализацией. Подумать каких ещё приблуд можно засунуть внутрь модели. 

## Задание 2 (логистическая регрессия): 

Нужно реализовать аналогичный класс для обучения логистической регрессии. Должен быть точно такой же интерфейс, но другая модель. 

- В качестве функции потерь возьмите `logloss`. Добавьте опциональные ругуляризаторы, модель учите стохастическим градиентным спуском. Все производные найдите руками с помощью матричного диффериенцирования. Сравните работу модели с пакетной реализацией и возрадуйтесь.