# Домашнее задание №1. Softmax Regression.

Нужно реализовать много-классовую логистическую регрессию с помощью softmax c поддержкой L1/L2 регуляризации. После этого сравнить с sklearn реализацией [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html)
 с настройкой **multinomial**.

## Задание №1 (10 баллов)

Реализовать класс SoftMaxRegression и его методы - init, fit, predict c возможностью конфигурации
регуляризации. 
Для оптимизации функции ошибки воспользоваться методом **стохастического градиентного спуска**. 

Остальные функции реализовать на ваше усмотрение. 

In [1]:
class SoftMaxRegression:
    def __init__(self, n_epochs=200, lr=0.9, regularization_type=None):
        self.n_epochs = n_epochs
        self.lr = lr
        self.regularization_type = regularization_type
        
    def softmax(self, x):
        e_x = np.exp(x - np.max(x, axis=1, keepdims=True)) 
        return e_x / np.sum(e_x, axis=1, keepdims=True)

    def onehot(self, X):
        n_samples = np.shape(X)[0]
        categories = np.unique(X)
        mapping = {}
        for id, category in enumerate(categories):
            mapping[category] = id
        ohe_array = np.zeros((n_samples, len(categories)))
        for row_number, instance in enumerate(X):
            ohe_array[row_number, mapping[instance]] = 1
        return ohe_array

    def fit(self, X, y):
        """функция обучения модели"""
        # CODE HERE
        X = np.insert(X, 0, 1, axis=1)
        n_features = X.shape[1]
        n_classes = len(np.unique(y))

        self.weights = np.random.random((n_features, n_classes))

        if self.regularization_type == 'l1':
            grad_penalty = 0.5 * np.sign(self.weights)
        elif self.regularization_type == 'l2':
            grad_penalty = np.asarray(0.5) * self.weights
        else:
            grad_penalty = 0

        beta = 0.9
        step = 0.2
        
        for epoch in range(self.n_epochs):
            
            loss_list = []
            acc_list = []
            m = len(X)
            batch_size = 30000
            n_batch = ceil(m / batch_size)   
            
            for j in range(n_batch):
                X_batch = X[j * batch_size:min((j + 1) * batch_size, m)]
                y_batch = y[j * batch_size:min((j + 1) * batch_size, m)]             
                y_preds = self.softmax(X_batch.dot(self.weights))
                grad = X_batch.T.dot(y_preds - self.onehot(y_batch)) + grad_penalty
                step = beta*step + self.lr * grad
                self.weights -= step
        
            #loss = (1/X_batch.shape[0])*np.sum(-np.log(self.softmax(X_batch.dot(self.coef_))[range(y_batch.shape[0]), y_batch]))
            #print("Epoch: {} , Loss: {}".format(epoch, loss))
            #current_acc = accuracy_score()
        return self
    
    def predict(self, X):
        """функция предсказания"""
        # CODE HERE
        X = np.insert(X, 0, 1, axis=1)
        probas = self.softmax(X.dot(self.weights))
        return np.argmax(probas, axis=1)

In [2]:
def accuracy_score(y_pred, y_true):
        accuracy = np.mean(y_pred == y_true)
        return accuracy

In [3]:
class StandardScaler:
 
    def fit(self, X):
        self.mean = np.mean(X, axis=0)
        self.var = np.var(X, axis=0)

    def transform(self, X):
        X_scal = (X - self.mean) / np.sqrt(self.var)
        return X_scal

    def fit_transform(self, X):
        self.fit(X)
        return self.transform(X)

## Задание №2 (10 баллов)

Загрузите любой датасет много-классовой классификации, сделайте предобработку, разбейте на тренировочную и тестовую выборку  и оцените работу вашего алгоритма. Предпочтительно использовать метрику точности(accuracy) для оценки алгоритма. 

В рамках оценки, воспользуйтесь sklearn реализацией много-классовой логистической регрессии. **Проверьте что ваши метрики совпадают(+/-1-2%) на моделях без регуляризации, с L1 и с L2 регуляризации.**

#### Работа с датасетом (1 балл)

Загрузите выбранный датасет много-классовой классификации, обработайте его, сделайте разбиение на тренировочную и тестовую выборку. Датасеты для классификации можно взять например [**отсюда**](https://archive.ics.uci.edu/ml/datasets.php?format=&task=cla&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=table).

In [10]:
### CODE HERE
import numpy as np
from keras.datasets import mnist
import matplotlib.pyplot as plt
import pandas as pd
from math import *


(X_train, y_train), (X_test, y_test) = mnist.load_data()
X_train = X_train.reshape(60000, 28*28)
X_test = X_test.reshape(10000, 28*28)

#### Обучение модели и сравнение с sklearn имплементацией

Обучите 3 модели - обычную, с L1 реализацией, с L2 реализацией и сравните с аналогичными sklearn имплементациями много-классовой логистической регрессии. 

В рамках обучения модели требуется визуализировать:

1) График падания значений ошибки на тренировочной выборке в зависимости от итерации.
2) График падания значений ошибки на валидационной выборке в зависимости от итерации.
3) График роста метрики точности в зависимости от итерации.

<span style="color:red">**Модель считается успешно реализованной, если целевая метрика совпадает с sklearn реализацией. Если разница большая(более 2%), баллы за ДЗ не проставляются.**</span>


#### Обучение обычной модели и сравнение с __LogisticRegression(penalty = 'none', multi_class='multinomial')__ (3 балла)

In [5]:
### CODE HERE
scaler = StandardScaler()
scaler.fit_transform(X_train)
scaler.transform(X_test)

clf_0 = SoftMaxRegression(n_epochs=100, lr=0.9, regularization_type=None)
clf_0.fit(X_train, y_train)
y_preds = clf_0.predict(X_test)

my_score = accuracy_score(y_test, y_preds)


from sklearn.linear_model import LogisticRegression

sklearn_logreg = LogisticRegression(penalty='none', multi_class='multinomial')
sklearn_logreg.fit(X_train, y_train)
#accuracy_score(sklearn_logreg.predict(X_test), y_test)


print("my score: {},\nsklearn score: {}".format(my_score, accuracy_score(sklearn_logreg.predict(X_test), y_test)))

  X_scal = (X - self.mean) / np.sqrt(self.var)
  X_scal = (X - self.mean) / np.sqrt(self.var)


my score: 0.9128,
sklearn score: 0.9243


STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


#### Обучение модели c L1 регуляризацией и сравнение с __LogisticRegression(penalty = 'l1', multi_class='multinomial')__ (3 балла)

In [11]:
### CODE HERE
clf_1 = SoftMaxRegression(n_epochs=100, lr=0.9, regularization_type='l1')
clf_1.fit(X_train, y_train)
y_preds = clf_1.predict(X_test)

my_score = accuracy_score(y_test, y_preds)
print(f"my score {my_score}")

# from sklearn.linear_model import LogisticRegression

# sklearn_logreg = LogisticRegression(penalty='l1', multi_class='multinomial')
# sklearn_logreg.fit(X_train, y_train)
# #accuracy_score(sklearn_logreg.predict(X_test), y_test)


# print("my score: {} ,\nsklearn score: {}".format(my_score, accuracy_score(sklearn_logreg.predict(X_test), y_test)))

my score 0.9084


In [8]:
from sklearn.linear_model import LogisticRegression

sklearn_logreg = LogisticRegression(penalty='l1', multi_class='multinomial', solver='saga')
sklearn_logreg.fit(X_train, y_train)
#accuracy_score(sklearn_logreg.predict(X_test), y_test)


print("my score: {} ,\nsklearn score: {}".format(my_score, accuracy_score(sklearn_logreg.predict(X_test), y_test)))

my score: 0.9115 ,
sklearn score: 0.9257




#### Обучение модели c L2 регуляризацией и сравнение с __LogisticRegression(penalty = 'l2', multi_class='multinomial')__ (3 балла)

In [9]:
### CODE HERE
clf_2 = SoftMaxRegression(n_epochs=100, lr=0.9, regularization_type='l2')
clf_2.fit(X_train, y_train)
y_preds = clf_2.predict(X_test)

my_score = accuracy_score(y_test, y_preds)


from sklearn.linear_model import LogisticRegression

sklearn_logreg = LogisticRegression(penalty='l2', multi_class='multinomial')
sklearn_logreg.fit(X_train, y_train)
#accuracy_score(sklearn_logreg.predict(X_test), y_test)


print("my score: {},\nsklearn score: {}".format(my_score, accuracy_score(sklearn_logreg.predict(X_test), y_test)))

my score: 0.9131,
sklearn score: 0.9255


STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
