# Домашнее задание: LARS и варианты реализации многоклассовой классификации

## Задание 1: Реализация регрессии с наименьшими углами (LARS)
Регрессия с наименьшими углами (LARS) — это алгоритм регрессии, который выбирает признаки пошагово, что делает его подходящим для задач с большим количеством признаков. Цель — найти подмножество признаков, которые наилучшим образом объясняют целевую переменную.

- LARS начинается с нуля для всех коэффициентов.

- Алгоритм находит признак, наиболее коррелирующий с откликом, и обновляет коэффициент этого признака до его значения по методу наименьших квадратов, пока не будут включены все признаки или не выполнено условие остановки.

Тут можно прочитать подробнее про алгоритм работы https://www.geeksforgeeks.org/least-angle-regression-lars/

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import r2_score
from sklearn.linear_model import Lars

class LARS:
    def __init__(self):
        self.coefs_ = None
        self.mean_X_ = None
        self.mean_y_ = None
        self.std_X_ = None

    def fit(self, X, y):
        X = X.copy().astype(np.float64)
        y = y.copy().astype(np.float64)
        n_samples, n_features = X.shape
        self.coefs_ = np.zeros(n_features)

        # Center data
        self.mean_X_ = np.mean(X, axis=0)
        self.mean_y_ = np.mean(y)
        X_centered = X - self.mean_X_
        y_centered = y - self.mean_y_

        # Standardize features
        self.std_X_ = np.std(X_centered, axis=0)
        self.std_X_[self.std_X_ == 0] = 1.0
        X_scaled = X_centered / self.std_X_

        active_set = []
        inactive_set = list(range(n_features))
        current_pred = np.zeros(n_samples)
        correlation_matrix = np.dot(X_scaled.T, X_scaled)
        max_steps = min(n_features, 500)

        for _ in range(max_steps):
            residuals = y_centered - current_pred
            correlations = np.dot(X_scaled.T, residuals)
            max_corr = np.max(np.abs(correlations))

            if max_corr < 1e-10:
                break

            next_feature = np.argmax(np.abs(correlations))
            if next_feature not in active_set:
                active_set.append(next_feature)
                inactive_set.remove(next_feature)

            active_indices = np.array(active_set)
            corr_signs = np.sign(correlations[active_indices])

            G_active = correlation_matrix[np.ix_(active_indices, active_indices)]
            G_inv = np.linalg.inv(G_active + 1e-10 * np.eye(len(active_indices)))
            direction_vector = np.dot(G_inv, corr_signs)
            direction_norm = 1 / np.sqrt(np.sum(corr_signs * direction_vector))
            step_direction = direction_norm * direction_vector
            update_vector = np.dot(X_scaled[:, active_indices], step_direction)

            step_sizes = []
            for idx in inactive_set:
                corr_diff_plus = (max_corr - correlations[idx]) / (direction_norm - update_vector[idx]) if direction_norm != update_vector[idx] else np.inf
                corr_diff_minus = (max_corr + correlations[idx]) / (direction_norm + update_vector[idx]) if direction_norm != -update_vector[idx] else np.inf
                step_sizes.extend([corr_diff_plus, corr_diff_minus])

            gamma = min([s for s in step_sizes if s > 1e-10], default=max_corr / direction_norm)

            current_pred += gamma * update_vector
            self.coefs_[active_indices] += gamma * step_direction

        return self

    def predict(self, X):
        X = X.copy().astype(np.float64)
        X_centered = X - self.mean_X_
        X_scaled = X_centered / self.std_X_
        return np.dot(X_scaled, self.coefs_) + self.mean_y_

X_train = np.array([[1], [2], [3], [4], [5]])
y_train = np.array([2, 3, 5, 7, 11])
model = LARS()
model.fit(X_train, y_train)
preds = model.predict(X_train)

In [None]:
# Проверки для проверки предсказаний
assert preds.shape == (5,), "Предсказания должны соответствовать количеству образцов"
assert r2_score(y_train, preds) > 0.8, "R2 должна быть выше 0.8"

In [None]:
# Сравнение с реализацией из sklearn
sklearn_model = Lars()
sklearn_model.fit(X_train, y_train)
sklearn_preds = sklearn_model.predict(X_train)

assert np.allclose(preds, sklearn_preds, rtol=1e-03), "Предсказания должны совпадать с реализацией sklearn"

In [None]:
# plt.scatter(X_train, y_train, color='blue', label="Истинные значения")
# plt.plot(X_train, preds, color='red', label="Предсказанные значения (LARS")
# plt.plot(X_train, sklearn_preds, color='green', linestyle='dashed', label="Предсказанные значения (sklearn)")
# plt.legend()
# plt.title("Регрессия LARS: Истинные vs Предсказанные значения")
# plt.xlabel("X")
# plt.ylabel("y")
# plt.show()

## Задание 2: Классификация Один-против-Всех и Все-против-Всех с логистической регрессией
В многоклассовой классификации два популярных подхода:

- Один-против-Всех (OvA): Для каждого класса обучается отдельный классификатор, который отделяет этот класс от всех остальных.
- Все-против-Всех (AvA): Обучается классификатор для каждой пары классов.

https://education.yandex.ru/handbook/ml/article/linear-models#:~:text=%D0%9C%D0%BD%D0%BE%D0%B3%D0%BE%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%BE%D0%B2%D0%B0%D1%8F%20%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F-,%D0%9C%D0%BD%D0%BE%D0%B3%D0%BE%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%BE%D0%B2%D0%B0%D1%8F%20%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F,-%D0%92%20%D1%8D%D1%82%D0%BE%D0%BC%20%D1%80%D0%B0%D0%B7%D0%B4%D0%B5%D0%BB%D0%B5

In [None]:
def plot_ova_classifier(classifier, X, y):
    plt.figure(figsize=(10, 6))
    colors = ['blue', 'green', 'red']
    for i in np.unique(y):
        plt.scatter(X[y == i][:, 0], X[y == i][:, 1], color=colors[i], label=f"Класс {i}")
    
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.01),
                         np.arange(y_min, y_max, 0.01))
    
    # Z_probabilities = classifier.predict_proba(np.c_[xx.ravel(), yy.ravel()])
    # Z = np.max(Z_probabilities, axis=1).reshape(xx.shape)
    
    Z = classifier.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    
    plt.contourf(xx, yy, Z, alpha=0.7, cmap='coolwarm')
    
    # plt.scatter(X[:, 0], X[:, 1], color='black')
    plt.title("One-vs-All")
    plt.xlabel("Признак 1")
    plt.ylabel("Признак 2")
    # plt.colorbar(label="Вероятность")
    plt.legend()
    plt.show()


def plot_ava_classifier(classifier, X, y):
    plt.figure(figsize=(10, 6))
    colors = ['blue', 'green', 'red']
    for i in np.unique(y):
        plt.scatter(X[y == i][:, 0], X[y == i][:, 1], color=colors[i], label=f"Класс {i}")
    
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.01),
                         np.arange(y_min, y_max, 0.01))
    
    # Z_probabilities = classifier.predict_proba(np.c_[xx.ravel(), yy.ravel()])
    # Z = np.max(Z_probabilities, axis=1).reshape(xx.shape)
    Z = classifier.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    
    plt.contourf(xx, yy, Z, alpha=0.7, cmap='coolwarm')
    
    # plt.scatter(X[:, 0], X[:, 1], color='black')
    plt.title("All-vs-All")
    plt.xlabel("Признак 1")
    plt.ylabel("Признак 2")
    # plt.colorbar(label="Вероятность")
    plt.legend()
    plt.show()

In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, confusion_matrix
import seaborn as sns

class OneVsAllClassifier:
    def __init__(self):
        self.models = []
        self.class_labels_ = None

    def fit(self, X, y):
        self.class_labels_ = np.unique(y)
        self.models = []

        for label in self.class_labels_:
            binary_y = (y == label).astype(int)
            model = LogisticRegression()
            model.fit(X, binary_y)
            self.models.append(model)

    def predict(self, X):
        scores = np.array([model.decision_function(X) for model in self.models]).T
        return self.class_labels_[np.argmax(scores, axis=1)]

X_test = np.array([[1, 2], [4, 5], [7, 8], [2, 3], [5, 6]])
y_test = np.array([0, 1, 2, 0, 1])
ova_classifier = OneVsAllClassifier()
ova_classifier.fit(X_test, y_test)
ova_preds = ova_classifier.predict(X_test)

assert len(ova_preds) == len(X_test), "Предсказания должны соответствовать количеству образцов"
assert accuracy_score(y_test, ova_preds) > 0.8, "Точность должна быть выше 0.8"

In [None]:
# plot_ova_classifier(ova_classifier, X_test, y_test)

In [None]:
class AllVsAllClassifier:
    def __init__(self):
        self.pairwise_models = {}
        self.class_labels_ = None

    def fit(self, X, y):
        self.class_labels_ = np.unique(y)
        self.pairwise_models = {}
        from itertools import combinations
        for class1, class2 in combinations(self.class_labels_, 2):
            mask = (y == class1) | (y == class2)
            X_pair = X[mask]
            y_pair = (y[mask] == class2).astype(int)
            model = LogisticRegression()
            model.fit(X_pair, y_pair)
            self.pairwise_models[(class1, class2)] = model

    def predict(self, X):
        votes = np.zeros((X.shape[0], len(self.class_labels_)))
        for (class1, class2), model in self.pairwise_models.items():
            preds = model.predict(X)
            class1_idx = np.where(self.class_labels_ == class1)[0][0]
            class2_idx = np.where(self.class_labels_ == class2)[0][0]
            votes[preds == 0, class1_idx] += 1
            votes[preds == 1, class2_idx] += 1
        return self.class_labels_[np.argmax(votes, axis=1)]

ava_classifier = AllVsAllClassifier()
ava_classifier.fit(X_test, y_test)
ava_preds = ava_classifier.predict(X_test)

assert len(ava_preds) == len(X_test), "Предсказания должны соответствовать количеству образцов"
assert accuracy_score(y_test, ava_preds) > 0.8, "Точность должна быть выше 0.8"

In [None]:
# plot_ava_classifier(ava_classifier, X_test, y_test)