# Метод опорных векторов с линейным ядром (классификация)

Используем реализацию классификатора на основе [линейного метода опорных векторов](https://scikit-learn.org/stable/modules/svm.html#) в `scikit-learn`: [LinearSVC](https://scikit-learn.org/stable/modules/generated/sklearn.svm.LinearSVC.html#sklearn.svm.LinearSVC)

In [None]:
import numpy as np
import pandas as pd

from sklearn.svm import LinearSVC
from sklearn.model_selection import train_test_split
# базовые метрики классификации
from sklearn.metrics import accuracy_score, f1_score, auc, class_likelihood_ratios
# ROC-curve, AUC
from sklearn.metrics import roc_curve, roc_auc_score, RocCurveDisplay
# Precision-recall
from sklearn.metrics import precision_recall_curve, average_precision_score, PrecisionRecallDisplay

import matplotlib.pyplot as plt

# Не показывать FutureWarnings
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)

## Импорт и подготовка данных

In [None]:
df = pd.read_csv('./datasets/loanapp.csv')
df.shape

In [None]:
df = df.dropna()
df.shape

In [None]:
y = df['approve']
X = df.drop(columns='approve')
# Разобьём выборку на обучающую и тестовую 80:20
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=0)

## Инициализация и обучение модели 

In [None]:
# инициализируем и обучим классификатор
clf = LinearSVC(penalty='l2', C=1.0)
clf.fit(X_train, y_train)

параметры/веса обученной модели

In [None]:
# веса при признаках
clf.coef_

In [None]:
# константа w0
clf.intercept_

## Прогнозирование (на тестовой выборке)

In [None]:
# прогноз на тестовой выборке
clf.predict(X_test)

## Метрики качестве прогнозов на тестовой выборке

In [None]:
# доля правильных прогнозов на тестовой выборке
clf.score(X_test, y_test)

In [None]:
# альтернативно: метод accuracy_score
y_pred = clf.predict(X_test)
accuracy_score(y_test, y_pred)

Метрика 

$$
	F1=\frac{TP}{2TP+FP+FN}
$$

In [None]:
f1_score(y_test, y_pred)

ROC-кривая и мера AUC

In [None]:
RocCurveDisplay.from_estimator(clf, X_test, y_test)
plt.show()

Кривая Precision-Recall

In [None]:
PrecisionRecallDisplay.from_estimator(clf, X_test, y_test)
plt.show()

## Сравнение нескольких классификаторов

In [None]:
# Другой классификатор: SVM со штрафом l2 и C=0.5
clf2 = LinearSVC(penalty='l2', C=0.5)
clf2.fit(X_train, y_train)

# Другой классификатор: SVM со штрафом l2 и C=2
clf3 = LinearSVC(penalty='l2', C=2)
clf3.fit(X_train, y_train)

# Другой классификатор: SVM со штрафом l2 и C=1 и loss='hinge'
clf4 = LinearSVC(penalty='l2', C=1, loss='hinge')
clf4.fit(X_train, y_train)

In [None]:
fig, axs = plt.subplots(nrows=1, ncols=2, figsize=(12, 8))

RocCurveDisplay.from_estimator(clf, X_test, y_test, ax=axs[0], name='l2, C=1')
RocCurveDisplay.from_estimator(clf2, X_test, y_test, ax=axs[0], name='l2, C=0.5')
RocCurveDisplay.from_estimator(clf3, X_test, y_test, ax=axs[0], name='l2, C=2')
RocCurveDisplay.from_estimator(clf4, X_test, y_test, ax=axs[0], name='l2, C=1, hinge')

PrecisionRecallDisplay.from_estimator(clf, X_test, y_test, ax=axs[1], name='l2, C=1')
PrecisionRecallDisplay.from_estimator(clf2, X_test, y_test, ax=axs[1], name='l2, C=0.5')
PrecisionRecallDisplay.from_estimator(clf3, X_test, y_test, ax=axs[1], name='l2, C=2')
PrecisionRecallDisplay.from_estimator(clf4, X_test, y_test, ax=axs[1], name='l2, C=1, hinge')

axs[0].set_title('ROC-curves')
axs[1].set_title('PR-curves')

plt.show()