# SVM

## Часть 1, SVM для линейно разделимых и неразделимых датасетов, проверка результатов на ирисах.

Реализованы классификаторы для линейно разделимой выборки с двумя классами (SVM_Linear), с произвольным количеством классов (SVM_Linear_Multiclass) и неразделимой выборки с двумя классами (SVM_Nonlinear) и произвольным количеством классов (SVM_Nonlinear_Multiclass). Код в файле svm.py.

Результаты кросс-валидации и сравнение с реализацией из sklearn (два класса ирисов объединены, используется бинарная классификация):

In [1]:
import warnings
with warnings.catch_warnings():
    warnings.filterwarnings("ignore", category=DeprecationWarning)
    from sklearn.svm import SVC
    from import_labs import import_labs
    from sklearn import datasets
    from svm import SVM_Linear as SVM_L, SVM_Nonlinear as SVM_N
    from numpy import dot

import_labs(["task3/"])
from CV import k_fold

iris = datasets.load_iris()
iris_x = []
iris_y = []
for i in range(150):
    if iris.target[i] == 1:
        iris_x.append(iris.data[i])
        iris_y.append(1)
    else:
        iris_x.append(iris.data[i])
        iris_y.append(-1)

def kernel(x, y):
    return (1 + dot(x, y)) ** 2

svm_l = SVM_L()
svm_n = SVM_N(kernel, 1000)
svm_sk = SVC()
svm_sk.fit(iris_x, iris_y)

print("CV result for Linear SVM: %s" % k_fold(5, iris_x, iris_y, svm_l))
print("CV result for Nonlinear SVM: %s" % k_fold(5, iris_x, iris_y, svm_n))
print("CV result for sklearn SVM: %s" % svm_sk.score(iris_x, iris_y))

CV result for Linear SVM: 0.8733333333333334
CV result for Nonlinear SVM: 0.6
CV result for sklearn SVM: 0.993333333333


Как видно, kernel trick с ядром K(x, y) = (1 + (x, y))^3 существенно ухудшил результаты, так как выборка изначально была линейно разделима.

Результаты кросс-валидации и сравнение с реализацией из sklearn (классы не изменялись, используется стратегия "один против всех"):

In [3]:
import warnings
with warnings.catch_warnings():
    warnings.filterwarnings("ignore", category=DeprecationWarning)
    from sklearn.svm import SVC
    from import_labs import import_labs
    from sklearn import datasets
    from svm import SVM_Linear_Multiclass as SVM_LM, SVM_Nonlinear_Multiclass as SVM_NM
    from numpy import dot

import_labs(["task3/"])
from CV import k_fold

iris = datasets.load_iris()
iris_x = iris.data
iris_y = iris.target

def kernel(x, y):
    return (1 + dot(x, y)) ** 2

svm_lm = SVM_LM()
svm_nm = SVM_NM(kernel, 1000)
svm_sk = SVC()
svm_sk.fit(iris_x, iris_y)

print("CV result for Linear SVM: %s" % k_fold(5, iris_x, iris_y, svm_lm))
print("CV result for Nonlinear SVM: %s" % k_fold(5, iris_x, iris_y, svm_nm))
print("CV result for sklearn SVM: %s" % svm_sk.score(iris_x, iris_y))

CV result for Linear SVM: 0.3333333333333333
CV result for Nonlinear SVM: 0.3333333333333333
CV result for sklearn SVM: 0.986666666667


## Часть 2, grid search параметра С

In [2]:
import warnings
with warnings.catch_warnings():
    warnings.filterwarnings("ignore", category=DeprecationWarning)
    from sklearn.svm import SVC
    from import_labs import import_labs
    from sklearn import datasets
    from svm import SVM_Nonlinear_Multiclass as SVM_NM
    from numpy import dot

import_labs(["task3/"])
from CV import k_fold

iris = datasets.load_iris()
iris_x = iris.data
iris_y = iris.target

def kernel(x, y):
    return (dot(x, y)) ** 2

ans = 0
best_c = 0
for i in range(1, 100):
    svm_nm = SVM_NM(kernel, i / 100)
    val = k_fold(5, iris_x, iris_y, svm_nm)
    if val > ans:
        ans = val
        best_c = i / 100
print("Best c: %s" % best_c)

Best c: 0.01


Как видно, лучшим стал с = 0.01

## Часть 3, анализ алгоритма

Время работы алгоритма, вообще говоря, сильно зависит от алгоритма поиска минимума квадратичной формы, но если принять его на M(f), то асимптотика будет O(KN^2 * M(f)), где K — количество классов. Алгоритм использует O(KN) памяти. Посмотрим, как SVM справится с задачей MNIST.

In [None]:
import warnings
with warnings.catch_warnings():
    warnings.filterwarnings("ignore", category=DeprecationWarning)
    from sklearn.svm import SVC
    from import_labs import import_labs
    from main_t5 import *
    from numpy import reshape

svm_sk = SVC()
svm_sk.fit(reshape(train_images, (60000, 784)), train_labels)
print("Learning completed.")
print("Score for shifted 1 px up image: %s" % svm_sk.score(reshape(img_shift_x0y1, (10000, 784)), test_labels))
print("Score for shifted 5 px up image: %s" % svm_sk.score(reshape(img_shift_x0y5, (10000, 784)), test_labels))
print("Score for shifted 1 px left image: %s" % svm_sk.score(reshape(img_shift_x1y0, (10000, 784)), test_labels))
print("Score for shifted 5 px left image: %s" % svm_sk.score(reshape(img_shift_x5y0, (10000, 784)), test_labels))
print("Score for shifted rotated image: %s" % svm_sk.score(reshape(img_rotate, (10000, 784)), test_labels))