# Лабораторная работа №4. 
# Метод опорных векторов

Выполнила: Кузнецова Екатерина

## 1. Цель работы

Получить практические навыки работы с методом опорных векторов; познакомиться с возможностями интерактивной оболочки Jupyter Notebook и библиотеки scikit-learn.

## 2. Постановка задачи

1. Прочитать теоретическую часть
2. Описать структуру исходных данных для своего набора:

	a. общие характеристики массива данных: предметная область, количество записей

	b. входные параметры: названия и типы

	c. выходной класс: название и значения
3. Осуществить ряд экспериментов по классификации, используя SVM с различными параметрами (функции ядра и пр.), и занести результаты в сравнительную таблицу.
4. Выбрать оптимальные параметры и сформировать вывод о применимости метода опорных векторов к задаче классификации для своего набора данных.

## 3. Исходные данные

Датасет: http://archive.ics.uci.edu/ml/datasets/Zoo<br>
Предметная область: обитатели зоопарка


Количество записей: 101<br>
Количество атрибутов: 17


Атрибуты:

1. Название животного (строка, уникальный для каждого экземпляра)
2. Наличие волос (логический тип)
3. Наличие перьев (логический тип)
4. Яйца (логический тип)
5. Млекопитающий (логический тип)
6. Умеет летать (логический тип)
7. Водный (логический тип)
8. Хищник (логический тип)
9. Наличие зубов (логический тип) 
10. Наличие позвоночника (логический тип)
11. Дышит воздухом (логический тип)
12. Ядовитость (логический тип)
13. Наличие плавников (логический тип)
14. Количество ног (набор целочисленных значений: {0,2,4,5,6,8})
15. Наличие хвоста (логический тип)
16. Является домашним (логический тип)
17. Catsize (логический тип)
18. Тип (целочисленные значения в диапазоне [1,7])

## 4. Ход работы

Загружаем датасет

In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

train_data = pd.read_csv('zoo.data.csv', header=None).values
animal_attr = train_data[:, 1:-1]
animal_class = train_data[:, -1]
animal_class = animal_class.astype(np.int64, copy=False)
data_train, data_test, class_train, class_test = train_test_split(animal_attr, animal_class, test_size=0.4)

Осуществим ряд экспериментов по классификации, используя SVM с различными параметрами (функции ядра и пр.).

In [None]:
# Классификация и вычисление точности
def clf_acc(clf):
    clf.fit(data_train, class_train)
    accuracy = clf.score(data_test, class_test)
    return accuracy


clf_list = ['linear', 'rbf', 'poly', 'sigmoid']

Тестируем различные параметры:

1) Specifies the kernel type to be used in the algorithm. It must be one of ‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’ or a callable. { kernel : string, optional (default=’rbf’) }

In [7]:
from sklearn.svm import SVC

for kern in clf_list:
    print('Тип ядра: {}, Точность: {:.9f}'.format(kern, clf_acc(SVC(kernel=kern))))

Тип ядра: linear, Точность: 0.951219512
Тип ядра: rbf, Точность: 0.829268293
Тип ядра: poly, Точность: 0.829268293
Тип ядра: sigmoid, Точность: 0.658536585


Для датасета наиболее точной оказалась линейная функция ядра.
2-е и 3-е место поделили Полиномиальная и Радиальная базисная функция (83% точности)
Сигмоидная функция ядра показала наихудший результат.

2) Penalty parameter C of the error term. {C : float, optional (default=1.0)}

In [8]:
penalties = np.arange(0.1, 10, 0.5)
for value in penalties:
    print('Штраф за ошибку: {}, Точность: {:.9f}'.format(value, clf_acc(SVC(C=value))))

Штраф за ошибку: 0.1, Точность: 0.341463415
Штраф за ошибку: 0.6, Точность: 0.707317073
Штраф за ошибку: 1.1, Точность: 0.829268293
Штраф за ошибку: 1.6, Точность: 0.902439024
Штраф за ошибку: 2.1, Точность: 0.926829268
Штраф за ошибку: 2.6, Точность: 0.975609756
Штраф за ошибку: 3.1, Точность: 0.975609756
Штраф за ошибку: 3.6, Точность: 0.975609756
Штраф за ошибку: 4.1, Точность: 1.000000000
Штраф за ошибку: 4.6, Точность: 1.000000000
Штраф за ошибку: 5.1, Точность: 1.000000000
Штраф за ошибку: 5.6, Точность: 0.975609756
Штраф за ошибку: 6.1, Точность: 0.975609756
Штраф за ошибку: 6.6, Точность: 0.975609756
Штраф за ошибку: 7.1, Точность: 0.975609756
Штраф за ошибку: 7.6, Точность: 0.975609756
Штраф за ошибку: 8.1, Точность: 0.975609756
Штраф за ошибку: 8.6, Точность: 0.975609756
Штраф за ошибку: 9.1, Точность: 0.975609756
Штраф за ошибку: 9.6, Точность: 0.975609756


В ходе испытаний было замечено, что при penalty от 4 до 5, точность максимальна.

3) Degree of the polynomial kernel function (‘poly’). Ignored by all other kernels. {degree : int, optional (default=3)}

In [9]:
degrees = np.arange(1, 10, 1)
for value in degrees:
    print('Степень полинома: {}, Точность: {:.9f}'.format(value, clf_acc(SVC(kernel='poly', degree=value))))

Степень полинома: 1, Точность: 0.682926829
Степень полинома: 2, Точность: 0.804878049
Степень полинома: 3, Точность: 0.829268293
Степень полинома: 4, Точность: 0.829268293
Степень полинома: 5, Точность: 0.609756098
Степень полинома: 6, Точность: 0.609756098
Степень полинома: 7, Точность: 0.634146341
Степень полинома: 8, Точность: 0.634146341
Степень полинома: 9, Точность: 0.634146341


Самая высокая точность классификации получается при степенях 3 и 4

4) Kernel coefficient for ‘rbf’, ‘poly’ and ‘sigmoid’. {gamma : float, optional (default=’auto’)}

In [10]:
gammas = np.arange(0.01, 1, 0.05)
for kern in clf_list[1:]:
    print('Тип ядра: {}'.format(kern))
    for value in gammas:
        print('Коэффициент ядра: {:.3f}, Точность: {:.9f}'.format(value, clf_acc(SVC(kernel=kern, gamma=value))))

Тип ядра: rbf
Коэффициент ядра: 0.010, Точность: 0.682926829
Коэффициент ядра: 0.060, Точность: 0.829268293
Коэффициент ядра: 0.110, Точность: 0.902439024
Коэффициент ядра: 0.160, Точность: 0.951219512
Коэффициент ядра: 0.210, Точность: 0.951219512
Коэффициент ядра: 0.260, Точность: 0.975609756
Коэффициент ядра: 0.310, Точность: 0.951219512
Коэффициент ядра: 0.360, Точность: 0.951219512
Коэффициент ядра: 0.410, Точность: 0.951219512
Коэффициент ядра: 0.460, Точность: 0.926829268
Коэффициент ядра: 0.510, Точность: 0.926829268
Коэффициент ядра: 0.560, Точность: 0.926829268
Коэффициент ядра: 0.610, Точность: 0.926829268
Коэффициент ядра: 0.660, Точность: 0.902439024
Коэффициент ядра: 0.710, Точность: 0.878048780
Коэффициент ядра: 0.760, Точность: 0.853658537
Коэффициент ядра: 0.810, Точность: 0.853658537
Коэффициент ядра: 0.860, Точность: 0.829268293
Коэффициент ядра: 0.910, Точность: 0.829268293
Коэффициент ядра: 0.960, Точность: 0.756097561
Тип ядра: poly
Коэффициент ядра: 0.010, Точнос

Для полиномиального ядра при gamma>0.2 точность возрастает до показателей линейной функции (95%).
При использовании rbf и gamma=0,25 достигается максимальная точность (97,5%).
Для sigmoid с увеличением gamma точность сначала колеблется, а затем заметно снижается.

5) Independent term in kernel function. It is only significant in ‘poly’ and ‘sigmoid’. {coef0 : float, optional (default=0.0)}

In [11]:
coef0 = np.arange(0.1, 1, 0.1)
for kern in clf_list[2:]:
    print('Тип ядра: {}'.format(kern))
    for value in coef0:
        print('Независимый терм: {:.1f}, Точность: {:.9f}'.format(value, clf_acc(SVC(kernel=kern, coef0=value))))

Тип ядра: poly
Независимый терм: 0.1, Точность: 0.829268293
Независимый терм: 0.2, Точность: 0.829268293
Независимый терм: 0.3, Точность: 0.829268293
Независимый терм: 0.4, Точность: 0.853658537
Независимый терм: 0.5, Точность: 0.853658537
Независимый терм: 0.6, Точность: 0.853658537
Независимый терм: 0.7, Точность: 0.878048780
Независимый терм: 0.8, Точность: 0.878048780
Независимый терм: 0.9, Точность: 0.902439024
Тип ядра: sigmoid
Независимый терм: 0.1, Точность: 0.658536585
Независимый терм: 0.2, Точность: 0.634146341
Независимый терм: 0.3, Точность: 0.634146341
Независимый терм: 0.4, Точность: 0.634146341
Независимый терм: 0.5, Точность: 0.560975610
Независимый терм: 0.6, Точность: 0.463414634
Независимый терм: 0.7, Точность: 0.463414634
Независимый терм: 0.8, Точность: 0.487804878
Независимый терм: 0.9, Точность: 0.414634146


Самым эффективным из протестированных является параметр 0.9 для poly и 0.1 для sigmoid.

6) Whether to enable probability estimates. { probability : boolean, optional (default=False) }

In [14]:
probabilities = [False, True]
for value in probabilities:
    print('Оценка вероятности: {}, Точность: {:.9f}'.format(value, clf_acc(SVC(probability=value))))

Оценка вероятности: False, Точность: 0.829268293
Оценка вероятности: True, Точность: 0.829268293


7) Whether to use the shrinking heuristic. { shrinking : boolean, optional (default=True) }

In [12]:
shrinkings = [False, True]
for value in shrinkings:
    print('Shrinking heuristic: {}, Точность: {:.9f}'.format(value, clf_acc(SVC(probability=value))))

Shrinking heuristic: False, Точность: 0.829268293
Shrinking heuristic: True, Точность: 0.829268293


8) Tolerance for stopping criterion. { tol : float, optional (default=1e-3) }

In [13]:
tols = [1e-1, 1e-2, 1e-3, 1e-4]
for value in tols:
    print('tol: {}, Точность: {:.9f}'.format(value, clf_acc(SVC(tol=value))))

tol: 0.1, Точность: 0.829268293
tol: 0.01, Точность: 0.829268293
tol: 0.001, Точность: 0.829268293
tol: 0.0001, Точность: 0.829268293


Как видно, параметры probability, shrinkings и tol на точность никак не повлияли

Применим оптимальные параметры для SVM

In [31]:
print('Тип ядра: linear, Точность: {:.9f}'.format(clf_acc(SVC(C=4.5, kernel='linear'))))
print('Тип ядра: poly, Точность: {:.9f}'.format(clf_acc(SVC(C=4.5, kernel='poly', degree=3, gamma=0.5, coef0=0.9))))
print('Тип ядра: rbf, Точность: {:.9f}'.format(clf_acc(SVC(C=4.5, kernel='rbf'))))

Тип ядра: linear, Точность: 0.951219512
Тип ядра: poly, Точность: 0.951219512
Тип ядра: rbf, Точность: 1.000000000


 С помощью радиальной базисной функции и выявленных выше оптимальных параметров удалось добиться максимальной точности классификации.

## 5. Заключение

В ходе лабораторной работы был проведен ряд экспериментов по классификации наборов данных с помощью метода опорных векторов и определены оптимальные параметры для классификатора. 
Для датасета «Зоопарк» при настройке параметров радиально базисная функция превосходит по точности линейную функцию ядра (показавшую лучшие результаты в начале тестирования). Установив параметр C=4.5 мы получаем 100%-ную точность классификации. Следовательно, метод опорных векторов прекрасно подходит для классификации данного датасета.
