Популярность метода опорных векторов (support-vector machines, SVM) сильно выросла за последние годы благодаря его высокой ошибкоустойчивости при классификации, в том числе в пространствах высокой размерности. Как ни удивительно, SVM работает, даже если количество измерений (признаков) превышает количество элементов данных, что необычно для алгоритмов классификации из-за так называемого проклятия размерности: при росте размерности данные становятся очень разреженными, а это усложняет поиск закономерностей в наборе данных. Понимание основных идей SVM — необходимый шаг становления опытного специалиста по машинному обучению.
Как функционируют алгоритмы классификации? На основе обучающих данных они ищут границу решений, отделяющую данные из одного класса от данных из другого
Пусть нам нужно создать рекомендательную систему для студентов начальных курсов университета.состоящие из пользователей, классифицированных по их способностям в двух сферах: логика и творчество. Одни студенты отличаются сильными логическими способностями и относительно низким уровнем творческих; другие — выраженными творческими способностями и относительно низким уровнем логических. Первую группу мы обозначили как специалисты по computer science, а вторую — представители искусства
Для классификации новых пользователей модель машинного обучения должна отыскать границу решений, разделяющую специалистов по computer science и представителей искусства. В общих чертах будем классифицировать пользователей в зависимости от того, по какую сторону границы решений они попадают. В нашем примере мы классифицируем пользователей слева от границы решений как специалистов по computer science, а справа — как представителей искусства
В двумерном пространстве роль границы решений может играть либо прямая, либо кривая (более высокого порядка). В первом случае классификатор называется линейным (linear classifier), а во втором — нелинейным (nonlinear classifier). В этом разделе мы будем рассматривать только линейные классификаторы.
Метод опорных векторов дает уникальный и очень красивый ответ на этот вопрос. Вполне логично, что лучшая граница решений — та, которая обеспечивает максимальный «запас прочности». Другими словами, метод опорных векторов максимизирует расстояние между границей решений и ближайшими точками данных. Цель состоит в минимизации погрешности для новых точек, близких к границе решений.

In [4]:
import numpy as np
from sklearn import svm 

## Данные: оценки студентов по (математика, языки, творческие
## способности) --> предмет для изучения
X = np.array([[9, 5, 6, "computer science"],
[10, 1, 2, "computer science"],
[1, 8, 1, "literature"],
[4, 9, 3, "literature"],
[0, 1, 10, "art"],
[5, 7, 9, "art"]])

svm = svm.SVC().fit(X[:, :-1], X[:, -1])
# сначала подаем целочисленные данные[:, :-1], 
# после связываем с переменными [:, -1]
# супер пупер удобная штука эти ваши срезы
stu_0 = svm.predict([[3, 3, 6]])
print(stu_0)

stu_1 = svm.predict([[8, 1, 1]])
print(stu_1)


['computer science' 'computer science' 'literature' 'literature' 'art'
 'art']
['art']
['computer science']


векторов на Python. В массиве NumPy содержатся маркированные обучающие данные, по одной строке на пользователя и одному столбцу на признак (способности студентов к математике, языкам и творческие способности). Последний столбец — метка (класс).
Поскольку данные у нас — трехмерные, метод опорных векторов разделяет их с помощью двумерных плоскостей (линейный разделитель), а не одномерных прямых. Как вы, наверное, видите, можно также разделять три класса, а не два, как в предыдущих примерах.
Сам однострочник очень прост: сначала мы создаем модель с помощью конструктора класса svm.SVC (SVC расшифровывается как support-vector classification — классификация с помощью опорных векторов). Далее мы вызываем функцию fit(), производящую обучение на основе наших маркированных обучающих данных.
В части «Результат» фрагмента кода мы вызываем функцию predict(), передавая ей новые наблюдения. Поскольку для student_0 указано
математика = 3, языки = 3 и творческие способности = 6, то метод опорных векторов предсказывает, что способностям студента соответствует метка art. Аналогично, для student_1 с математика = 8, языки = 1 и творческие способности = 1 метод опорных векторов предсказывает, что способностям студента соответствует метка computer science.

Резюмируя: SVM демонстрирует хорошие результаты даже в многомерных пространствах при количестве признаков, превышающем количество обучающих векторов данных. Идея максимизации «запаса прочности» вполне интуитивна и демонстрирует хорошие результаты даже при классификации граничных случаев (boundary cases) — векторов, попадающих в рамки этого «запаса прочности». 