# 导入所需模块

In [2]:
import cv2
import numpy as np
import matplotlib.pyplot as plt


---
支持向量机（Support Vector Machine, SVM）是一种二分类模型，目标是寻找一个标准（称为超平面）对样本数据进行分割，分割的原则是确保分类最优化（类别之间的间隔最大）。当数据集较小时，使用支持向量机进行分类非常有效。支持向量机是最好的现成分类器之一，这里所谓的“现成”是指分类器不加修改即可直接使用。
# 理论基础
## 分类
## 分类器
离分类器最近的那些点叫作支持向量（support vector）。正是这些支持向量，决定了分类器所在的位置。

## 将不可分变为可分
## 概念总结
“支持向量机”是由“支持向量”和“机器”构成的。
- ● “支持向量”是离分类器最近的那些点，这些点位于最大“间隔”上。通常情况下，分类仅依靠这些点完成，而与其他点无关。
- ● “机器”指的是分类器。

---
# SVM案例介绍
在使用支持向量机模块时，需要先使用函数`cv2.ml.SVM_create()`生成用于后续训练的空分类器模型。

获取了空分类器svm后，针对该模型使用`svm.train()`函数对训练数据进行训练

完成对分类器的训练后，使用svm.predict()函数即可使用训练好的分类器模型对测试数据进行分类

OpenCV支持对多个参数的自定义，例如：可以通过`setType()`函数设置类别，通过`setKernel()`函数设置核类型，通过`setC()`函数设置支持向量机的参数C（惩罚系数，即对误差的宽容度，默认值为0）。



In [None]:
#第1步 准备数据
# A等级的笔试、面试分数
a = np.random.randint(95,100, (20, 2)).astype(np.float32)
# B等级的笔试、面试分数
b = np.random.randint(90,95, (20, 2)).astype(np.float32)
#合并数据
data = np.vstack((a,b))
data = np.array(data,dtype='float32')
#第2步 建立分组标签，0代表A等级，1代表B等级
#aLabel对应着a的标签，为类型0-等级A
aLabel=np.zeros((20,1))
#bLabel对应着b的标签，为类型1-等级B
bLabel=np.ones((20,1))
#合并标签
label = np.vstack((aLabel, bLabel))
label = np.array(label,dtype='int32')
#第3步 训练
# ml 机器学习模块 SVM_create() 创建
svm = cv2.ml.SVM_create() 
# 属性设置，直接采用默认值即可。
#svm.setType(cv2.ml.SVM_C_SVC) # svm type
#svm.setKernel(cv2.ml.SVM_LINEAR) # line
#svm.setC(0.01)
# 训练
result = svm.train(data,cv2.ml.ROW_SAMPLE,label)
#第4步 预测
#生成两个随机的(笔试成绩、面试成绩)，可以用随机数生成
test = np.vstack([[99,90],[90,99]]) #0-A级 1-B级
test = np.array(test,dtype='float32')
#预测
(p1,p2) = svm.predict(test)
#第5步 观察结果
#可视化
plt.scatter(a[:,0], a[:,1], 80, 'g', 'o')
plt.scatter(b[:,0], b[:,1], 80, 'b', 's')
plt.scatter(test[:,0], test[:,1], 80, 'r', '*')
plt.show()
#打印原始测试数据test，预测结果
print(test)
print(p2)