### svm.SVC使用说明
#### 功能
构建SVM分类模型

#### 参数
- C: float,1.0；惩罚项参数C，一般大于0，C越大表示训练过程中对C的关注度越高，即训练效果越好，容易造成过拟合问题
- kernel: str,'rbf；选取核函数，可选用类型有‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’ 
- degree: int,3；使用多项式核函数时，给定的多项式的项数
- gamma: float,auto；使用'rbf'、'poly'、'sigmoid'核函数作为SVM的核函数时，核函数的系数值
- coef0: float,0；使用'poly'、'sigmoid'作为核函数时，给定的独立系数
- shrinking: boolean,True；是否开启收缩启发式计算式计算
- probability: boolean,False；是否启用概率估计
- tol: float,0.001；模型的收敛参数，当模型的准确率变化率小于该参数时，停止构建模型
- cache_size: float,200(MB)；模型构建过程中，数据缓存的最大的内存大小
- class_weight: dict；给定的各个类别的权重大小，默认None，权重相同
- max_iter: int,-1；最大的迭代次数，-1表示不限制次数
- decision_function_shape: str,'ovr'；决策函数，可选'ovo'和'ovr'
- random_state:

#### 返回值

#### 属性
- support_: 支持向量机的指标
- support_vectors_: 支持向量
- n_support_: 每个类别支持向量的数量
- dual_coef_: 决策函数中，支持向量的系数
- coef_: 赋予特征的权重
- intercept_: 决策函数中的常量
- fit_status_: 训练状态，0 正常，1 不正常
- probA_:
- probB_: 如果启用概率估计，决策值生成的概率估计

#### 方法
同其他API

In [35]:
import numpy as np
import warnings
import matplotlib.pyplot as plt

from sklearn import svm
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score     # 计算模型的准确率
from sklearn.exceptions import ChangedBehaviorWarning    # 异常和警告模块

In [2]:
# 设置显示中文
plt.rcParams['font.sans-serif'] = ['Heiti']
plt.rcParams['axes.unicode_minus'] = False

In [36]:
# 忽略警告
warnings.filterwarnings('ignore', category=ChangedBehaviorWarning)

### SVM实现
#### 读取数据

In [31]:
data = load_iris().data    # 读取数据, (150, 4)
target = load_iris().target     # 数据标签, 3
target_name = load_iris().target_names     # 标签名
features = load_iris().feature_names     # 特征名
# 查看标签名和特征名
print('数据的前两个值：\n', data[:2])
print('标签名为：', target_name)
print('特征名为：', features)

数据的前两个值：
 [[5.1 3.5 1.4 0.2]
 [4.9 3.  1.4 0.2]]
标签名为： ['setosa' 'versicolor' 'virginica']
特征名为： ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']


#### 预处理

In [32]:
ss = StandardScaler()
data = ss.fit_transform(data)
print('标准化后前连个值：\n', data[:2])

# 数据集划分
x_train, x_test, y_train, y_test = train_test_split(
    data, target, test_size=0.2, random_state=9)

标准化后前连个值：
 [[-0.90068117  1.01900435 -1.34022653 -1.3154443 ]
 [-1.14301691 -0.13197948 -1.34022653 -1.3154443 ]]


#### 构建模型

In [37]:
clf = svm.SVC()
clf.fit(x_train, y_train)



SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovr', degree=3, gamma='auto_deprecated',
    kernel='rbf', max_iter=-1, probability=False, random_state=None,
    shrinking=True, tol=0.001, verbose=False)

#### 查看属性

In [None]:
print('支持向量的指标：', clf.support_)
print('支持向量：', clf.support_vectors_)
print('每个类别支持向量的数量：', clf.n_support_)
# print('特征的权重：', clf.coef_)
print('模型训练状态：', clf.fit_status_)

#### 模型评估

In [44]:
print('模型准确率：', clf.score(x_test, y_test))
print('训练集准确率：', accuracy_score(y_train, clf.predict(x_train)))
print('测试集准确率：', accuracy_score(y_test, clf.predict(x_test)))


模型准确率： 1.0
训练集准确率： 0.975
测试集准确率： 1.0


### 画图

In [47]:
y_predict = clf.predict(x_test)

In [None]:
# 取前两个特征绘制区域图
x1_min, x2_min, x3_min, x4_min = data.min(axis=0)
x1_max, x2_max, x3_max, x4_max = data.min(axis=0)

# 生成采样点网格
N = 500
t1 = np.linspace(x1_min, x1_max, N)
t2 = np.linspace(x2_min, x2_max, N)
t3 = np.linspace(x3_min, x3_max, N)
t4 = np.linspace(x4_min, x4_max, N)

x1, x2, x3, x4 =  np.meshgrid(t1, t2, t3, t4)

1
