# 模型的优化
超参数是不直接在估计器内学习的参数。在 scikit-learn 包中，它们作为估计器类中构造函数的参数进行传递。典型的例子有：用于支持向量分类器的 C 、kernel 和 gamma ，用于Lasso的 alpha等。搜索超参数空间以便获得最好交叉验证分数的方法是可能的而且是值得提倡的。<br><br>
搜索超参数空间以优化超参数需要明确以下方面：<br>
估计器<br>
超参数空间<br>
交叉验证方案<br>
打分函数<br>
搜寻或采样方法（网格搜索法或随机搜索法）<br>
优化模型的方法包括 网格搜索法，随机搜索法，模型特定交叉验证，信息准则优化。<br>

## 1.网格搜索法
网格搜索法在指定的超参数空间中对每一种可能的情况进行交叉验证评分并选出最好的超参数组合。

In [36]:
from sklearn import datasets
from sklearn.model_selection import ShuffleSplit,GridSearchCV
from sklearn.svm import SVC

iris=datasets.load_iris()
#估计器
svc=SVC(kernel='linear')
#超参数空间
param_distributions={'C': [1, 10, 100, 1000],'kernel':['rbf','linear'],'gamma':[0.001, 0.0001,0.00001,0.000001]}
#交叉验证方案
cv=ShuffleSplit(n_splits=5,test_size=0.3)
#打分函数
scoring='f1_macro'
#指定搜索方法
clf=GridSearchCV(svc,param_grid,cv=cv,scoring=scoring)
clf.fit(iris.data,iris.target)#得到的clf是一个优化了的分类器
print(clf.predict(iris.data))
clf.get_params()#查看全部参数
print(clf.best_params_)#查看最优参数
clf.best_score_

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 2 1
 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
{'C': 1000, 'gamma': 0.001, 'kernel': 'rbf'}


  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)


0.9779374291223515

## 2.随机搜索法 （RandomizedSearchCV）
随机搜索法和网格搜索法作用类似，但是只在超参数空间中进行指定次数的不同采样。采样次数通过n_iter参数指定，通过调整其大小可以在效率和性能方面取得平衡。其采样方法调用ParameterSampler函数,采样空间必须用字典进行指定。网格搜索法只能在有限的超参数空间进行暴力搜索，但随机搜索法可以在无限的超参数空间进行随机搜索。

In [37]:
from sklearn import datasets
from sklearn.model_selection import ShuffleSplit,RandomizedSearchCV
from sklearn.svm import SVC

iris=datasets.load_iris()
#估计器
svc=SVC()
#超参数空间
param_distributions={'C': [1, 10, 100, 1000],'kernel':['rbf','linear'],'gamma':[0.001, 0.0001,0.00001,0.000001,0]}
#交叉验证策略
cv=ShuffleSplit(n_splits=5,test_size=0.3)
#打分函数
scoring='f1_weighted'
#搜索方法
rsc=RandomizedSearchCV(svc,param_distributions,cv=cv,scoring=scoring,n_iter=10000)
rsc.fit(iris.data,iris.target)
print(rsc.predict(iris.data))

print(rsc.best_params_)
print(rsc.best_score_)


  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision'

  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision'

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
{'kernel': 'linear', 'gamma': 0.001, 'C': 1}
0.9821895273977654


  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
  'precision', 'predicted', average, warn_for)
