# GridSearchCV
GridSearchCV的名字其实可以拆分为两部分，GridSearch和CV，即网格搜索和交叉验证。      

网格搜索：搜索的是参数，即在指定的参数范围内，按步长依次调整参数，利用调整的参数训练学习器，从所有的参数中找到在验证集上精度最高的参数，这其实是一个循环和比较的过程。    

交叉验证：
- 将训练数据集划分为K份，K一般为10
- 依次取其中一份为验证集，其余为训练集训练分类器，测试分类器在验证集上的精度 
- 取K次实验的平均精度为该分类器的平均精度

In [None]:
from sklearn.model_selection import GridSearchCV
from scipy.stats import uniform, randint

from xgboost import XGBRFClassifier
from sklearn.datasets import load_iris

iris = load_iris()

X = iris.data
y = iris.target

params = {'n_estimators' : [i for i in range(50, 501, 50)], 
          'learning_rate': [0.001, 0.01, 0.1, 0.2, 0, 3], 
          'subsample': [i / 10 for i in range(3, 10)], 
          'colsample_bytree': [i / 10 for i in range(5, 9)]
          }

xgb = XGBRFClassifier(objective='multi:softmax')
'''
使用xgb为estimator
参数列表为 params
评判标准为 accuracy
注意：二分类时可以使用 scoring 可以设置为 roc_auc,多分类需要用 accuracy
如果error了, 记为0分
用所有的处理器进行计算
'''
clf = GridSearchCV(xgb, 
                   param_grid = params, 
                   scoring = 'accuracy', 
                   error_score = 0, 
                   verbose = 3, 
                   n_jobs = -1)

# 开始搜索， 返回值中的model的参数是假的，看best estimator使用下面的命令
clf.fit(X, y)

# 查看最好的预测器
print(clf.best_estimator_)

# 查看最好的参数
print(clf.best_params_)