# 1. 理论介绍
在基于sk-learn的机器学习项目中，除了模型的选择，参数的设置同样会对预测的质量产生影响。然而，参数的大小往往难以确定。网格搜索提供了一种解决方案，即设定一系列可能的参数选项，利用程序选取最优参数。sklearn.model_selection中的`GridSearchCV`方法便能够实现这个功能。
`GridSearchCV`方法需要输入的参数有：
* 模型函数（需要加括号，表示执行）
* 参数字典：以参数名为键，可选参数值列表为值

# 2. 代码示例

In [1]:
from sklearn import svm, datasets
from sklearn.model_selection import GridSearchCV
iris = datasets.load_iris()
# 输入模型
svc = svm.SVC()
# 输入参数名及测试值列表
parameters = {'kernel': ['linear', 'rbf'], 'C': [1, 10]}
# 也支持设计多个方案
# parameters = [{'kernel': ['linear'], 'C': [1, 10], 'degree': [1, 5]},
#           {'kernel': ['rbf'], 'C': [1, 10, 100, 1000], 'gamma': [1, 0.1, 0.01]}]
# 进行训练（这里svc值是svm.SVC(),如不使用变量写法，则需要加括号）
clf = GridSearchCV(svc, parameters)
clf.fit(iris.data, iris.target)
# 获取最优
print(clf.best_params_)
print(clf.best_score_)

{'C': 1, 'kernel': 'linear'}
0.98




一种可行的方法是：先确定参数的最优量级，再确定具体的最优值

# 参考资料
sk-learn官方文档

# 作业：
下面是应用随机森林方法预测乳腺癌数据集的一个例子，请按照参数范围：
'n_estimators': [25, 50, 75, 100], 'max_depth': [2, 4, 6, 8]
进行网格搜索，寻找最优参数

In [2]:
from sklearn import datasets,ensemble
from sklearn.model_selection import GridSearchCV
data = datasets.load_breast_cancer()

# 输入模型
model = ensemble.RandomForestClassifier()
# 输入参数名及测试值列表

# 进行训练

# 获取最优