## 概述
[模型超参数调优](https://zh.wikipedia.org/wiki/%E8%B6%85%E5%8F%82%E6%95%B0%E4%BC%98%E5%8C%96)（Hyperparameter Tuning）是机器学习中提升模型性能的关键环节。与模型在训练过程中自动学习的“参数”不同，超参数（如学习率、正则化系数、树的深度）需在训练前手动设定，直接影响模型的泛化能力。

**核心调优策略:**
- 1.网格搜索 (Grid Search)：穷举指定范围内所有超参数的组合。
> 特点：简单直接，能找到全局最优解，但计算开销随参数数量呈指数增长。

- 2.随机搜索 (Random Search)：从参数空间中随机抽取样本进行试验。
> 特点：比网格搜索更高效，尤其在某些超参数对结果影响远大于其他参数时，能更快找到较优解。

- 3.贝叶斯优化 (Bayesian Optimization)：构建概率模型（如 TPE）来预测哪些参数表现更好，并在后续搜索中重点尝试。
> 特点：能利用先验信息指导搜索，适用于高维空间且评估成本较高的复杂模型。

- 4.Hyperband：结合随机采样与“早停”机制。
> 特点：将资源分配给表现更好的配置，大幅节省大型深度学习模型的训练时间。

- 5.遗传算法 (GA)：模拟自然进化，通过交叉、变异和选择不断演化出最优参数组合。 



### 通过[交叉验证](https://zh.wikipedia.org/wiki/%E4%BA%A4%E5%8F%89%E9%A9%97%E8%AD%89)中的k折交叉验证和网格搜索进行超参数调优

![交叉验证](https://photo.20061204.xyz/file/AgACAgUAAyEGAASlJlL_AAMOaX9NKWPYkNgwbWFi2QABftcItsAGAAJCD2sbEqL5V9SzzeVcMO_oAQADAgADeQADOAQ.png)

K折验证：将训练集分为K份，进行K次训练，每次取第i份（0<i<=K）作为测试集。最后取K次结果均值。

网格搜索：对于KNN算法中的`n_neighbors = ?`进行暴力枚举，找到最合适的值。

In [None]:
from sklearn.model_selection import GridSearchCV

def perform_grid_search(estimator, param_grid, cv=5, scoring=None, n_jobs=-1):
	"""
	使用交叉验证进行网格搜索以优化模型超参数。

	参数:
	estimator: 机器学习模型实例（如分类器或回归器）
	param_grid: 字典，包含要搜索的超参数及其对应的取值列表
	cv: 交叉验证折数，默认为5
	scoring: 评估指标，默认为None（使用estimator的默认评分方法）
	n_jobs: 并行运行的作业数，默认为-1（使用所有可用的CPU核心）

	返回:
	best_estimator_: 最佳模型实例
	best_params_: 最佳超参数组合
	best_score_: 最佳评分
	"""
	grid_search = GridSearchCV(estimator=estimator,
							   param_grid=param_grid,
							   cv=cv,
							   scoring=scoring,
							   n_jobs=n_jobs)
	
	grid_search.fit(X_train, y_train)  # 假设X_train和y_train是预定义的训练数据

	return grid_search.best_estimator_, grid_search.best_params_, grid_search.best_score_
	