# 优化算法

优化算法在机器学习模型的训练过程中起着至关重要的作用。常见的优化算法包括梯度下降、随机梯度下降和贝叶斯优化等。在本节中，我们将详细介绍这些优化算法的基本原理和应用。

## 梯度下降

梯度下降是一种常用的优化算法，通过迭代更新模型参数，使得损失函数逐渐减小。梯度下降分为批量梯度下降、小批量梯度下降和随机梯度下降。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# 设置字体和解决负号显示问题
plt.rcParams['font.sans-serif'] = 'Hiragino Sans GB'
plt.rcParams['axes.unicode_minus'] = False

# 定义损失函数
def loss_function(w):
    return w**2 + 4*w + 4

# 定义梯度
def gradient(w):
    return 2*w + 4

# 梯度下降
w = 10  # 初始值
learning_rate = 0.1
iterations = 20
w_values = [w]
loss_values = [loss_function(w)]
for i in range(iterations):
    w -= learning_rate * gradient(w)
    w_values.append(w)
    loss_values.append(loss_function(w))

# 绘制损失函数和梯度下降过程
plt.figure(figsize=(10, 5))
plt.plot(w_values, loss_values, 'o-', label='梯度下降')
plt.xlabel('参数 w')
plt.ylabel('损失函数值')
plt.title('梯度下降过程')
plt.legend()
plt.show()

## 随机梯度下降

随机梯度下降是一种改进的梯度下降算法，每次迭代只使用一个样本更新模型参数，具有更快的收敛速度和更好的处理大规模数据集的能力。

In [None]:
from sklearn.linear_model import SGDRegressor

# 生成示例数据
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# 拟合随机梯度下降模型
sgd_reg = SGDRegressor(max_iter=1000, tol=1e-3)
sgd_reg.fit(X, y.ravel())

# 输出模型参数
print(f'截距: {sgd_reg.intercept_}')
print(f'系数: {sgd_reg.coef_}')

## 贝叶斯优化

贝叶斯优化是一种基于贝叶斯统计的优化方法，通过构建代理模型，迭代地选择最优的超参数组合。贝叶斯优化比网格搜索和随机搜索更高效，适用于高维度的超参数空间。

In [None]:
from skopt import BayesSearchCV

# 定义贝叶斯优化的搜索空间
search_spaces = {
    'n_estimators': (50, 200),
    'max_depth': (10, 30),
    'min_samples_split': (2, 10)
}

# 进行贝叶斯优化
bayes_search = BayesSearchCV(estimator=rf, search_spaces=search_spaces, n_iter=10, cv=5, scoring='accuracy', random_state=42)
bayes_search.fit(X, y)

# 输出最优参数和最优准确率
print(f'最优参数: {bayes_search.best_params_}')
print(f'最优准确率: {bayes_search.best_score_:.2f}')

通过以上示例，我们了解了梯度下降、随机梯度下降和贝叶斯优化的基本原理和应用。在实际应用中，选择合适的优化算法可以显著提高模型的训练效率和性能。