# 梯度下降

梯度下降是一种常用的优化算法，通过迭代更新模型参数，使得损失函数逐渐减小。梯度下降分为批量梯度下降、小批量梯度下降和随机梯度下降。

## 批量梯度下降

批量梯度下降是最基本的梯度下降方法，每次迭代使用整个训练集计算梯度，更新模型参数。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# 设置字体和解决负号显示问题
plt.rcParams['font.sans-serif'] = 'Hiragino Sans GB'
plt.rcParams['axes.unicode_minus'] = False

# 定义损失函数
def loss_function(w):
    return w**2 + 4*w + 4

# 定义梯度
def gradient(w):
    return 2*w + 4

# 批量梯度下降
w = 10  # 初始值
learning_rate = 0.1
iterations = 20
w_values = [w]
loss_values = [loss_function(w)]
for i in range(iterations):
    w -= learning_rate * gradient(w)
    w_values.append(w)
    loss_values.append(loss_function(w))

# 绘制损失函数和梯度下降过程
plt.figure(figsize=(10, 5))
plt.plot(w_values, loss_values, 'o-', label='批量梯度下降')
plt.xlabel('参数 w')
plt.ylabel('损失函数值')
plt.title('批量梯度下降过程')
plt.legend()
plt.show()

## 小批量梯度下降

小批量梯度下降是一种改进的梯度下降方法，每次迭代使用一部分训练集计算梯度，更新模型参数，具有更快的收敛速度和更好的处理大规模数据集的能力。

In [None]:
from sklearn.linear_model import SGDRegressor

# 生成示例数据
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# 拟合小批量梯度下降模型
sgd_reg = SGDRegressor(max_iter=1000, tol=1e-3)
sgd_reg.fit(X, y.ravel())

# 输出模型参数
print(f'截距: {sgd_reg.intercept_}')
print(f'系数: {sgd_reg.coef_}')

## 随机梯度下降

随机梯度下降是一种改进的梯度下降算法，每次迭代只使用一个样本更新模型参数，具有更快的收敛速度和更好的处理大规模数据集的能力。

In [None]:
from sklearn.linear_model import SGDRegressor

# 生成示例数据
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# 拟合随机梯度下降模型
sgd_reg = SGDRegressor(max_iter=1000, tol=1e-3)
sgd_reg.fit(X, y.ravel())

# 输出模型参数
print(f'截距: {sgd_reg.intercept_}')
print(f'系数: {sgd_reg.coef_}')

通过以上示例，我们了解了批量梯度下降、小批量梯度下降和随机梯度下降的基本原理和应用。在实际应用中，选择合适的梯度下降算法可以显著提高模型的训练效率和性能。