## 使用学习率调度器的目的
在训练的不同阶段，使用不同的学习率来训练模型

# 代码举例1：optim.lr_scheduler.StepLR
每间隔 step_size 个epoch，调度器会将在上一个学习率的基础上，乘以一个指定的调整因子

In [4]:
import torch
import torch.nn as nn
from torch.optim.lr_scheduler import StepLR


class MyModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Linear(3, 10)

    def forward(self, x):
        pass

model = MyModel()

# 优化器
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# 每5个step，学习率衰减为上次的一半
decay_factor = 0.5
decay_steps = 5
lr_scheduler = StepLR(optimizer, step_size=decay_steps, gamma=decay_factor)

# 在每个epoch结束时调用
num_epochs = 10
for epoch in range(num_epochs):
    # 训练...
    optimizer.step()
    lr_scheduler.step()
    current_lr = optimizer.param_groups[0]['lr']
    print(f'Epoch {epoch + 1}, Learning Rate: {current_lr}')

Epoch 1, Learning Rate: 0.01
Epoch 2, Learning Rate: 0.01
Epoch 3, Learning Rate: 0.01
Epoch 4, Learning Rate: 0.01
Epoch 5, Learning Rate: 0.005
Epoch 6, Learning Rate: 0.005
Epoch 7, Learning Rate: 0.005
Epoch 8, Learning Rate: 0.005
Epoch 9, Learning Rate: 0.005
Epoch 10, Learning Rate: 0.0025


# 代码举例2：optim.lr_scheduler.LambdaLR
允许用户自定义 学习率调整函数 ，通过学习率调整函数 返回的调整因子$$\gamma$$ 来调整学习率 ： 在初始化学习率$$initial\_lr$$ 的基础上，乘以 调整因子$$\gamma$$，得到调整后的 学习率
更新策略 ：  $$new\_lr = initial\_lr \times \lambda$$

In [27]:
import torch
import torch.nn as nn
from torch.optim.lr_scheduler import LambdaLR


class MyModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Linear(3, 10)

    def forward(self, x):
        pass


model = MyModel()

# 优化器
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)

# 定义自定义的学习率调整函数
lr_lambda = lambda epoch: 0.95 ** epoch  # 以0.95的指数衰减

# 定义学习率调度器
lr_scheduler = LambdaLR(optimizer, lr_lambda=lr_lambda)

# 模拟训练过程
num_epochs = 10
for epoch in range(num_epochs):
    # 训练...

    optimizer.step()
    lr_scheduler.step()
    current_lr = optimizer.param_groups[0]['lr']
    print(f'Epoch {epoch + 1}, Learning Rate: {current_lr}')

Epoch 1, Learning Rate: 0.095
Epoch 2, Learning Rate: 0.09025
Epoch 3, Learning Rate: 0.0857375
Epoch 4, Learning Rate: 0.081450625
Epoch 5, Learning Rate: 0.07737809374999999
Epoch 6, Learning Rate: 0.07350918906249998
Epoch 7, Learning Rate: 0.06983372960937498
Epoch 8, Learning Rate: 0.06634204312890622
Epoch 9, Learning Rate: 0.0630249409724609
Epoch 10, Learning Rate: 0.05987369392383787


# 代码举例3：optim.lr_scheduler.ExponentialLR
每个 epoch 都做一次更新

In [28]:
import torch
import torch.nn as nn
from torch.optim.lr_scheduler import ExponentialLR


class MyModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Linear(3, 10)

    def forward(self, x):
        pass

model = MyModel()

# 优化器
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# 学习率调度器
decay_factor = 0.5
lr_scheduler = ExponentialLR(optimizer, gamma=decay_factor)

num_epochs = 5
for epoch in range(num_epochs):
    # 训练...
    optimizer.step()
    lr_scheduler.step()
    current_lr = optimizer.param_groups[0]['lr']
    print(f'Epoch {epoch + 1}, Learning Rate: {current_lr}')

Epoch 1, Learning Rate: 0.005
Epoch 2, Learning Rate: 0.0025
Epoch 3, Learning Rate: 0.00125
Epoch 4, Learning Rate: 0.000625
Epoch 5, Learning Rate: 0.0003125


# 代码模板1：optim.lr_scheduler.StepLR
每间隔 step_size 个epoch，调度器会将在上一个学习率的基础上，乘以一个指定的调整因子$$\gamma$$
torch.optim.lr_scheduler.StepLR(optimizer, step_size, gamma=0.1, last_epoch=-1)
- optimizer: 需要进行学习率调度的优化器
- step_size: 每隔多少个 steps (epoch) 调整一次学习率。steps 从 0 开始，每调用一次 lr_scheduler.step()，steps 自增1，当 steps//step_size=0 时，学习率调整一次
- gamma: 学习率衰减因子，即学习率每次调整时乘以的值，默认为 0.1
- last_epoch:  上一个 epoch 的索引，比如，当训练了几个epoch之后中断了，想要继续训练，就会在 last_epoch 的基础上，继续训练。默认为 -1，表示从头开始。

In [7]:
import torch
import torch.nn as nn
from torch.optim.lr_scheduler import StepLR

# 定义模型
class MyModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Linear(3, 10)

    def forward(self, x):
        pass

# 实例化模型
model = MyModel()

# 优化器
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# ***************************************************************************关键模块*************************************************************
# 每5个step，学习率衰减为上次的一半
decay_factor = 0.5
decay_steps = 5
lr_scheduler = StepLR(optimizer, step_size=decay_steps, gamma=decay_factor)

# 在每个epoch结束时调用
num_epochs = 10
for epoch in range(num_epochs):
    # 训练...
    optimizer.step()
    lr_scheduler.step()
    # 获取当前的学习率
    current_lr = optimizer.param_groups[0]['lr']
    

# 代码模板2：optim.lr_scheduler.LambdaLR
允许用户自定义 学习率调整函数 ，通过学习率调整函数 返回的调整因子$$\gamma$$ 来调整学习率 ： 在初始化学习率$$initial\_lr$$ 的基础上，乘以 调整因子$$\gamma$$，得到调整后的 学习率
更新策略 ：  $$new\_lr = initial\_lr \times \lambda$$
参数：
- optimizer: 需要进行学习率调度的优化器
- lr_lambda: 一个 lambda 函数，输入为 epoch ，返回相应的学习率调整因子 $$\lambda$$
- last_epoch: 上一个 epoch 的索引，比如，当训练了几个epoch之后中断了，想要继续训练，就会在 last_epoch 的基础上，继续训练。默认为 -1，表示从头开始。

In [24]:
# 使用举例 （1）：不设置 last_epoch 的情况
import torch
import torch.nn as nn
from torch.optim.lr_scheduler import LambdaLR


class MyModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Linear(3, 10)

    def forward(self, x):
        pass


model = MyModel()

# 优化器
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)

# 定义自定义的学习率调整函数
lr_lambda = lambda epoch: 0.95 ** epoch  # 以0.95的指数衰减

# 定义学习率调度器
lr_scheduler = LambdaLR(optimizer, lr_lambda=lr_lambda)

# 模拟训练过程
num_epochs = 10
for epoch in range(num_epochs):
    # 训练...

    optimizer.step()
    lr_scheduler.step()
    current_lr = optimizer.param_groups[0]['lr']
    print(f'Epoch {epoch + 1}, Learning Rate: {current_lr}')

Epoch 1, Learning Rate: 0.095
Epoch 2, Learning Rate: 0.09025
Epoch 3, Learning Rate: 0.0857375
Epoch 4, Learning Rate: 0.081450625
Epoch 5, Learning Rate: 0.07737809374999999
Epoch 6, Learning Rate: 0.07350918906249998
Epoch 7, Learning Rate: 0.06983372960937498
Epoch 8, Learning Rate: 0.06634204312890622
Epoch 9, Learning Rate: 0.0630249409724609
Epoch 10, Learning Rate: 0.05987369392383787


# 代码模板3：optim.lr_scheduler.ExponentialLR
每个 epoch 都做一次更新
更新策略：$$new\_lr = initial\_lr \times \gamma^{epoch}$$
参数：
- optimizer: 需要进行学习率调度的优化器
- gamma: 学习率衰减因子，即学习率每次调整时乘以的值，默认为 0.1
- last_epoch: 上一个 epoch 的索引，比如，当训练了几个epoch之后中断了，想要继续训练，就会在 last_epoch 的基础上，继续训练。默认为 -1，表示从头开始。

In [29]:
import torch
import torch.nn as nn
from torch.optim.lr_scheduler import ExponentialLR


class MyModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Linear(3, 10)

    def forward(self, x):
        pass

model = MyModel()

# 优化器
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# 学习率调度器
decay_factor = 0.5
lr_scheduler = ExponentialLR(optimizer, gamma=decay_factor)

num_epochs = 5
for epoch in range(num_epochs):
    # 训练...
    optimizer.step()
    lr_scheduler.step()
    current_lr = optimizer.param_groups[0]['lr']
    print(f'Epoch {epoch + 1}, Learning Rate: {current_lr}')

Epoch 1, Learning Rate: 0.005
Epoch 2, Learning Rate: 0.0025
Epoch 3, Learning Rate: 0.00125
Epoch 4, Learning Rate: 0.000625
Epoch 5, Learning Rate: 0.0003125
