In [36]:
import torch
import torch.nn as nn
from torch.optim import SGD
from torch.optim import lr_scheduler

In [17]:
def initial_weights(module: nn.Module):
    if isinstance(module, nn.Conv2d):
        torch.nn.init.zeros_(module.bias)
        torch.nn.init.constant_(module.weight, 1)

class Model(nn.Module):

    def __init__(self):
        super(Model, self).__init__()
        self.conv = nn.Conv2d(in_channels=3, out_channels=64, kernel_size=1, stride=1)
        self.apply(initial_weights)

    def forward(self, x: torch.Tensor):
        return self.conv(x)

In [78]:
model = Model()
initial_lr = 0.01
optimizer = SGD(params=model.parameters(), lr=initial_lr)

## LambdaLR 学习曲率调整策略
学习曲率的衰减按照每一epoch，基于lr_lambda接受的函数计算


In [92]:
optimizer.param_groups[0]["lr"] = optimizer.defaults['lr']
# 使用schedular接管optimizer的学习率的更新后，在optimizer.param_groups中增加参数initial_lr
schedular = lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda epoch: 1 / (epoch + 1), last_epoch=-1)

print("初始化的学习率：", optimizer.defaults['lr'])
for epoch in range(0, 30, 5):
    optimizer.zero_grad()
    optimizer.step()
    print(f'当前epoch-{epoch + 1}学习率: {optimizer.param_groups[0]["lr"]}')
    schedular.step()


初始化的学习率： 0.01
当前epoch-1学习率: 0.01
当前epoch-6学习率: 0.005
当前epoch-11学习率: 0.003333333333333333
当前epoch-16学习率: 0.0025
当前epoch-21学习率: 0.002
当前epoch-26学习率: 0.0016666666666666666


{'base_lrs': [0.01],
 'last_epoch': 6,
 'verbose': False,
 '_step_count': 7,
 '_get_lr_called_within_step': False,
 '_last_lr': [0.0014285714285714286],
 'lr_lambdas': [None]}

## StepLR学习曲率调整策略
每隔step_size的epoch, 学习率衰减为原来的0.5倍

In [85]:
optimizer.param_groups[0]["lr"] = optimizer.defaults['lr']
# last_epoch为-1表示从头开始训练
# 每隔step_size的epoch, 学习率衰减为原来的0.1倍
schedular = lr_scheduler.StepLR(optimizer, step_size=2, gamma=0.5)
print("初始化的学习率：", optimizer.defaults['lr'])
for epoch in range(0, 50, 5):
    optimizer.zero_grad()
    optimizer.step()
    print(f'当前epoch-{epoch + 1}学习率: {optimizer.param_groups[0]["lr"]}')
    schedular.step()

初始化的学习率： 0.01
当前epoch-1学习率: 0.01
当前epoch-6学习率: 0.01
当前epoch-11学习率: 0.005
当前epoch-16学习率: 0.005
当前epoch-21学习率: 0.0025
当前epoch-26学习率: 0.0025
当前epoch-31学习率: 0.00125
当前epoch-36学习率: 0.00125
当前epoch-41学习率: 0.000625
当前epoch-46学习率: 0.000625


## MultipleStepLR 学习曲率调整策略
按照milestones的epoch间隔, 学习率衰减为原来的0.5倍

In [94]:
# 按照milestones的epoch间隔, 学习率衰减为原来的0.5倍
optimizer.param_groups[0]["lr"] = optimizer.defaults['lr']
schedular = lr_scheduler.MultiStepLR(optimizer, milestones=[2, 5, 8, 12, 16, 25], gamma=0.5)
print("初始化的学习率：", optimizer.defaults['lr'])
for epoch in range(0, 30, 1):
    optimizer.zero_grad()
    optimizer.step()
    print(f'当前epoch-{epoch + 1}学习率: {optimizer.param_groups[0]["lr"]}')
    schedular.step()

初始化的学习率： 0.01
当前epoch-1学习率: 0.01
当前epoch-2学习率: 0.01
当前epoch-3学习率: 0.005
当前epoch-4学习率: 0.005
当前epoch-5学习率: 0.005
当前epoch-6学习率: 0.0025
当前epoch-7学习率: 0.0025
当前epoch-8学习率: 0.0025
当前epoch-9学习率: 0.00125
当前epoch-10学习率: 0.00125
当前epoch-11学习率: 0.00125
当前epoch-12学习率: 0.00125
当前epoch-13学习率: 0.000625
当前epoch-14学习率: 0.000625
当前epoch-15学习率: 0.000625
当前epoch-16学习率: 0.000625
当前epoch-17学习率: 0.0003125
当前epoch-18学习率: 0.0003125
当前epoch-19学习率: 0.0003125
当前epoch-20学习率: 0.0003125
当前epoch-21学习率: 0.0003125
当前epoch-22学习率: 0.0003125
当前epoch-23学习率: 0.0003125
当前epoch-24学习率: 0.0003125
当前epoch-25学习率: 0.0003125
当前epoch-26学习率: 0.00015625
当前epoch-27学习率: 0.00015625
当前epoch-28学习率: 0.00015625
当前epoch-29学习率: 0.00015625
当前epoch-30学习率: 0.00015625


## MultiplicativeLR 学习曲率调整策略
将每个参数组的学习率乘以指定函数中给定的因子

In [100]:
optimizer.param_groups[0]["lr"] = optimizer.defaults['lr']
schedular = lr_scheduler.MultiplicativeLR(optimizer, lr_lambda=lambda epoch: 1 / (epoch + 1))
print("初始化的学习率：", optimizer.defaults['lr'])
for epoch in range(0, 30, 1):
    optimizer.zero_grad()
    optimizer.step()
    print(f'当前epoch-{epoch + 1}学习率: {optimizer.param_groups[0]["lr"]}')
    schedular.step()

初始化的学习率： 0.01
当前epoch-1学习率: 0.01
当前epoch-2学习率: 0.005
当前epoch-3学习率: 0.0016666666666666666
当前epoch-4学习率: 0.00041666666666666664
当前epoch-5学习率: 8.333333333333333e-05
当前epoch-6学习率: 1.3888888888888888e-05
当前epoch-7学习率: 1.984126984126984e-06
当前epoch-8学习率: 2.48015873015873e-07
当前epoch-9学习率: 2.7557319223985888e-08
当前epoch-10学习率: 2.755731922398589e-09
当前epoch-11学习率: 2.505210838544172e-10
当前epoch-12学习率: 2.08767569878681e-11
当前epoch-13学习率: 1.6059043836821616e-12
当前epoch-14学习率: 1.1470745597729724e-13
当前epoch-15学习率: 7.647163731819816e-15
当前epoch-16学习率: 4.779477332387385e-16
当前epoch-17学习率: 2.81145725434552e-17
当前epoch-18学习率: 1.5619206968586222e-18
当前epoch-19学习率: 8.220635246624327e-20
当前epoch-20学习率: 4.1103176233121636e-21
当前epoch-21学习率: 1.9572941063391255e-22
当前epoch-22学习率: 8.89679139245057e-24
当前epoch-23学习率: 3.8681701706306825e-25
当前epoch-24学习率: 1.6117375710961175e-26
当前epoch-25学习率: 6.446950284384471e-28
当前epoch-26学习率: 2.4795962632247965e-29
当前epoch-27学习率: 9.183689863795541e-31
当前epoch-28学习率: 3.27988

## ConstantLR学习率调整策略
学习率以常量方式衰减total_iters个epoch, 超过epoch后，学习率回到最初值

In [103]:
optimizer.param_groups[0]["lr"] = optimizer.defaults['lr']
schedular = lr_scheduler.ConstantLR(optimizer, factor=0.5, total_iters=5)
print("初始化的学习率：", optimizer.defaults['lr'])
for epoch in range(0, 30, 1):
    optimizer.zero_grad()
    optimizer.step()
    print(f'当前epoch-{epoch + 1}学习率: {optimizer.param_groups[0]["lr"]}')
    schedular.step()

初始化的学习率： 0.01
当前epoch-1学习率: 0.005
当前epoch-2学习率: 0.005
当前epoch-3学习率: 0.005
当前epoch-4学习率: 0.005
当前epoch-5学习率: 0.005
当前epoch-6学习率: 0.01
当前epoch-7学习率: 0.01
当前epoch-8学习率: 0.01
当前epoch-9学习率: 0.01
当前epoch-10学习率: 0.01
当前epoch-11学习率: 0.01
当前epoch-12学习率: 0.01
当前epoch-13学习率: 0.01
当前epoch-14学习率: 0.01
当前epoch-15学习率: 0.01
当前epoch-16学习率: 0.01
当前epoch-17学习率: 0.01
当前epoch-18学习率: 0.01
当前epoch-19学习率: 0.01
当前epoch-20学习率: 0.01
当前epoch-21学习率: 0.01
当前epoch-22学习率: 0.01
当前epoch-23学习率: 0.01
当前epoch-24学习率: 0.01
当前epoch-25学习率: 0.01
当前epoch-26学习率: 0.01
当前epoch-27学习率: 0.01
当前epoch-28学习率: 0.01
当前epoch-29学习率: 0.01
当前epoch-30学习率: 0.01


{'h': 34}
