Fixed parameter scheduler bug with `CosineAnnealingWarmRestarts` #2938

AlexanderChaptykov · 2023-05-08T20:08:21Z

Description:

Check list:

New tests are added (if a new feature is added)
New doc strings: description and/or example code are in RST format
Documentation is updated (if required)

Plotting learning rates:

import matplotlib.pyplot as plt
import numpy as np
import torch
from torch.optim.lr_scheduler import CosineAnnealingWarmRestarts

from ignite.handlers import create_lr_scheduler_with_warmup


def plot(warmup_end_value):
    lr = 0.2
    warm_steps = 5
    steps = 10
    warm_start = 0.023

    def get_optim():
        t1 = torch.zeros([1], requires_grad=True)
        return torch.optim.SGD([t1], lr=lr)

    def get_cos_shed():
        return CosineAnnealingWarmRestarts(optimizer, T_0=12, T_mult=3, verbose=False)

    optimizer = get_optim()
    scheduler = get_cos_shed()
    cosine_lrs = []
    for i in range(steps):
        cosine_lrs.append(optimizer.param_groups[0]["lr"])
        scheduler.step()

    optimizer = get_optim()
    scheduler = create_lr_scheduler_with_warmup(
        get_cos_shed(), warmup_start_value=warm_start, warmup_end_value=warmup_end_value, warmup_duration=warm_steps
    )

    warm_lrs = []
    real_warm_steps = warm_steps if warmup_end_value is not None else (warm_steps - 1)
    for epoch in range(real_warm_steps + steps):
        scheduler(None)
        warm_lrs.append(optimizer.param_groups[0]["lr"])

    if warmup_end_value is not None:
        plt.title("warmup_end_value != lr")
        plt.scatter(range(len(warm_lrs[:real_warm_steps])), warm_lrs[:real_warm_steps])
        plt.scatter(range(warm_steps, len(warm_lrs[real_warm_steps:]) + warm_steps), warm_lrs[real_warm_steps:])
        plt.show()
    else:
        plt.title("warmup_end_value == lr or warmup_end_value is None")
        plt.scatter(range(len(warm_lrs[:warm_steps])), warm_lrs[:warm_steps])
        plt.scatter(range(warm_steps, len(warm_lrs[warm_steps:]) + warm_steps), warm_lrs[warm_steps:])
        plt.show()


plot(None)
plot(.26)

ignite/handlers/param_scheduler.py

vfdev-5

Thanks for the updates @AlexanderChaptykov
I left few suggestions on how to improve the PR

ignite/handlers/param_scheduler.py

tests/ignite/handlers/test_param_scheduler.py

ignite/handlers/param_scheduler.py

…e_sched

ignite/handlers/param_scheduler.py

tests/ignite/handlers/test_param_scheduler.py

AlexanderChaptykov · 2023-05-23T09:04:52Z

tests/ignite/handlers/test_param_scheduler.py

+        assert warm_lrs[warm_steps:] == cosine_lrs
+    else:
+        assert (np.linspace(warm_start, lr, warm_steps).round(3) == np.array(warm_lrs[:warm_steps]).round(3)).all()
+        assert warm_lrs[warm_steps - 1 : -1] == cosine_lrs


we need this, beacuse of shifting lrs if warmup_end_value == None

vfdev-5 · 2023-05-23T09:11:43Z

Let's make the test as following:

@pytest.mark.parametrize("warmup_end_value", [0.23, None])
@pytest.mark.parametrize("T_0", [1, 12])
@pytest.mark.parametrize("T_mult", [1, 3])
def test_create_lr_scheduler_with_warmup_cosine(warmup_end_value, T_0, T_mult):
    lr = 0.2
    steps = 200
    warm_steps = 50
    warm_start = 0.023

    def get_optim():
        t1 = torch.zeros([1], requires_grad=True)
        return torch.optim.SGD([t1], lr=lr)

    def get_cos_shed():
        return CosineAnnealingWarmRestarts(optimizer, T_0=T_0, T_mult=T_mult, verbose=False)

    optimizer = get_optim()
    scheduler = get_cos_shed()
    cosine_lrs = []
    for i in range(steps):
        cosine_lrs.append(optimizer.param_groups[0]["lr"])
        scheduler.step()

    optimizer = get_optim()
    scheduler = create_lr_scheduler_with_warmup(
        get_cos_shed(), warmup_start_value=warm_start, warmup_end_value=warmup_end_value, warmup_duration=warm_steps
    )

    warm_lrs = []
    for epoch in range(warm_steps + steps):
        scheduler(None)
        warm_lrs.append(optimizer.param_groups[0]["lr"])

    if warmup_end_value is not None:
        np.testing.assert_allclose(np.linspace(warm_start, warmup_end_value, warm_steps), warm_lrs[:warm_steps])
        assert warm_lrs[warm_steps:] == cosine_lrs
    else:
        np.testing.assert_allclose(np.linspace(warm_start, lr, warm_steps), warm_lrs[:warm_steps])
        assert warm_lrs[warm_steps - 1:-1] == cosine_lrs

…e_sched # Conflicts: # tests/ignite/handlers/test_param_scheduler.py

vfdev-5 · 2023-05-23T19:53:02Z

import matplotlib.pyplot as plt
import numpy as np
import torch
from torch.optim.lr_scheduler import CosineAnnealingWarmRestarts

from ignite.handlers import create_lr_scheduler_with_warmup


def plot(warmup_end_value):
    lr = 0.2
    warm_steps = 5
    steps = 100
    warm_start = 0.023

    def get_optim():
        t1 = torch.zeros([1], requires_grad=True)
        return torch.optim.SGD([t1], lr=lr)

    def get_cos_shed():
        return CosineAnnealingWarmRestarts(optimizer, T_0=10, T_mult=2, verbose=False)

    optimizer = get_optim()
    scheduler = get_cos_shed()
    cosine_lrs = []
    for i in range(steps):
        cosine_lrs.append(optimizer.param_groups[0]["lr"])
        scheduler.step()

    optimizer = get_optim()
    scheduler = create_lr_scheduler_with_warmup(
        get_cos_shed(), warmup_start_value=warm_start, warmup_end_value=warmup_end_value, warmup_duration=warm_steps
    )

    warm_lrs = []
    for epoch in range(warm_steps + steps):
        scheduler(None)
        warm_lrs.append(optimizer.param_groups[0]["lr"])

    if warmup_end_value is not None:
        plt.figure(figsize=(10, 5))
        plt.subplot(121)
        plt.title("create_lr_scheduler_with_warmup +\nCosineAnnealingWarmRestarts\nwarmup_end_value != lr")
        plt.plot(warm_lrs, "-*")
        plt.subplot(122)
        plt.title("CosineAnnealingWarmRestarts")
        plt.plot(cosine_lrs, "-*")        
        plt.show()
    else:
        plt.figure(figsize=(10, 5))
        plt.subplot(121)
        plt.title("create_lr_scheduler_with_warmup +\nCosineAnnealingWarmRestarts\nwarmup_end_value == lr")
        plt.plot(warm_lrs, "-*")
        plt.subplot(122)
        plt.title("CosineAnnealingWarmRestarts")
        plt.plot(cosine_lrs, "-*")        
        plt.show()


plot(None)
plot(.26)

vfdev-5

LGTM, thanks @AlexanderChaptykov for working on this issue!

AlexanderChaptykov and others added 18 commits April 14, 2023 00:46

remove codecov

bb5e244

RankProcessFirst

f56b362

annotations

5801dd5

Merge remote-tracking branch 'upstream/master'

34e77e7

from class to contextlib

86e564f

from class to contextlib and test

2f75b92

del test file

fcb555c

uniq folder for test

ccef9c2

refactor tests + new assert_test

37a9102

add to __all__, remove idist import

178c420

Apply suggestions from code review

1cef268

Merge branch 'master' into master

b2897a8

Apply suggestions from code review

3f7dd99

Update tests/ignite/distributed/utils/test_native.py

aea674d

Added local arg and renamed function

8c7cebc

Merge remote-tracking branch 'upstream/master'

01636e2

add proxy class

bdcbad4

annotation

8ca28fd

github-actions bot added the module: handlers Core Handlers module label May 8, 2023

vfdev-5 reviewed May 8, 2023

View reviewed changes

ignite/handlers/param_scheduler.py Outdated Show resolved Hide resolved

vfdev-5 changed the title ~~Bug cosine scheduler~~ Fixed parameter scheduler bug with CosineAnnealingWarmRestarts May 8, 2023

AlexanderChaptykov added 4 commits May 22, 2023 19:23

test, proxy class

92af29b

add optim

45da45b

name change

96cb1dc

Merge branch 'pytorch:master' into bug_cosine_sched

4a72e07

vfdev-5 reviewed May 22, 2023

View reviewed changes

vfdev-5 reviewed May 23, 2023

View reviewed changes

ignite/handlers/param_scheduler.py Outdated Show resolved Hide resolved

AlexanderChaptykov added 2 commits May 23, 2023 11:01

test upd/ setter

ea8b803

Merge remote-tracking branch 'origin/bug_cosine_sched' into bug_cosin…

83d22d9

…e_sched

vfdev-5 reviewed May 23, 2023

View reviewed changes

ignite/handlers/param_scheduler.py Outdated Show resolved Hide resolved

class fix

6e02a0f

vfdev-5 reviewed May 23, 2023

View reviewed changes

tests/ignite/handlers/test_param_scheduler.py Outdated Show resolved Hide resolved

Fixed mypy issues

165ed36

AlexanderChaptykov commented May 23, 2023

View reviewed changes

AlexanderChaptykov and others added 3 commits May 23, 2023 12:38

test upd

5c9b99d

Fixed failing test_lr_scheduler

4445b02

Merge remote-tracking branch 'origin/bug_cosine_sched' into bug_cosin…

971fc64

…e_sched # Conflicts: # tests/ignite/handlers/test_param_scheduler.py

vfdev-5 approved these changes May 23, 2023

View reviewed changes

vfdev-5 merged commit e9e5b45 into pytorch:master May 23, 2023
13 of 18 checks passed

vfdev-5 mentioned this pull request May 23, 2023

WarmRestarts seems not working with create_lr_scheduler_with_warmup function #2910

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fixed parameter scheduler bug with `CosineAnnealingWarmRestarts` #2938

Fixed parameter scheduler bug with `CosineAnnealingWarmRestarts` #2938

AlexanderChaptykov commented May 8, 2023 •

edited

vfdev-5 left a comment

AlexanderChaptykov May 23, 2023

vfdev-5 commented May 23, 2023

vfdev-5 commented May 23, 2023

vfdev-5 left a comment

Fixed parameter scheduler bug with CosineAnnealingWarmRestarts #2938

Fixed parameter scheduler bug with CosineAnnealingWarmRestarts #2938

Conversation

AlexanderChaptykov commented May 8, 2023 • edited

vfdev-5 left a comment

Choose a reason for hiding this comment

AlexanderChaptykov May 23, 2023

Choose a reason for hiding this comment

vfdev-5 commented May 23, 2023

vfdev-5 commented May 23, 2023

vfdev-5 left a comment

Choose a reason for hiding this comment

Fixed parameter scheduler bug with `CosineAnnealingWarmRestarts` #2938

Fixed parameter scheduler bug with `CosineAnnealingWarmRestarts` #2938

AlexanderChaptykov commented May 8, 2023 •

edited