GitHub - marianapraz/polyakSGD: Repository for Polyak SGD

This is a repository for Polyak SGD. Polyak SGD adapts Polyak's step size to stochastic gradients. For a more detailed explanation see https://arxiv.org/abs/1903.08688 (currently under review in Journal of Scientific Computing ).

The repository is divided into several parts:

The folder optim/ contains the optimizer code for PolyakSGD.
The example.py script contains an example for training and testing LeNet model for MNIST. The implementation of LeNet is in models/ and the data is imported via the dataloader.py script.

Optimizing using Polyak's step size for stochastic gradients

Import the optimizer from optim/ and use the usual script from pytorch.

from torch import nn
from models import LeNet
from optim import PolyakSGD

model = LeNet()
loss_fn = nn.CrossEntropy()
optimizer = PolyakSGD(model.parameters())

# Get training data x, labels y ...

yhat = model(x)
loss = loss_fn(yhat,y) 

# Now run .backward(), update the model, etc ... and
optimizer.step(runavg_loss)
# Define this runavg_loss depending on the problem. Could be replaced by a true training loss if available.

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
models		models
optim		optim
.gitignore		.gitignore
README.md		README.md
dataloader.py		dataloader.py
example.py		example.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Optimizing using Polyak's step size for stochastic gradients

About

Releases

Packages

Languages

marianapraz/polyakSGD

Folders and files

Latest commit

History

Repository files navigation

Optimizing using Polyak's step size for stochastic gradients

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages