GitHub - Wanghley/stepdrop-tiny-diffusion: We introduce a stochastic step skipping method designed to accelerate inference in tiny diffusion models, enabling faster generation on resource-constrained devices.

StepDrop

Stochastic Step Skipping in Tiny Diffusion Models
Explore the Demo Notebook »

Table of Contents

About The Project
Built With
Getting Started
Quick Start
Pipeline Script
Training
Sampling
Evaluation & Benchmarking
Interpreting Metrics
StepDrop Skip Strategies
Visualization Utilities
Project Structure
Roadmap
Contributing
License
Contact
Acknowledgments

About The Project

StepDrop is a novel sampling method designed to accelerate inference in diffusion models, particularly tiny ones. By introducing a stochastic step skipping technique, it significantly reduces the number of required sampling steps while maintaining high-quality image generation.

This repository contains the official implementation, experiments, and demo notebooks for the StepDrop project.

Name		Name	Last commit message	Last commit date
Latest commit History 109 Commits
docs		docs
results/2025-12-07_23-17-13		results/2025-12-07_23-17-13
scripts		scripts
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
app.py		app.py
help_check.txt		help_check.txt
requirements.txt		requirements.txt

Flag	Description
`--train`	Run training stage
`--sample`	Run sampling stage
`--evaluate`	Run evaluation/benchmarking
`--all`	Run all stages (train → sample → evaluate)
`--clean`	Clean generated files

Option	Default	Description
`--dataset`	`cifar10`	Dataset: `mnist`, `cifar10`, `custom`
`--epochs`	`50`	Training epochs
`--batch-size`	`128`	Training batch size
`--base-channels`	`64`	U-Net base channels
`--checkpoint`	auto	Path to model checkpoint
`--n-samples`	`64`	Number of samples to generate
`--method`	`ddim`	Sampling method: `ddpm`, `ddim`, `stepdrop`
`--eval-samples`	`1000`	Samples for FID/IS evaluation
`--device`	`cuda`	Device: `cuda` or `cpu`

Argument	Default	Description
`--dataset`	`mnist`	Dataset: `mnist`, `cifar10`, `custom`
`--custom_data_dir`	`None`	Path to custom images folder
`--img_size`	`28`	Image size
`--channels`	`1`	Number of image channels
`--batch_size`	`128`	Training batch size
`--epochs`	`20`	Number of epochs
`--lr`	`2e-4`	Learning rate
`--n_timesteps`	`1000`	Diffusion timesteps
`--schedule_type`	`cosine`	Noise schedule: `linear`, `cosine`
`--base_channels`	`64`	U-Net base channels
`--save_path`	`checkpoints/model.pt`	Model save path
`--resume`	`None`	Resume from checkpoint

Method	Command	Description
DDPM	`--method ddpm`	Full 1000 steps, highest quality
DDIM	`--method ddim --ddim_steps 50`	Accelerated, deterministic
StepDrop	`--method stepdrop --skip_prob 0.3`	Stochastic step skipping
Adaptive StepDrop	`--method adaptive_stepdrop`	Error-based dynamic skipping

Argument	Default	Description
`--checkpoint`	required	Path to trained model
`--method`	`ddpm`	Sampling method
`--n_samples`	`16`	Number of samples
`--ddim_steps`	`50`	DDIM inference steps
`--ddim_eta`	`0.0`	DDIM stochasticity (0 = deterministic)
`--skip_prob`	`0.3`	StepDrop skip probability
`--skip_strategy`	`linear`	StepDrop strategy
`--output_dir`	`samples`	Output directory
`--save_grid`	`True`	Save as image grid
`--save_individual`	`False`	Save individual images

Metric	Full Name	Goal	Description
FID	Fréchet Inception Distance	📉 Lower is better	Similarity to real dataset. <10: excellent, 10-30: good, >50: poor
IS	Inception Score	📈 Higher is better	Clarity and diversity. CIFAR-10 real data ≈ 11.0
KID	Kernel Inception Distance	📉 Lower is better	Similar to FID, less biased for small samples
Precision	-	📈 Higher is better	Quality: are generated images realistic?
Recall	-	📈 Higher is better	Diversity: does the model cover the data distribution?
LPIPS	Perceptual Similarity	📉 Lower is better	Perceptual distance (diversity among samples)
Throughput	Images/Second	📈 Higher is better	Generation speed
NFE	Number of Function Evaluations	📉 Lower is better	U-Net forward passes per image

Strategy	Formula	Description
`constant`	$P(t) = p$	Fixed skip probability
`linear`	$P(t) = p \cdot 4t(1-t)$	Parabolic peak at middle
`cosine_sq`	$P(t) = p \cdot \sin^2(\pi t)$	Smooth cosine curve
`quadratic`	$P(t) = p \cdot 16t^2(1-t)^2$	Sharper middle peak
`early_skip`	$P(t) = p \cdot t$	Skip more at high noise
`late_skip`	$P(t) = p \cdot (1-t)$	Skip more at low noise
`critical_preserve`	Variable	Protect [0.3, 0.7] interval

Folders and files

Latest commit

History

Repository files navigation

StepDrop

About The Project

Built With

Getting Started

Prerequisites

Installation

Quick Start

Interactive Menu

One-Command Pipeline

Quick Test

Pipeline Script

Usage

Pipeline Stages

Common Options

Examples

Training

Direct Training Script

Training Options

Resume Training

Sampling

Direct Sampling Script

Sampling Methods

Sampling Options

Examples

Evaluation & Benchmarking

Benchmark Script

Via Pipeline

Output

Interpreting Metrics

StepDrop Skip Strategies

Probability-Based Strategies (StepDropSampler)

Adaptive Strategy (AdaptiveStepDropSampler)

Target NFE Strategy (TargetNFEStepDropSampler)

Visualization Utilities

Generate Comparison Grid

Visualize Schedules

Benchmark Plots

Denoising Evolution

Efficiency Plots

Project Structure

HPC / SLURM Support

Roadmap

Contributing

License

Contact

Acknowledgments

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Probability-Based Strategies (`StepDropSampler`)

Adaptive Strategy (`AdaptiveStepDropSampler`)

Target NFE Strategy (`TargetNFEStepDropSampler`)

Packages