DDPM MNIST 手寫數字生成

從零實作 Denoising Diffusion Probabilistic Model (DDPM)，用於生成 MNIST 手寫數字圖片。

環境設定

需要 uv 管理 Python 環境。

uv sync

訓練

# 使用預設參數訓練
uv run python train.py

# 自訂訓練參數
uv run python train.py --epochs 50 --lr 1e-4 --batch-size 256

# 從已有的 checkpoint 繼續訓練
uv run python train.py --resume ddpm_mnist.pt --epochs 10

訓練過程中會在 samples/ 資料夾定期儲存：

epoch_{N}.png — 10×8 數字網格圖（每個數字 8 張）
denoise_epoch_{N}.png — 去噪過程視覺化（每個數字一列，從純噪音到最終結果）

訓練結束後模型權重儲存為 ddpm_mnist.pt。

訓練參數

參數	預設值	說明
`--epochs`	`20`	訓練輪數
`--batch-size`	`128`	訓練批次大小
`--lr`	`2e-4`	學習率
`--timesteps`	`1000`	擴散時間步數
`--base-channels`	`64`	UNet 基礎通道數
`--sample-interval`	`5`	每 N 個 epoch 儲存一次樣本
`--guidance-scale`	`3.0`	取樣時的 classifier-free guidance 強度
`--num-workers`	`2`	DataLoader 工作程序數
`--output-dir`	`samples/`	樣本圖片輸出資料夾
`--save-path`	`ddpm_mnist.pt`	模型權重儲存路徑
`--resume`	—	從指定 checkpoint 繼續訓練

推論

使用訓練好的模型生成數字：

# 生成所有數字（0-9），每個數字 100 張
uv run python inference.py

# 只生成特定數字
uv run python inference.py --digits 3 7

# 調整每個數字的生成數量
uv run python inference.py --per-digit 500

# 儲存預覽網格圖
uv run python inference.py --save-grid

# 儲存去噪過程視覺化
uv run python inference.py --save-denoising

# 調整去噪過程的快照數量（預設 9 個中間步驟）
uv run python inference.py --save-denoising --denoising-steps 15

推論參數

參數	預設值	說明
`--checkpoint`	`ddpm_mnist.pt`	模型權重路徑
`--digits`	`0-9`	要生成的數字
`--per-digit`	`100`	每個數字的生成數量
`--batch-size`	`64`	生成批次大小
`--guidance-scale`	`3.0`	Classifier-free guidance 強度
`--output-dir`	`generated/`	輸出資料夾
`--save-grid`	關	儲存每個數字的預覽網格圖
`--save-denoising`	關	儲存去噪過程視覺化
`--denoising-steps`	`9`	去噪視覺化的中間快照數量
`--save-pt`	開	儲存為 `.pt` 張量資料集

專案結構

ddpm.py       — 模型架構（UNet）與擴散排程（DiffusionSchedule）
train.py      — 訓練迴圈與取樣邏輯
inference.py  — 推論腳本，生成數字與去噪過程視覺化

架構概覽

UNet：編碼器-瓶頸-解碼器結構，含跳躍連接
- 通道數：64 → 128 → 256
- 在 14×14 解析度加入自注意力機制
- 透過正弦位置編碼注入時間步資訊
擴散排程：線性 β 排程（1e-4 至 0.02），共 1000 步
- 前向過程：逐步加噪
- 反向過程：逐步去噪生成圖片

預設超參數

參數	預設值
時間步數 T	1000
β 範圍	[1e-4, 0.02]
基礎通道數	64
批次大小	128
學習率	2e-4
訓練輪數	20

所有超參數均可透過命令列參數覆寫，詳見上方訓練參數表。

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
ddpm.py		ddpm.py
inference.py		inference.py
main.py		main.py
pyproject.toml		pyproject.toml
train.py		train.py
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DDPM MNIST 手寫數字生成

環境設定

訓練

訓練參數

推論

推論參數

專案結構

架構概覽

預設超參數

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

DDPM MNIST 手寫數字生成

環境設定

訓練

訓練參數

推論

推論參數

專案結構

架構概覽

預設超參數

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages