🧩 Deepspeed-diffusers

Read this in English.

deepspeed-diffusers 是一个结合Deepspeed和Diffusers库来训练扩散模型（Diffusion Models）的项目。

Diffusers是目前最受欢迎的预训练扩散模型的首选集成库。然而由于产品的绑定，许多用于Diffusers 并行训练的脚本绝大部分都是通过Huggingface另一个产品Accelerate集成的。

Important

Accelerate同样也是一个统一API操作的库，但截止目前本项目的发布，Accelerate明确表示并不完全支持Deepspeed。

并且让人疑惑的是，Deepspeed仓库中用来示例Stable Diffusion的脚本竟然是Accelerate?🤔

为了充分发挥Deepspeed的能力，本项目就这么诞生了。

此外，本项目也借鉴了OvJat 、afiaka87、liucongg ，在此感谢这些项目的付出！

在这些项目中，本项目的优势是：

充分使用Deepspeed的能力
与主流的Diffusers对齐
流程完整，包含各种额外脚本
等等，等待您的发掘~

演示

安装依赖

在运行脚本之前，请确定安装了所有的依赖：

请保证源码是最新的：git clone https://github.com/dyedd/deepspeed-diffusers
然后cd到文件夹并运行：pip -r install requirements.txt

宝可梦数据集示例

推荐直接把数据集下载到本地，否则通过脚本自动下载的是缓存文件，每次运行都要去请求huggingface。

根据下载的目录，修改cfg.json的dataset_dir内容。

下载权重

接下来的示例结果都是在stable-diffusion-1.5的权重下实验的。

注意：如果您使用 stable-diffusion-2 768x768 模型，请将cfg.json的resolution更改为 768。

在此，仍然强烈您自己git clone权重，不要通过huggingface自动下载~然后修改cfg.json的pretrained_model_name_or_path。

训练

本项目支持2种训练模式。

全量微调unet，在混合精度下，迭代210次，显存大致在12到20GB。
lora+unet，在混合精度下，迭代210次，显存大致在4到9.63GB。

将cfg.json的use_lora.action修改成true即可支持模式2。

此外，模式2的权重模型保存在use_lora.output_dir，模式1保存在output_dir，名称都为ckpt_name。

cfg.json的配置其实都很清楚(key就是原意)，从use_fp16 开始都是与deespeed有关的配置，如果有添加，不要忘记同时修改deepspeed_config,py。

如果你在本地，可以直接通过bash train.sh运行脚本；

如果你在slurm系统，在修改部分信息后，可以通过sbatch slurm.sh下提交。

可能出现的问题

Note

1. 生成的图像都是黑色图片或者报错RuntimeWarning: invalid value encountered in cast images = (images * 255).round().astype("uint8")

请注意，本项目发布的cfg.json中关于优化器，学习率的参数仅对于宝可梦这个数据集而言。这个问题是因为优化器，学习率不适合训练集，而造成训练的损失一直是none。

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
README.md		README.md
README_en.md		README_en.md
cfg.json		cfg.json
cleanup_except_latest.py		cleanup_except_latest.py
custom_dataset.py		custom_dataset.py
deepspeed_config.py		deepspeed_config.py
ds_sd_train.py		ds_sd_train.py
inference.py		inference.py
model.py		model.py
requirements.txt		requirements.txt
slurm.sh		slurm.sh
train.sh		train.sh
utils.py		utils.py

dyedd/deepspeed-diffusers

Folders and files

Latest commit

History

Repository files navigation

🧩 Deepspeed-diffusers

最近更新 🔥

演示

安装依赖

宝可梦数据集示例

下载权重

训练

可能出现的问题

性能展示

About

Topics

Resources

Stars

Watchers

Forks

Languages