# Tutorial6: Stable_diffusion

本节旨在展示使用 [stable-diffusion-3-medium-diffusers](https://huggingface.co/stabilityai/stable-diffusion-3-medium-diffusers) 模型进行文生图任务。

分以下几步来实现：
1. 环境安装与应用创建
2. 下载模型
3. 文生图

Stable Diffusion 是由 Stability AI 开发的一个开源的深度学习模型，用于生成高质量图像。

## 1. 环境安装与应用创建

我们默认用户已经按照 [tutorial_scow_for_ai](../tutorial_scow_for_ai.md) 在 “交互式应用” 中创建了  Jupyter Lab 应用，并已经安装了 conda。现在需要在命令行中创建环境并注册 ipykernal：

```bash
conda create -n tutorial6 python=3.9
conda activate tutorial6
# 安装内核
conda install ipykernel
# 注册内核
python -m ipykernel install --user --name=tutorial6 --display-name="tutorial6"

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
pip install numpy==1.26.4 matplotlib==3.8.4 transformers==4.42.4
pip install -U diffusers
```

打开本 .ipynb 文件并选择 kernel 为 tutorial6。硬件资源为 1 张 A100 显卡。创建应用后, 进入应用并打开本文件。

CUDA Version: 12.1; Torch Version: 2.3.1

## 2. 下载模型

在data shell 中执行，命令执行位置在当前文件所在的文件夹。

```bash
# 如果以下目录存在， 可以直接复制:
cp -r /lustre/public/tutorial/models/models--stabilityai--stable-diffusion-3-medium-diffusers/ ./

# 否则请下载, 其中 "hf_***" 是 huggingface 官网为每个用户提供的 token 序列
export HF_ENDPOINT=https://hf-mirror.com
huggingface-cli download --token hf_*** --resume-download stabilityai/stable-diffusion-3-medium --local-dir models--stabilityai--stable-diffusion-3-medium-diffusers
```

## 3. 文生图

运行以下代码，从文字生成图像：

In [None]:
import torch
from diffusers import StableDiffusion3Pipeline

# 加载模型
pipe = StableDiffusion3Pipeline.from_pretrained("models", torch_dtype=torch.float16)

# 使用 GPU
pipe = pipe.to("cuda")

# promt 内容，可以使用多个 prompt
# prompt2 = "Photorealistic"
prompt = "Albert Einstein leans forward, holds a Qing dynasty fan. A butterfly lands on the blooming peonies in the garden. The fan is positioned above the butterfly. "

# 根据 prompt 生成多张图片
for i in range(10):
    image = pipe(
            prompt=prompt,
            # prompt_2=prompt2,
            negative_prompt="ugly, deformed, disfigured, poor details, bad anatomy",
            num_inference_steps=70,
            guidance_scale=7,
            height=1024,
            width=1024,
        ).images[0]

    image.save(f"{i}.png")

生成的图像在本地目录下，可点击或下载查看。

---

> 作者: 黎颖; 龙汀汀
>
> 联系方式: yingliclaire@pku.edu.cn;   l.tingting@pku.edu.cn