In [2]:
%load_ext autoreload
%autoreload 2

In [3]:
import json
import cv2
import numpy as np

from torch.utils.data import Dataset

In [4]:
class MyDataset(Dataset):
    def __init__(self):
        self.data = []
        with open('./training/fill50k/prompt.json', 'rt') as f:
            for line in f:
                self.data.append(json.loads(line))

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        item = self.data[idx]

        source_filename = item['source']
        target_filename = item['target']
        prompt = item['prompt']

        source = cv2.imread('./training/fill50k/' + source_filename)
        target = cv2.imread('./training/fill50k/' + target_filename)

        # Do not forget that OpenCV read images in BGR order.
        source = cv2.cvtColor(source, cv2.COLOR_BGR2RGB)
        target = cv2.cvtColor(target, cv2.COLOR_BGR2RGB)

        # Normalize source images to [0, 1].
        source = source.astype(np.float32) / 255.0

        # Normalize target images to [-1, 1].
        target = (target.astype(np.float32) / 127.5) - 1.0

        return dict(jpg=target, txt=prompt, hint=source)

In [5]:
ds = MyDataset()

In [6]:
len(ds)

50000

In [10]:
import pytorch_lightning as pl
from torch.utils.data import DataLoader
from cldm.logger import ImageLogger
from cldm.model import create_model, load_state_dict

In [None]:
# Configs
batch_size = 4
logger_freq = 300
learning_rate = 1e-5
sd_locked = True
only_mid_control = False


# First use cpu to load models. Pytorch Lightning will automatically move it to GPUs.
model_name = 'control_v11p_sd15_scribble'
model = create_model(f'./models/{model_name}.yaml').cpu()
# load main weights
model.load_state_dict(load_state_dict('./models/v1-5-pruned.ckpt', location='cpu'), strict=False)
# load controlnet weights
model.load_state_dict(load_state_dict(f'./models/{model_name}.pth', location='cpu'), strict=False)

model.learning_rate = learning_rate
model.sd_locked = sd_locked
model.only_mid_control = only_mid_control


# Misc
dataset = MyDataset()
dataloader = DataLoader(dataset, num_workers=0, batch_size=batch_size, shuffle=True)
logger = ImageLogger(batch_frequency=logger_freq)
trainer = pl.Trainer(accelerator="gpu", devices=[2], precision=32, callbacks=[logger])


# Train!
trainer.fit(model, dataloader)

ControlLDM: Running in eps-prediction mode
DiffusionWrapper has 859.52 M params.
making attention of type 'vanilla' with 512 in_channels
Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
making attention of type 'vanilla' with 512 in_channels


Some weights of the model checkpoint at openai/clip-vit-large-patch14 were not used when initializing CLIPTextModel: ['vision_model.encoder.layers.19.self_attn.v_proj.bias', 'vision_model.encoder.layers.5.self_attn.q_proj.bias', 'vision_model.encoder.layers.20.mlp.fc1.bias', 'vision_model.encoder.layers.2.layer_norm1.weight', 'vision_model.encoder.layers.7.self_attn.out_proj.weight', 'vision_model.encoder.layers.14.self_attn.v_proj.bias', 'vision_model.encoder.layers.17.self_attn.k_proj.weight', 'vision_model.encoder.layers.22.self_attn.q_proj.bias', 'vision_model.encoder.layers.1.self_attn.out_proj.weight', 'vision_model.encoder.layers.23.mlp.fc2.weight', 'vision_model.encoder.layers.11.mlp.fc1.weight', 'vision_model.encoder.layers.22.self_attn.k_proj.weight', 'vision_model.encoder.layers.2.mlp.fc2.weight', 'vision_model.encoder.layers.23.self_attn.out_proj.weight', 'vision_model.encoder.layers.15.mlp.fc1.weight', 'vision_model.encoder.layers.14.self_attn.q_proj.bias', 'vision_model.e

Loaded model config from [./models/control_v11p_sd15_scribble.yaml]
Loaded state_dict from [./models/v1-5-pruned.ckpt]
Loaded state_dict from [./models/control_v11p_sd15_scribble.pth]


GPU available: True, used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]

  | Name              | Type               | Params
---------------------------------------------------------
0 | model             | DiffusionWrapper   | 859 M 
1 | first_stage_model | AutoencoderKL      | 83.7 M
2 | cond_stage_model  | FrozenCLIPEmbedder | 123 M 
3 | control_model     | ControlNet         | 361 M 
---------------------------------------------------------
1.2 B     Trainable params
206 M     Non-trainable params
1.4 B     Total params
5,710.058 Total estimated model params size (MB)


Training: 0it [00:00, ?it/s]

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:48,  1.02it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:42,  1.14it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:39,  1.18it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:38,  1.21it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.24it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.24it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.24it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.24it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.23it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:39,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.24it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.24it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:37,  1.24it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.24it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.24it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.24it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.24it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:38,  1.24it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.24it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                          | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                               | 1/50 [00:00<00:39,  1.23it/s][A
DDIM Sampler:   4%|█████▊                                                                                                                                            | 2/50 [00:01<00:39,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                         | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▋                                                                                                                                      | 4/50 [00:03<00:37,  1.23it/s][A

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 44/50 [00:35<00:04,  1.23it/s][A


Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.23it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.23it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.24it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.24it/s

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.23it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.23it/s

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.23it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.24it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.23it/s

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.23it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.23it/s

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.23it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.23it/s

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:38,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.23it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.23it/s

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:38,  1.24it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.24it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.23it/s

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.23it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:39,  1.23it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.23it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.23it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.23it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.23it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.23it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.23it/s

Data shape for DDIM sampling is (4, 4, 64, 64), eta 0.0
Running DDIM Sampling with 50 timesteps



DDIM Sampler:   0%|                                                                                                                                                           | 0/50 [00:00<?, ?it/s][A
DDIM Sampler:   2%|██▉                                                                                                                                                | 1/50 [00:00<00:39,  1.24it/s][A
DDIM Sampler:   4%|█████▉                                                                                                                                             | 2/50 [00:01<00:38,  1.24it/s][A
DDIM Sampler:   6%|████████▊                                                                                                                                          | 3/50 [00:02<00:38,  1.24it/s][A
DDIM Sampler:   8%|███████████▊                                                                                                                                       | 4/50 [00:03<00:37,  1.23it/

DDIM Sampler:  80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                             | 40/50 [00:32<00:08,  1.24it/s][A
DDIM Sampler:  82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 41/50 [00:33<00:07,  1.24it/s][A
DDIM Sampler:  84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 42/50 [00:34<00:06,  1.23it/s][A
DDIM Sampler:  86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 43/50 [00:34<00:05,  1.24it/s][A
DDIM Sampler:  88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 44/50 [00:35<00:04,  1.24it/s