In [1]:
!nvidia-smi
!which python | grep DYY

Mon Sep 16 16:20:07 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.86.10              Driver Version: 535.86.10    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  Tesla V100-SXM2-32GB           On  | 00000004:04:00.0 Off |                    0 |
| N/A   42C    P0              44W / 300W |      0MiB / 32768MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                    

In [2]:
import torch
torch.manual_seed(3407)
torch.backends.cudnn.deterministic = True

# Model

In [3]:
# import torch
# import torch.nn as nn
# import torch.nn.functional as F

# class SinousEmbedding(nn.Module):
#     def __init__(self, dim) -> None:
#         super().__init__()
#         assert dim%2==0,NotImplementedError()
#         self.angles = (1000.**(-2/dim))**torch.arange(1,dim//2+1,1,dtype=torch.float).cuda()
#         self.angles.requires_grad_(False)
#     def forward(self,x):
#         angles = torch.einsum('m,i->im',self.angles,x.float())
#         return torch.cat((torch.sin(angles),torch.cos(angles)),dim=1)

# class DDPM(nn.Module):
#     def __init__(self, *args, **kwargs) -> None:
#         super().__init__(*args, **kwargs)
#         self.in_size = 28 * 28
#         self.t_embedding_dim = 256
#         self.t_embedding = SinousEmbedding(dim=self.t_embedding_dim)
#         self.up = nn.ModuleList([
#             nn.Sequential(
#                 nn.Linear(784+self.t_embedding_dim,64),
#                 nn.ReLU(),
#             ),
#             nn.Sequential(
#                 nn.Linear(64,32),
#                 nn.ReLU(),
#             ),
#             # nn.Sequential(
#             #     nn.Linear(256,256),
#             #     # nn.LeakyReLU(0.1),
#             # ),
#         ])
#         self.middle = nn.ModuleList([
#             nn.Linear(32,32),
#             # nn.LeakyReLU(0.1),
#         ])
#         self.down= nn.ModuleList([
#             nn.Sequential(
#                 nn.Linear(32,32),
#                 nn.ReLU(),
#             ),
#             # nn.Sequential(
#             #     nn.Linear(256,256),
#             #     # nn.LeakyReLU(0.1),
#             # ),
#             nn.Sequential(
#                 nn.Linear(32,64),
#                 nn.ReLU(),
#             ),
#         ])
#         self.end_mlp = nn.Linear(64,784)
#         self.apply_init()

#     def apply_init(self):
#         for m in self.modules():
#             if isinstance(m, nn.Linear):
#                 nn.init.xavier_normal_(m.weight)
#                 nn.init.constant_(m.bias, 0)

#     def forward(self,x,t):
#         x = x.reshape(-1,784)
#         ttensor = self.t_embedding(t) # [batch, 256]
#         batch = x.shape[0]
#         xc = x.clone()
#         ups = []
#         x = torch.cat((x,ttensor),dim=-1)
#         for ly in self.up:
#             x = ly(x)
#             ups.append(x.clone())
#         for ly in self.middle:
#             x = ly(x)
#         for ly in self.down:
#             x = ly(x) + ups.pop()

#         x = self.end_mlp(x)
#         x = (x + xc)
#         return x

In [4]:
import torch
import torch.nn as nn
import torch.nn.functional as F

class SinousEmbedding(nn.Module):
    def __init__(self, dim) -> None:
        super().__init__()
        assert dim%2==0,NotImplementedError()
        self.angles = (1000.**(-2/dim))**torch.arange(1,dim//2+1,1,dtype=torch.float).cuda()
        self.angles.requires_grad_(False)
    def forward(self,x):
        angles = torch.einsum('m,i->im',self.angles,x.float())
        return torch.cat((torch.sin(angles),torch.cos(angles)),dim=1)

class F_x_t(nn.Module):

    def __init__(self,in_channels,out_channels,out_size,kernel_size=3,t_shape=64) -> None:
        super().__init__()
        # self.t_channels = out_channels // 2
        # self.conv_channels = out_channels - self.t_channels
        self.t_channels = out_channels
        self.conv_channels = out_channels
        self.conv = nn.Conv2d(in_channels, self.conv_channels, kernel_size=kernel_size, padding=kernel_size//2)
        self.out_size = out_size
        self.fc = nn.Linear(t_shape, self.t_channels)
        # self.fc = nn.Embedding(t_shape, self.t_num)

    def forward(self, x, t):
        if self.t_channels == 0:
            raise NotImplementedError()
            return self.conv(x)
        # return torch.cat([self.conv(x),self.fc(t).unsqueeze(-1).unsqueeze(-1).expand(t.shape[0], self.t_channels, self.out_size, self.out_size)],dim=1).relu()
        return (self.conv(x) + self.fc(t).unsqueeze(-1).unsqueeze(-1).expand(t.shape[0], self.t_channels, self.out_size, self.out_size)).relu()

class DDPM(nn.Module):
    def __init__(self, *args, **kwargs) -> None:
        super().__init__(*args, **kwargs)
        self.t_embedding_dim = 32
        self.t_embedding = SinousEmbedding(dim=self.t_embedding_dim)
        self.up= nn.ModuleList([
            F_x_t(in_channels=1,out_channels=32,out_size=32,kernel_size=3,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=32,out_channels=64,out_size=16,kernel_size=3,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=64,out_channels=128,out_size=8,kernel_size=3,t_shape=self.t_embedding_dim),
            # F_x_t(in_channels=128,out_channels=128,out_size=4,kernel_size=1,t_shape=self.t_embedding_dim),
        ])
        self.middle = nn.ModuleList([
            # nn.Identity()
            F_x_t(in_channels=128,out_channels=128,out_size=4,kernel_size=1,t_shape=self.t_embedding_dim),
        ])
        self.down= nn.ModuleList([
            # F_x_t(in_channels=128,out_channels=128,out_size=2,kernel_size=1,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=128,out_channels=64,out_size=8,kernel_size=3,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=64,out_channels=32,out_size=16,kernel_size=3,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=32,out_channels=16,out_size=32,kernel_size=3,t_shape=self.t_embedding_dim),
        ])
        # self.end_mlp = nn.Conv2d(32,1,kernel_size=3,padding=1)
        self.end_mlp = nn.Conv2d(16,1,kernel_size=1)
        self.apply_init()
    
    def apply_init(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight)
                nn.init.constant_(m.bias, 0)
            if isinstance(m, nn.Linear):
                nn.init.xavier_normal_(m.weight)
                nn.init.constant_(m.bias, 0)

    def forward(self,x,t):
        x = x.reshape(-1,1,28,28)
        x = F.pad(x,(2,2,2,2),mode='constant',value=0)
        ttensor = self.t_embedding(t) # [batch, 256]
        batch = x.shape[0]
        # xc = x.clone()
        ups = []
        for ly in self.up:
            x = ly(x,ttensor)
            ups.append(x.clone()) # append: 28x28, 14x14
            x = nn.AvgPool2d(2)(x)
        for ly in self.middle:
            x = ly(x,ttensor)
        for ly in self.down:
            x = nn.Upsample(scale_factor=2)(x) + ups.pop() # 14x14, 28x28
            x = ly(x,ttensor)
            # x = nn.Upsample(scale_factor=2)(x) + ups.pop()
        x = self.end_mlp(x)
        x = x[:,:,2:30,2:30]
        return x.reshape(batch,28*28)

# Train

In [7]:
import sys
import os

parent_dir = os.path.abspath('/home/zhh24/DeepLearning')

sys.path.append(parent_dir)
print('appended',parent_dir)

import utils

from tqdm import tqdm
import torch
import torch.nn.functional as F
import torchvision.utils

device = 'cuda' if torch.cuda.is_available() else 'cpu'

mnist = utils.MNIST(batch_size=512)
train_loader = mnist.train_dataloader
valid_loader = mnist.valid_dataloader
T=500
beta1=3e-4 # variance of lowest temperature
betaT=2e-2 # variance of highest temperature
# step = torch.log(torch.tensor(betaT/beta1))/(T-1)
# betas = beta1 * torch.exp(step*torch.arange(T,dtype=torch.float).to(device))
step = (betaT-beta1)/(T-1)
betas = torch.arange(T,dtype=torch.float,device=device) * step + beta1


alphas = 1-betas
alpha_bars = alphas.clone()
for i in range(1,T):
    alpha_bars[i] *= alpha_bars[i-1]
print(alpha_bars)
# print(alphas)

sqrt = torch.sqrt
sigmas = sqrt(betas * (1-alpha_bars / alphas)/(1-alpha_bars))

@torch.no_grad()
def sample(model:DDPM,save_dir):
    x = torch.randn([100,784]).to(device)
    for t in range(T-1,-1,-1):
        sigmaz = torch.randn_like(x)*sigmas[t]
        if t==0:
            sigmaz = 0
        x = (x-(1-alphas[t])/(sqrt(1-alpha_bars[t]))*model(x,t*torch.ones(x.shape[0],dtype=torch.long,device=device)))/(sqrt(alphas[t]))+sigmaz
        # x = torch.clamp(x,0,1)
    grid = torchvision.utils.make_grid(post_process(x).reshape(-1,1,28,28).cpu(), nrow=10)
    torchvision.utils.save_image(grid, save_dir)

@torch.no_grad()
def visualize(model,save_dir):
    x = torch.randn([10,784]).to(device)
    x_history = []
    for t in range(T-1,-1,-1):
        sigmaz = torch.randn_like(x)*((betas[t])**0.5).to(device)
        if t==0:
            sigmaz = 0
        x = (x-(1-alphas[t])/(sqrt(1-alpha_bars[t]))*model(x,t*torch.ones(x.shape[0],dtype=torch.long,device=device)))/(sqrt(alphas[t]))+sigmaz
        # x = torch.clamp(x,0,1)
        x_history.append(x)
    # print('cat.shape',torch.cat(x_history,dim=0).shape)
    grid = torchvision.utils.make_grid(post_process(torch.cat(x_history,dim=0)[3::4,...]).reshape(-1,1,28,28).cpu(), nrow=10)
    torchvision.utils.save_image(grid, save_dir)
    print('Saved visualize to',os.path.abspath(save_dir))

def pre_process(x):
    # do the logit transform
    # return (torch.log(x+1e-3)-torch.log(1-x+1e-3))
    return (x+1)/2

def post_process(x):
    # return torch.sigmoid(x)
    return x*2-1

def train(epochs,model:DDPM,optimizer,eval_interval=5):
    for epoch in range(epochs):
        model.train()
        with tqdm(train_loader) as bar:
            losses = []
            for x,_ in bar:
                x = pre_process(x.to(device))
                epss = torch.randn_like(x).reshape(-1,784).to(device)
                ts = torch.randint(0,T,(x.shape[0],),device=device,dtype=torch.long)
                alpha_tbars = alpha_bars[ts]
                value = (sqrt(alpha_tbars).reshape(-1,1,1,1)*x).reshape(-1,784)+sqrt(1-alpha_tbars).reshape(-1,1)*epss
                out = model(value,ts) # [batch,784]
                # loss = ((epss-out).pow(2).mean(dim=-1) * (betas[ts])/(2*alphas[ts]*(1-alpha_tbars))).sum(dim=0)
                loss = (epss-out).pow(2).mean(dim=-1).mean(dim=0)

                optimizer.zero_grad()
                loss.backward()
                optimizer.step()
                losses.append(loss.item())
                bar.set_description('epoch {}, loss {:.4f}'.format(epoch,sum(losses)/len(losses)))
        model.eval()
        with torch.no_grad():
            with tqdm(valid_loader) as bar:
                mses = []
                losses = []
                for x,_ in bar:
                    x = pre_process(x.to(device))
                    epss = torch.randn_like(x).reshape(-1,784).to(device)
                    ts = torch.randint(0,T,(x.shape[0],),device=device,dtype=torch.long)
                    alpha_tbars = alpha_bars[ts]
                    value = (sqrt(alpha_tbars).reshape(-1,1,1,1)*x).reshape(-1,784)+sqrt(1-alpha_tbars).reshape(-1,1)*epss
                    out = model(value,ts)
                    mse = F.mse_loss(epss,out)
                    mses.append(mse.item())
                    # loss = ((epss-out).pow(2).mean(dim=-1) * (betas[ts])/(2*alphas[ts]*(1-alpha_tbars))).sum(dim=0)
                    loss = (epss-out).pow(2).mean(dim=-1).mean(dim=0)
                    losses.append(loss.item())
                    bar.set_description('epoch {}, MSE {:.4f}, [Valid] {:.4f}'.format(epoch,sum(mses)/len(mses),sum(losses)/len(losses)))
                    
        if epoch % eval_interval == 0:
            visualize(model,save_dir=os.path.join('./samples',f'diffuse_epoch_{epoch}.png'))
            sample(model,save_dir=os.path.join('./samples',f'sample_epoch_{epoch}.png'))
            torch.save(model,os.path.join('./samples',f'epoch_{epoch}.pt'))

if __name__ == '__main__':
    model = DDPM().to(device)
    print('Number parameters of the model:', sum(p.numel() for p in model.parameters()))
    print('Model strcuture:',model)
    optimizer = torch.optim.Adam(model.parameters(),lr=1e-3)
    os.makedirs('./samples',exist_ok=True)
    sample(model,save_dir=os.path.join('./samples',f'init.png'))
    visualize(model,save_dir=os.path.join('./samples',f'init_visualize.png'))
    train(200,model,optimizer,eval_interval=5)

appended /home/zhh24/DeepLearning
tensor([0.9997, 0.9994, 0.9990, 0.9986, 0.9981, 0.9976, 0.9971, 0.9965, 0.9959,
        0.9952, 0.9945, 0.9938, 0.9930, 0.9922, 0.9914, 0.9905, 0.9896, 0.9886,
        0.9876, 0.9866, 0.9855, 0.9844, 0.9832, 0.9821, 0.9808, 0.9796, 0.9783,
        0.9769, 0.9756, 0.9742, 0.9727, 0.9712, 0.9697, 0.9682, 0.9666, 0.9649,
        0.9633, 0.9616, 0.9598, 0.9581, 0.9563, 0.9544, 0.9526, 0.9507, 0.9487,
        0.9468, 0.9448, 0.9427, 0.9407, 0.9386, 0.9364, 0.9343, 0.9321, 0.9298,
        0.9276, 0.9253, 0.9230, 0.9206, 0.9182, 0.9158, 0.9134, 0.9109, 0.9084,
        0.9058, 0.9033, 0.9007, 0.8981, 0.8954, 0.8928, 0.8901, 0.8873, 0.8846,
        0.8818, 0.8790, 0.8762, 0.8733, 0.8704, 0.8675, 0.8646, 0.8616, 0.8587,
        0.8557, 0.8526, 0.8496, 0.8465, 0.8434, 0.8403, 0.8372, 0.8340, 0.8308,
        0.8276, 0.8244, 0.8211, 0.8179, 0.8146, 0.8113, 0.8080, 0.8047, 0.8013,
        0.7979, 0.7945, 0.7911, 0.7877, 0.7843, 0.7808, 0.7773, 0.7739, 0.7704,
      

epoch 0, loss 16.9689:   1%|█                                                                                                     | 1/94 [00:00<00:17,  5.20it/s]

Saved visualize to /home/zhh24/samples/init_visualize.png


epoch 0, loss 0.8880: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.23it/s]
epoch 0, MSE 0.2866, [Valid] 0.2866: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.62it/s]


Saved visualize to /home/zhh24/samples/diffuse_epoch_0.png


  "type " + obj.__name__ + ". It won't be checked "
  "type " + obj.__name__ + ". It won't be checked "
  "type " + obj.__name__ + ". It won't be checked "
epoch 1, loss 0.2216: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.21it/s]
epoch 1, MSE 0.1752, [Valid] 0.1752: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.62it/s]
epoch 2, loss 0.1572: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.19it/s]
epoch 2, MSE 0.1417, [Valid] 0.1417: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.62it/s]
epoch 3, loss 0.1291: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.64it/s]
epoch 3, MSE 0.1194, [Valid] 0.119

Saved visualize to /home/zhh24/samples/diffuse_epoch_5.png


epoch 6, loss 0.0904: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.19it/s]
epoch 6, MSE 0.0851, [Valid] 0.0851: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.61it/s]
epoch 7, loss 0.0826: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.89it/s]
epoch 7, MSE 0.0797, [Valid] 0.0797: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 8, loss 0.0775: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 8, MSE 0.0752, [Valid] 0.0752: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 9, loss 0.0717: 100%|█

Saved visualize to /home/zhh24/samples/diffuse_epoch_10.png


epoch 11, loss 0.0654: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 11, MSE 0.0634, [Valid] 0.0634: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.61it/s]
epoch 12, loss 0.0615: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.00it/s]
epoch 12, MSE 0.0592, [Valid] 0.0592: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 13, loss 0.0593: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 13, MSE 0.0572, [Valid] 0.0572: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 14, loss 0.0565: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_15.png


epoch 16, loss 0.0530: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.07it/s]
epoch 16, MSE 0.0533, [Valid] 0.0533: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.54it/s]
epoch 17, loss 0.0513: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 17, MSE 0.0503, [Valid] 0.0503: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 18, loss 0.0492: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.98it/s]
epoch 18, MSE 0.0494, [Valid] 0.0494: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 19, loss 0.0484: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_20.png


epoch 21, loss 0.0450: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.01it/s]
epoch 21, MSE 0.0458, [Valid] 0.0458: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 22, loss 0.0446: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 22, MSE 0.0433, [Valid] 0.0433: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.53it/s]
epoch 23, loss 0.0423: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.92it/s]
epoch 23, MSE 0.0415, [Valid] 0.0415: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.50it/s]
epoch 24, loss 0.0410: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_25.png


epoch 26, loss 0.0386: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.04it/s]
epoch 26, MSE 0.0380, [Valid] 0.0380: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 27, loss 0.0375: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 27, MSE 0.0368, [Valid] 0.0368: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 28, loss 0.0369: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 28, MSE 0.0352, [Valid] 0.0352: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 29, loss 0.0355: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_30.png


epoch 31, loss 0.0336: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 31, MSE 0.0342, [Valid] 0.0342: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 32, loss 0.0337: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.92it/s]
epoch 32, MSE 0.0324, [Valid] 0.0324: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 33, loss 0.0325: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 33, MSE 0.0319, [Valid] 0.0319: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 34, loss 0.0329: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_35.png


epoch 36, loss 0.0315: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.20it/s]
epoch 36, MSE 0.0311, [Valid] 0.0311: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 37, loss 0.0311: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 37, MSE 0.0326, [Valid] 0.0326: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 38, loss 0.0306: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.00it/s]
epoch 38, MSE 0.0296, [Valid] 0.0296: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 39, loss 0.0300: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_40.png


epoch 41, loss 0.0297: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 41, MSE 0.0285, [Valid] 0.0285: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.62it/s]
epoch 42, loss 0.0296: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.48it/s]
epoch 42, MSE 0.0293, [Valid] 0.0293: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 43, loss 0.0288: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 43, MSE 0.0286, [Valid] 0.0286: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 44, loss 0.0285: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_45.png


epoch 46, loss 0.0279: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.05it/s]
epoch 46, MSE 0.0278, [Valid] 0.0278: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 47, loss 0.0279: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.97it/s]
epoch 47, MSE 0.0276, [Valid] 0.0276: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 48, loss 0.0275: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.91it/s]
epoch 48, MSE 0.0287, [Valid] 0.0287: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 49, loss 0.0275: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_50.png


epoch 51, loss 0.0273: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.01it/s]
epoch 51, MSE 0.0270, [Valid] 0.0270: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 52, loss 0.0273: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.05it/s]
epoch 52, MSE 0.0277, [Valid] 0.0277: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 53, loss 0.0269: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 53, MSE 0.0274, [Valid] 0.0274: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 54, loss 0.0265: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_55.png


epoch 56, loss 0.0262: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.02it/s]
epoch 56, MSE 0.0266, [Valid] 0.0266: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 57, loss 0.0258: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 57, MSE 0.0264, [Valid] 0.0264: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 58, loss 0.0258: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 58, MSE 0.0263, [Valid] 0.0263: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 59, loss 0.0258: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_60.png


epoch 61, loss 0.0253: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 61, MSE 0.0251, [Valid] 0.0251: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 62, loss 0.0255: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 62, MSE 0.0248, [Valid] 0.0248: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 63, loss 0.0246: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 63, MSE 0.0251, [Valid] 0.0251: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 64, loss 0.0249: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_65.png


epoch 66, loss 0.0245: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.14it/s]
epoch 66, MSE 0.0250, [Valid] 0.0250: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 67, loss 0.0243: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.91it/s]
epoch 67, MSE 0.0242, [Valid] 0.0242: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 68, loss 0.0247: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.92it/s]
epoch 68, MSE 0.0244, [Valid] 0.0244: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.46it/s]
epoch 69, loss 0.0247: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_70.png


epoch 71, loss 0.0238: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 71, MSE 0.0239, [Valid] 0.0239: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.53it/s]
epoch 72, loss 0.0238: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.87it/s]
epoch 72, MSE 0.0242, [Valid] 0.0242: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 73, loss 0.0239: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.99it/s]
epoch 73, MSE 0.0235, [Valid] 0.0235: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.54it/s]
epoch 74, loss 0.0239: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_75.png


epoch 76, loss 0.0235: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 76, MSE 0.0230, [Valid] 0.0230: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 77, loss 0.0233: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.00it/s]
epoch 77, MSE 0.0228, [Valid] 0.0228: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 78, loss 0.0234: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.92it/s]
epoch 78, MSE 0.0225, [Valid] 0.0225: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 79, loss 0.0234: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_80.png


epoch 81, loss 0.0226: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.98it/s]
epoch 81, MSE 0.0227, [Valid] 0.0227: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 82, loss 0.0231: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 82, MSE 0.0232, [Valid] 0.0232: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 83, loss 0.0233: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.91it/s]
epoch 83, MSE 0.0232, [Valid] 0.0232: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 84, loss 0.0224: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_85.png


epoch 86, loss 0.0224: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 86, MSE 0.0226, [Valid] 0.0226: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 87, loss 0.0224: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.73it/s]
epoch 87, MSE 0.0216, [Valid] 0.0216: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 88, loss 0.0217: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 88, MSE 0.0220, [Valid] 0.0220: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 89, loss 0.0221: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_90.png


epoch 91, loss 0.0219: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 91, MSE 0.0221, [Valid] 0.0221: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 92, loss 0.0214: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 92, MSE 0.0215, [Valid] 0.0215: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.48it/s]
epoch 93, loss 0.0216: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 93, MSE 0.0219, [Valid] 0.0219: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 94, loss 0.0216: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_95.png


epoch 96, loss 0.0217: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.00it/s]
epoch 96, MSE 0.0220, [Valid] 0.0220: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 97, loss 0.0211: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.99it/s]
epoch 97, MSE 0.0213, [Valid] 0.0213: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 98, loss 0.0212: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 98, MSE 0.0211, [Valid] 0.0211: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 99, loss 0.0217: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_100.png


epoch 101, loss 0.0212: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.02it/s]
epoch 101, MSE 0.0201, [Valid] 0.0201: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.52it/s]
epoch 102, loss 0.0207: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 102, MSE 0.0208, [Valid] 0.0208: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 103, loss 0.0205: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 103, MSE 0.0212, [Valid] 0.0212: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 104, loss 0.0208: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_105.png


epoch 106, loss 0.0209: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.02it/s]
epoch 106, MSE 0.0220, [Valid] 0.0220: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 107, loss 0.0203: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 107, MSE 0.0200, [Valid] 0.0200: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 108, loss 0.0203: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.90it/s]
epoch 108, MSE 0.0201, [Valid] 0.0201: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 109, loss 0.0204: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_110.png


epoch 111, loss 0.0198: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 111, MSE 0.0203, [Valid] 0.0203: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 112, loss 0.0202: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 112, MSE 0.0199, [Valid] 0.0199: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 113, loss 0.0201: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 113, MSE 0.0201, [Valid] 0.0201: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.47it/s]
epoch 114, loss 0.0199: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_115.png


epoch 116, loss 0.0201: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.92it/s]
epoch 116, MSE 0.0194, [Valid] 0.0194: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.62it/s]
epoch 117, loss 0.0193: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 117, MSE 0.0196, [Valid] 0.0196: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 118, loss 0.0197: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 118, MSE 0.0192, [Valid] 0.0192: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 119, loss 0.0198: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_120.png


epoch 121, loss 0.0197: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.04it/s]
epoch 121, MSE 0.0192, [Valid] 0.0192: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 122, loss 0.0192: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 122, MSE 0.0193, [Valid] 0.0193: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.61it/s]
epoch 123, loss 0.0196: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.01it/s]
epoch 123, MSE 0.0195, [Valid] 0.0195: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 124, loss 0.0195: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_125.png


epoch 126, loss 0.0194: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.91it/s]
epoch 126, MSE 0.0195, [Valid] 0.0195: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 127, loss 0.0189: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 127, MSE 0.0187, [Valid] 0.0187: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 128, loss 0.0194: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 128, MSE 0.0188, [Valid] 0.0188: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 129, loss 0.0189: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_130.png


epoch 131, loss 0.0188: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.92it/s]
epoch 131, MSE 0.0187, [Valid] 0.0187: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 132, loss 0.0191: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.83it/s]
epoch 132, MSE 0.0183, [Valid] 0.0183: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 133, loss 0.0188: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.91it/s]
epoch 133, MSE 0.0185, [Valid] 0.0185: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 134, loss 0.0186: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_135.png


epoch 136, loss 0.0187: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.05it/s]
epoch 136, MSE 0.0182, [Valid] 0.0182: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 137, loss 0.0189: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.92it/s]
epoch 137, MSE 0.0202, [Valid] 0.0202: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 138, loss 0.0186: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 138, MSE 0.0182, [Valid] 0.0182: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.61it/s]
epoch 139, loss 0.0185: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_140.png


epoch 141, loss 0.0187: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.98it/s]
epoch 141, MSE 0.0181, [Valid] 0.0181: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 142, loss 0.0185: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 142, MSE 0.0189, [Valid] 0.0189: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 143, loss 0.0184: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.97it/s]
epoch 143, MSE 0.0186, [Valid] 0.0186: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 144, loss 0.0182: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_145.png


epoch 146, loss 0.0182: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.16it/s]
epoch 146, MSE 0.0179, [Valid] 0.0179: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.62it/s]
epoch 147, loss 0.0180: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 147, MSE 0.0180, [Valid] 0.0180: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.49it/s]
epoch 148, loss 0.0180: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 148, MSE 0.0182, [Valid] 0.0182: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 149, loss 0.0188: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_150.png


epoch 151, loss 0.0183: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.97it/s]
epoch 151, MSE 0.0179, [Valid] 0.0179: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.59it/s]
epoch 152, loss 0.0181: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 152, MSE 0.0178, [Valid] 0.0178: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 153, loss 0.0180: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 153, MSE 0.0179, [Valid] 0.0179: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 154, loss 0.0180: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_155.png


epoch 156, loss 0.0178: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 156, MSE 0.0175, [Valid] 0.0175: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 157, loss 0.0179: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 157, MSE 0.0180, [Valid] 0.0180: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 158, loss 0.0180: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 158, MSE 0.0181, [Valid] 0.0181: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 159, loss 0.0177: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_160.png


epoch 161, loss 0.0176: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.03it/s]
epoch 161, MSE 0.0207, [Valid] 0.0207: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 162, loss 0.0176: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.92it/s]
epoch 162, MSE 0.0173, [Valid] 0.0173: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 163, loss 0.0175: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 163, MSE 0.0174, [Valid] 0.0174: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.61it/s]
epoch 164, loss 0.0175: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_165.png


epoch 166, loss 0.0175: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 166, MSE 0.0176, [Valid] 0.0176: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.61it/s]
epoch 167, loss 0.0172: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  8.01it/s]
epoch 167, MSE 0.0171, [Valid] 0.0171: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 168, loss 0.0174: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 168, MSE 0.0178, [Valid] 0.0178: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 169, loss 0.0175: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_170.png


epoch 171, loss 0.0172: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 171, MSE 0.0178, [Valid] 0.0178: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.47it/s]
epoch 172, loss 0.0173: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 172, MSE 0.0171, [Valid] 0.0171: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 173, loss 0.0172: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 173, MSE 0.0173, [Valid] 0.0173: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 174, loss 0.0171: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_175.png


epoch 176, loss 0.0172: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.91it/s]
epoch 176, MSE 0.0176, [Valid] 0.0176: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.51it/s]
epoch 177, loss 0.0171: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 177, MSE 0.0174, [Valid] 0.0174: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 178, loss 0.0170: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 178, MSE 0.0169, [Valid] 0.0169: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 179, loss 0.0177: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_180.png


epoch 181, loss 0.0170: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 181, MSE 0.0165, [Valid] 0.0165: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.49it/s]
epoch 182, loss 0.0169: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 182, MSE 0.0171, [Valid] 0.0171: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.63it/s]
epoch 183, loss 0.0168: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 183, MSE 0.0169, [Valid] 0.0169: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 184, loss 0.0170: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_185.png


epoch 186, loss 0.0171: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.59it/s]
epoch 186, MSE 0.0176, [Valid] 0.0176: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 187, loss 0.0169: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.93it/s]
epoch 187, MSE 0.0174, [Valid] 0.0174: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.61it/s]
epoch 188, loss 0.0166: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.95it/s]
epoch 188, MSE 0.0167, [Valid] 0.0167: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 189, loss 0.0172: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_190.png


epoch 191, loss 0.0166: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.87it/s]
epoch 191, MSE 0.0174, [Valid] 0.0174: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 192, loss 0.0168: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.97it/s]
epoch 192, MSE 0.0167, [Valid] 0.0167: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.60it/s]
epoch 193, loss 0.0163: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.96it/s]
epoch 193, MSE 0.0162, [Valid] 0.0162: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.55it/s]
epoch 194, loss 0.0168: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_195.png


epoch 196, loss 0.0169: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.97it/s]
epoch 196, MSE 0.0172, [Valid] 0.0172: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.56it/s]
epoch 197, loss 0.0167: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.94it/s]
epoch 197, MSE 0.0167, [Valid] 0.0167: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.58it/s]
epoch 198, loss 0.0166: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:12<00:00,  7.97it/s]
epoch 198, MSE 0.0168, [Valid] 0.0168: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00,  9.57it/s]
epoch 199, loss 0.0165: 100%