In [1]:
!nvidia-smi
!which python | grep DYY

Wed Sep 18 10:49:51 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.86.10              Driver Version: 535.86.10    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  Tesla V100-SXM2-32GB           On  | 00000004:04:00.0 Off |                    0 |
| N/A   47C    P0              68W / 184W |      0MiB / 32768MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                    

In [2]:
import torch
torch.manual_seed(3407)
torch.backends.cudnn.deterministic = True

# Model

In [3]:
# import torch
# import torch.nn as nn
# import torch.nn.functional as F

# class SinousEmbedding(nn.Module):
#     def __init__(self, dim) -> None:
#         super().__init__()
#         assert dim%2==0,NotImplementedError()
#         self.angles = (1000.**(-2/dim))**torch.arange(1,dim//2+1,1,dtype=torch.float).cuda()
#         self.angles.requires_grad_(False)
#     def forward(self,x):
#         angles = torch.einsum('m,i->im',self.angles,x.float())
#         return torch.cat((torch.sin(angles),torch.cos(angles)),dim=1)

# class DDPM(nn.Module):
#     def __init__(self, *args, **kwargs) -> None:
#         super().__init__(*args, **kwargs)
#         self.in_size = 28 * 28
#         self.t_embedding_dim = 256
#         self.t_embedding = SinousEmbedding(dim=self.t_embedding_dim)
#         self.up = nn.ModuleList([
#             nn.Sequential(
#                 nn.Linear(784+self.t_embedding_dim,64),
#                 nn.ReLU(),
#             ),
#             nn.Sequential(
#                 nn.Linear(64,32),
#                 nn.ReLU(),
#             ),
#             # nn.Sequential(
#             #     nn.Linear(256,256),
#             #     # nn.LeakyReLU(0.1),
#             # ),
#         ])
#         self.middle = nn.ModuleList([
#             nn.Linear(32,32),
#             # nn.LeakyReLU(0.1),
#         ])
#         self.down= nn.ModuleList([
#             nn.Sequential(
#                 nn.Linear(32,32),
#                 nn.ReLU(),
#             ),
#             # nn.Sequential(
#             #     nn.Linear(256,256),
#             #     # nn.LeakyReLU(0.1),
#             # ),
#             nn.Sequential(
#                 nn.Linear(32,64),
#                 nn.ReLU(),
#             ),
#         ])
#         self.end_mlp = nn.Linear(64,784)
#         self.apply_init()

#     def apply_init(self):
#         for m in self.modules():
#             if isinstance(m, nn.Linear):
#                 nn.init.xavier_normal_(m.weight)
#                 nn.init.constant_(m.bias, 0)

#     def forward(self,x,t):
#         x = x.reshape(-1,784)
#         ttensor = self.t_embedding(t) # [batch, 256]
#         batch = x.shape[0]
#         xc = x.clone()
#         ups = []
#         x = torch.cat((x,ttensor),dim=-1)
#         for ly in self.up:
#             x = ly(x)
#             ups.append(x.clone())
#         for ly in self.middle:
#             x = ly(x)
#         for ly in self.down:
#             x = ly(x) + ups.pop()

#         x = self.end_mlp(x)
#         x = (x + xc)
#         return x

In [4]:
import torch
import torch.nn as nn
import torch.nn.functional as F

class SinousEmbedding(nn.Module):
    def __init__(self, dim) -> None:
        super().__init__()
        assert dim%2==0,NotImplementedError()
        self.angles = (10000.**(-2/dim))**torch.arange(1,dim//2+1,1,dtype=torch.float).cuda()
        self.angles.requires_grad_(False)
    def forward(self,x):
        angles = torch.einsum('m,i->im',self.angles,x.float())
        return torch.cat((torch.sin(angles),torch.cos(angles)),dim=1)
    
class ResidualBlock(nn.Module):

    def __init__(self,channels=128,kernel_size=3,t_dim=64) -> None:
        super().__init__()
        self.conv1 = nn.Conv2d(channels,channels,kernel_size=kernel_size,padding=kernel_size//2)
        self.t_net = nn.Linear(t_dim,channels)
        self.conv2 = nn.Conv2d(channels,channels,kernel_size=kernel_size,padding=kernel_size//2)
        self.conv1.weight.data.fill_(0)
        self.conv2.weight.data.fill_(0)
        self.t_net.weight.data.fill_(0)
        self.conv1.bias.data.fill_(0)
        self.conv2.bias.data.fill_(0)
        self.t_net.bias.data.fill_(0)
    
    def forward(self,x,t):
        xc = x.clone()
        x = self.conv1(x.relu())
        x = x + self.t_net(t).unsqueeze(-1).unsqueeze(-1).expand(t.shape[0],x.shape[1],x.shape[2],x.shape[3])
        x = F.relu(x)
        x = self.conv2(x)
        return x + xc


class F_x_t(nn.Module):

    def __init__(self,in_channels,out_channels,out_size,kernel_size=3,t_shape=64,attn=False,attn_dim=32,residual=True) -> None:
        super().__init__()
        # self.t_channels = out_channels // 2
        # self.conv_channels = out_channels - self.t_channels
        self.t_channels = out_channels
        self.conv_channels = out_channels
        self.conv = nn.Conv2d(in_channels, self.conv_channels, kernel_size=kernel_size, padding=kernel_size//2)
        self.out_size = out_size
        self.fc = nn.Linear(t_shape, self.t_channels)
        self.attn = attn
        self.residual = residual
        if attn:
            self.Q  = nn.Conv2d(out_channels, attn_dim, kernel_size=1)
            self.K  = nn.Conv2d(out_channels, attn_dim, kernel_size=1)
            self.V  = nn.Conv2d(out_channels, out_channels, kernel_size=1)
        if residual:
            self.res = ResidualBlock(channels=out_channels,kernel_size=kernel_size,t_dim=t_shape)
        # self.fc = nn.Embedding(t_shape, self.t_num)

    def forward(self, x, t):
        if self.t_channels == 0:
            raise NotImplementedError()
            return self.conv(x)
        # return torch.cat([self.conv(x),self.fc(t).unsqueeze(-1).unsqueeze(-1).expand(t.shape[0], self.t_channels, self.out_size, self.out_size)],dim=1).relu()
        val = self.conv(x) + self.fc(t).unsqueeze(-1).unsqueeze(-1).expand(t.shape[0], self.t_channels, self.out_size, self.out_size)
        if self.residual:
            val = self.res(val,t)
        if self.attn:
            q = self.Q(val)
            k = self.K(val)
            v = self.V(val)
            attn_score = torch.einsum('bchw,bcxy->bhwxy',q,k).reshape(q.shape[0],*q.shape[-2:],-1)
            attn_score = attn_score.softmax(dim=-1).reshape(q.shape[0],*q.shape[-2:],*k.shape[-2:])
            return torch.einsum('bhwxy,bcxy->bchw',attn_score,v).relu()
        return val.relu()

class DDPM(nn.Module):
    def __init__(self, *args, **kwargs) -> None:
        super().__init__(*args, **kwargs)
        self.t_embedding_dim = 32
        self.t_embedding = SinousEmbedding(dim=self.t_embedding_dim)
        self.up= nn.ModuleList([
            F_x_t(in_channels=1,out_channels=32,out_size=32,kernel_size=3,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=32,out_channels=64,out_size=16,kernel_size=3,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=64,out_channels=128,out_size=8,kernel_size=3,t_shape=self.t_embedding_dim,attn=False),
            # ResidualBlock(channels=128,kernel_size=3,t_dim=self.t_embedding_dim),
            # F_x_t(in_channels=128,out_channels=128,out_size=4,kernel_size=1,t_shape=self.t_embedding_dim),
        ])
        self.middle = nn.ModuleList([
            nn.Identity()
            # ResidualBlock(channels=128,kernel_size=3,t_dim=self.t_embedding_dim),
            # F_x_t(in_channels=128,out_channels=128,out_size=4,kernel_size=1,t_shape=self.t_embedding_dim,attn=False),
        ])
        self.down= nn.ModuleList([
            # F_x_t(in_channels=128,out_channels=128,out_size=2,kernel_size=1,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=128,out_channels=64,out_size=8,kernel_size=3,t_shape=self.t_embedding_dim,attn=False),
            F_x_t(in_channels=64,out_channels=32,out_size=16,kernel_size=3,t_shape=self.t_embedding_dim),
            F_x_t(in_channels=32,out_channels=16,out_size=32,kernel_size=3,t_shape=self.t_embedding_dim),
        ])
        # self.end_mlp = nn.Conv2d(32,1,kernel_size=3,padding=1)
        self.end_mlp = nn.Conv2d(16,1,kernel_size=1)

    def forward(self,x,t):
        x = x.reshape(-1,1,28,28)
        x = F.pad(x,(2,2,2,2),mode='constant',value=0)
        ttensor = self.t_embedding(t) # [batch, 256]
        batch = x.shape[0]
        # xc = x.clone()            print(attn_score.shape)

        ups = []
        for ly in self.up:
            x = ly(x,ttensor)
            ups.append(x.clone()) # append: 28x28, 14x14
            x = nn.AvgPool2d(2)(x)
        for ly in self.middle:
            # x = ly(x,ttensor)
            x = ly(x)
        for ly in self.down:
            x = nn.Upsample(scale_factor=2)(x) + ups.pop() # 14x14, 28x28
            x = ly(x,ttensor)
            # x = nn.Upsample(scale_factor=2)(x) + ups.pop()
        x = self.end_mlp(x)
        x = x[:,:,2:30,2:30]
        return x.reshape(batch,28*28)

# Train

In [5]:
import sys
import os

# parent_dir = os.path.abspath('/root/DeepLearning')
parent_dir = os.path.abspath('/home/zhh24/DeepLearning')

sys.path.append(parent_dir)
print('appended',parent_dir)

import utils

from tqdm import tqdm
import torch
import torch.nn.functional as F
import torchvision.utils

import matplotlib.pyplot as plt
device = 'cuda' if torch.cuda.is_available() else 'cpu'
torch.autograd.set_detect_anomaly(True)
mnist = utils.MNIST(batch_size=512)
train_loader = mnist.train_dataloader
valid_loader = mnist.valid_dataloader
T=500


                    # beta1=1e-4 # variance of lowest temperature
                    # betaT=5e-2 # variance of highest temperature
                    # # MODIFIED

                    # # step = torch.log(torch.tensor(betaT/beta1))/(T-1)
                    # # betas = beta1 * torch.exp(step*torch.arange(T,dtype=torch.float).to(device))
                    # step = (betaT-beta1)/(T-1)
                    # betas = torch.arange(T,dtype=torch.float,device=device) * step + beta1


                    # alphas = 1-betas
                    # alpha_bars = alphas.clone()
                    # for i in range(1,T):
                    #     alpha_bars[i] *= alpha_bars[i-1]


# we re-define a way to generate hyperparameters
alpha_bar_0 = .9
# alpha_bar_mid = .3
alpha_bar_T = 1e-3
alpha_bars = torch.zeros(T,dtype=torch.float)
# alpha_bars[:T//2] = alpha_bar_0 + (alpha_bar_mid-alpha_bar_0) * torch.arange(T//2,dtype=torch.float,device=device) / (T//2)
# alpha_bars[T//2:] = alpha_bar_mid + (alpha_bar_T-alpha_bar_mid) * torch.arange(T//2,dtype=torch.float,device=device) / (T//2)
alpha_bars = alpha_bar_0 + (alpha_bar_T-alpha_bar_0) * torch.arange(T,dtype=torch.float,device=device) / T
alphas = alpha_bars.clone()
for i in range(1,T):
    alphas[i] = alpha_bars[i] / alpha_bars[i-1]
betas = 1-alphas

print(alpha_bars)
print('range of bars',alpha_bars.min(),alpha_bars.max())
# print(alphas)

sqrt = torch.sqrt
sigmas = sqrt(betas * (1-alpha_bars / alphas)/(1-alpha_bars))
sigmas[0] = 1
print('range of sigmas,',sigmas.min(),sigmas.max())
alphas = alphas.to(device)
alpha_bars = alpha_bars.to(device)
betas = betas.to(device)
sigmas = sigmas.to(device)
weights = torch.ones(T,dtype=torch.float,device=device)

@torch.no_grad()
def sample(model:DDPM,save_dir):
    x = torch.randn([100,784]).to(device)
    for t in range(T-1,-1,-1):
        sigmaz = torch.randn_like(x)*sigmas[t]
        if t==0:
            sigmaz = 0
        x = (x-(1-alphas[t])/(sqrt(1-alpha_bars[t]))*model(x,t*torch.ones(x.shape[0],dtype=torch.long,device=device)))/(sqrt(alphas[t]))+sigmaz
        # x = torch.clamp(x,0,1)
    grid = torchvision.utils.make_grid(post_process(x).reshape(-1,1,28,28).cpu(), nrow=10)
    torchvision.utils.save_image(grid, save_dir)

@torch.no_grad()
def visualize(model,save_dir):
    interval = (T-1) // 20
    x = torch.randn([10,784]).to(device)
    x_history = []
    for t in range(T-1,-1,-1):
        sigmaz = torch.randn_like(x)*((betas[t])**0.5).to(device)
        if t==0:
            sigmaz = 0
        x = (x-(1-alphas[t])/(sqrt(1-alpha_bars[t]))*model(x,t*torch.ones(x.shape[0],dtype=torch.long,device=device)))/(sqrt(alphas[t]))+sigmaz
        # x = torch.clamp(x,0,1)
        x_history.append(x)
    # print('cat.shape',torch.cat(x_history,dim=0).shape)
    grid = torchvision.utils.make_grid(post_process(torch.stack(x_history,dim=0)[::interval,...]).reshape(-1,1,28,28).cpu(), nrow=10)
    torchvision.utils.save_image(grid, save_dir)
    print('Saved visualize to',os.path.abspath(save_dir))

@torch.no_grad()
def visualize_denoise(model,save_dir):
    # get 10 images from the dataset
    x,_ = next(iter(valid_loader))
    x = x[:20,...].reshape(20,784).to(device)
    x = pre_process(x)
    t = torch.tensor([i * T // 20 for i in range(20)],dtype=torch.long,device=device)
    noise = torch.randn_like(x).reshape(-1,784)
    v1 = (sqrt(alpha_bars[t]).reshape(-1,1)*x).reshape(-1,784)
    v2 = sqrt(1-alpha_bars[t]).reshape(-1,1)*noise
    x_corr = v1+v2
    est = model(x_corr,t)
    x_rec = (x_corr - sqrt(1-alpha_bars[t]).reshape(-1,1)*est)/(sqrt(alpha_bars[t])).reshape(-1,1)
    grid_orig = torchvision.utils.make_grid(post_process(x).reshape(-1,1,28,28).cpu(), nrow=10)
    grid_corr = torchvision.utils.make_grid(post_process(x_corr).reshape(-1,1,28,28).cpu(), nrow=10)
    grid_rec = torchvision.utils.make_grid(post_process(x_rec).reshape(-1,1,28,28).cpu(), nrow=10)
    # add noise level infomation to the image
    noise_level = (1-alpha_bars[t]).reshape(-1).tolist()
    ori_mse = noise.pow(2).mean(dim=1).reshape(-1).tolist()
    mse = ((est-noise)**2).mean(dim=1).reshape(-1).tolist()
    print(noise_level)
    print(ori_mse)
    print(mse)
    grid = torch.cat([grid_orig,grid_corr,grid_rec],dim=1)
    torchvision.utils.save_image(grid, save_dir)
    print('Saved denoise to',os.path.abspath(save_dir))

def plot_loss(losses,save_dir):
    losses_vals, t_vals = zip(*losses)
    losses_vals = torch.cat(losses_vals,dim=0)
    t_vals = torch.cat(t_vals,dim=0)
    # print('t_vals',t_vals)
    # print('losses_vals',losses_vals)

    results = []
    for t in range(T):
        this_t = abs(t_vals.float()-float(t))<0.5
        results.append(torch.sum(torch.where(this_t,losses_vals,torch.tensor(0.,device=device))).item() / (torch.sum(this_t.float())+1e-3).item())
    plt.plot(results)
    plt.ylim(0,max(results)* 1.2)
    plt.savefig(save_dir)
    plt.close()
    # weights = (torch.tensor(results,device=device)) # weights
    weights = torch.ones(T,dtype=torch.float,device=device)
    # weights[:10]=0
    # weights[10:80] /= 100
    return weights

def pre_process(x):
    # do the logit transform
    # return (torch.log(x+1e-3)-torch.log(1-x+1e-3))
    return x*2-1 #MODIFIED
    return (x+1)/2

def post_process(x):
    # return torch.sigmoid(x)
    return (x+1)/2 #MODIFIED
    return x*2-1

def train(epochs,model:DDPM,optimizer,eval_interval=5):
    global weights
    for epoch in range(epochs):
        # print('weights normalized:',weights/weights.sum())
        all_ts = torch.distributions.Categorical(weights).sample((50000,))
        cnt = 0
        model.train()
        with tqdm(train_loader) as bar:
            losses = []
            for x,_ in bar:
                cnt += x.shape[0]
                x = pre_process(x.to(device))
                epss = torch.randn_like(x).reshape(-1,784).to(device)
                # ts = torch.randint(0,T,(x.shape[0],),device=device,dtype=torch.long)
                ts = all_ts[cnt-x.shape[0]:cnt]
                alpha_tbars = alpha_bars[ts]
                value = (sqrt(alpha_tbars).reshape(-1,1,1,1)*x).reshape(-1,784)+sqrt(1-alpha_tbars).reshape(-1,1)*epss
                out = model(value,ts) # [batch,784]
                # loss = ((epss-out).pow(2).mean(dim=-1) * (betas[ts])/(2*alphas[ts]*(1-alpha_tbars))).sum(dim=0)
                loss = ((epss-out).pow(2).mean(dim=-1)).mean(dim=0)

                optimizer.zero_grad()
                loss.backward()
                optimizer.step()
                losses.append(loss.item())
                bar.set_description('epoch {}, loss {:.4f}'.format(epoch,sum(losses)/len(losses)))

        model.eval()
        with torch.no_grad():
            with tqdm(valid_loader) as bar:
                mses = []
                losses = []
                losses_for_t = []
                for x,_ in bar:
                    x = pre_process(x.to(device))
                    epss = torch.randn_like(x).reshape(-1,784).to(device)
                    ts = torch.randint(0,T,(x.shape[0],),device=device,dtype=torch.long)
                    # print(ts)
                    alpha_tbars = alpha_bars[ts]
                    value = (sqrt(alpha_tbars).reshape(-1,1,1,1)*x).reshape(-1,784)+sqrt(1-alpha_tbars).reshape(-1,1)*epss
                    out = model(value,ts)
                    mse = F.mse_loss(epss,out)
                    mses.append(mse.item())
                    loss = ((epss-out).pow(2).mean(dim=-1))
                    # loss = (epss-out).pow(2).mean(dim=-1)
                    losses_for_t.append((loss.clone().detach(),ts))
                    loss = (loss).mean(dim=0)
                    losses.append(loss.item())
                    bar.set_description('epoch {}, MSE {:.4f}, [Valid] {:.4f}'.format(epoch,sum(mses)/len(mses),sum(losses)/len(losses)))
                    
        if epoch % eval_interval == 0:
            visualize(model,save_dir=os.path.join('./samples',f'diffuse_epoch_{epoch}.png'))
            sample(model,save_dir=os.path.join('./samples',f'sample_epoch_{epoch}.png'))
            # visualize_denoise(model,save_dir=os.path.join('./samples',f'denoise_epoch_{epoch}.png'))
            weights = plot_loss(losses_for_t,save_dir=os.path.join('./samples',f'loss_epoch_{epoch}.png'))
            torch.save(model,os.path.join('./samples',f'epoch_{epoch}.pt'))

if __name__ == '__main__':
    model = DDPM().to(device)
    print('Number parameters of the model:', sum(p.numel() for p in model.parameters()))
    print('Model strcuture:',model)
    optimizer = torch.optim.Adam(model.parameters(),lr=1e-3)
    os.makedirs('./samples',exist_ok=True)
    sample(model,save_dir=os.path.join('./samples',f'init.png'))
    visualize(model,save_dir=os.path.join('./samples',f'init_visualize.png'))
    train(200,model,optimizer,eval_interval=5)

appended /home/zhh24/DeepLearning
tensor([0.9000, 0.8982, 0.8964, 0.8946, 0.8928, 0.8910, 0.8892, 0.8874, 0.8856,
        0.8838, 0.8820, 0.8802, 0.8784, 0.8766, 0.8748, 0.8730, 0.8712, 0.8694,
        0.8676, 0.8658, 0.8640, 0.8622, 0.8604, 0.8586, 0.8568, 0.8550, 0.8533,
        0.8515, 0.8497, 0.8479, 0.8461, 0.8443, 0.8425, 0.8407, 0.8389, 0.8371,
        0.8353, 0.8335, 0.8317, 0.8299, 0.8281, 0.8263, 0.8245, 0.8227, 0.8209,
        0.8191, 0.8173, 0.8155, 0.8137, 0.8119, 0.8101, 0.8083, 0.8065, 0.8047,
        0.8029, 0.8011, 0.7993, 0.7975, 0.7957, 0.7939, 0.7921, 0.7903, 0.7885,
        0.7867, 0.7849, 0.7831, 0.7813, 0.7795, 0.7777, 0.7759, 0.7741, 0.7723,
        0.7705, 0.7687, 0.7669, 0.7651, 0.7634, 0.7616, 0.7598, 0.7580, 0.7562,
        0.7544, 0.7526, 0.7508, 0.7490, 0.7472, 0.7454, 0.7436, 0.7418, 0.7400,
        0.7382, 0.7364, 0.7346, 0.7328, 0.7310, 0.7292, 0.7274, 0.7256, 0.7238,
        0.7220, 0.7202, 0.7184, 0.7166, 0.7148, 0.7130, 0.7112, 0.7094, 0.7076,
      

  0%|                                                                                                                                     | 0/94 [00:00<?, ?it/s]

Saved visualize to /home/zhh24/samples/init_visualize.png


epoch 0, loss 0.2674: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 0, MSE 0.1130, [Valid] 0.1130: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]


Saved visualize to /home/zhh24/samples/diffuse_epoch_0.png


  "type " + obj.__name__ + ". It won't be checked "
  "type " + obj.__name__ + ". It won't be checked "
  "type " + obj.__name__ + ". It won't be checked "
  "type " + obj.__name__ + ". It won't be checked "
epoch 1, loss 0.0962: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 1, MSE 0.0833, [Valid] 0.0833: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.44it/s]
epoch 2, loss 0.0751: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 2, MSE 0.0675, [Valid] 0.0675: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 3, loss 0.0654: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<

Saved visualize to /home/zhh24/samples/diffuse_epoch_5.png


epoch 6, loss 0.0539: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 6, MSE 0.0522, [Valid] 0.0522: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.38it/s]
epoch 7, loss 0.0519: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 7, MSE 0.0505, [Valid] 0.0505: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 8, loss 0.0500: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 8, MSE 0.0492, [Valid] 0.0492: 100%|███████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.39it/s]
epoch 9, loss 0.0490: 100%|█

Saved visualize to /home/zhh24/samples/diffuse_epoch_10.png


epoch 11, loss 0.0470: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 11, MSE 0.0459, [Valid] 0.0459: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.43it/s]
epoch 12, loss 0.0463: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 12, MSE 0.0451, [Valid] 0.0451: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 13, loss 0.0456: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 13, MSE 0.0450, [Valid] 0.0450: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.43it/s]
epoch 14, loss 0.0452: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_15.png


epoch 16, loss 0.0443: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 16, MSE 0.0436, [Valid] 0.0436: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.38it/s]
epoch 17, loss 0.0439: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 17, MSE 0.0430, [Valid] 0.0430: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.43it/s]
epoch 18, loss 0.0431: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 18, MSE 0.0433, [Valid] 0.0433: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.39it/s]
epoch 19, loss 0.0433: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_20.png


epoch 21, loss 0.0428: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 21, MSE 0.0420, [Valid] 0.0420: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 22, loss 0.0423: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 22, MSE 0.0418, [Valid] 0.0418: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 23, loss 0.0422: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 23, MSE 0.0416, [Valid] 0.0416: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 24, loss 0.0420: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_25.png


epoch 26, loss 0.0417: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 26, MSE 0.0412, [Valid] 0.0412: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 27, loss 0.0414: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 27, MSE 0.0410, [Valid] 0.0410: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 28, loss 0.0409: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 28, MSE 0.0408, [Valid] 0.0408: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.38it/s]
epoch 29, loss 0.0412: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_30.png


epoch 31, loss 0.0407: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 31, MSE 0.0400, [Valid] 0.0400: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.44it/s]
epoch 32, loss 0.0404: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 32, MSE 0.0402, [Valid] 0.0402: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.39it/s]
epoch 33, loss 0.0405: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 33, MSE 0.0399, [Valid] 0.0399: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 34, loss 0.0402: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_35.png


epoch 36, loss 0.0401: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 36, MSE 0.0401, [Valid] 0.0401: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 37, loss 0.0399: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 37, MSE 0.0396, [Valid] 0.0396: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 38, loss 0.0402: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 38, MSE 0.0400, [Valid] 0.0400: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.31it/s]
epoch 39, loss 0.0395: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_40.png


epoch 41, loss 0.0396: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 41, MSE 0.0391, [Valid] 0.0391: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.43it/s]
epoch 42, loss 0.0394: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 42, MSE 0.0390, [Valid] 0.0390: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 43, loss 0.0392: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 43, MSE 0.0395, [Valid] 0.0395: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 44, loss 0.0394: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_45.png


epoch 46, loss 0.0390: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 46, MSE 0.0388, [Valid] 0.0388: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 47, loss 0.0388: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 47, MSE 0.0385, [Valid] 0.0385: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.45it/s]
epoch 48, loss 0.0387: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.35it/s]
epoch 48, MSE 0.0389, [Valid] 0.0389: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.39it/s]
epoch 49, loss 0.0388: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_50.png


epoch 51, loss 0.0385: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 51, MSE 0.0382, [Valid] 0.0382: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.43it/s]
epoch 52, loss 0.0384: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 52, MSE 0.0383, [Valid] 0.0383: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.38it/s]
epoch 53, loss 0.0382: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 53, MSE 0.0384, [Valid] 0.0384: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 54, loss 0.0383: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_55.png


epoch 56, loss 0.0381: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 56, MSE 0.0379, [Valid] 0.0379: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 57, loss 0.0383: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 57, MSE 0.0399, [Valid] 0.0399: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 58, loss 0.0382: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 58, MSE 0.0378, [Valid] 0.0378: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.31it/s]
epoch 59, loss 0.0379: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_60.png


epoch 61, loss 0.0378: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 61, MSE 0.0374, [Valid] 0.0374: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 62, loss 0.0380: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 62, MSE 0.0374, [Valid] 0.0374: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 63, loss 0.0377: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 63, MSE 0.0376, [Valid] 0.0376: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 64, loss 0.0377: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_65.png


epoch 66, loss 0.0375: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 66, MSE 0.0372, [Valid] 0.0372: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 67, loss 0.0373: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 67, MSE 0.0373, [Valid] 0.0373: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 68, loss 0.0378: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 68, MSE 0.0371, [Valid] 0.0371: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 69, loss 0.0374: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_70.png


epoch 71, loss 0.0374: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 71, MSE 0.0371, [Valid] 0.0371: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 72, loss 0.0371: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.37it/s]
epoch 72, MSE 0.0366, [Valid] 0.0366: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 73, loss 0.0371: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 73, MSE 0.0367, [Valid] 0.0367: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 74, loss 0.0373: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_75.png


epoch 76, loss 0.0371: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 76, MSE 0.0368, [Valid] 0.0368: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.39it/s]
epoch 77, loss 0.0369: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 77, MSE 0.0376, [Valid] 0.0376: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 78, loss 0.0372: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 78, MSE 0.0367, [Valid] 0.0367: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 79, loss 0.0368: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_80.png


epoch 81, loss 0.0369: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 81, MSE 0.0386, [Valid] 0.0386: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 82, loss 0.0367: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 82, MSE 0.0366, [Valid] 0.0366: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 83, loss 0.0368: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 83, MSE 0.0370, [Valid] 0.0370: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 84, loss 0.0365: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_85.png


epoch 86, loss 0.0366: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 86, MSE 0.0365, [Valid] 0.0365: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 87, loss 0.0366: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 87, MSE 0.0360, [Valid] 0.0360: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 88, loss 0.0366: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 88, MSE 0.0363, [Valid] 0.0363: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.37it/s]
epoch 89, loss 0.0362: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_90.png


epoch 91, loss 0.0367: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 91, MSE 0.0359, [Valid] 0.0359: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.43it/s]
epoch 92, loss 0.0362: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 92, MSE 0.0360, [Valid] 0.0360: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.38it/s]
epoch 93, loss 0.0363: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 93, MSE 0.0361, [Valid] 0.0361: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 94, loss 0.0363: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_95.png


epoch 96, loss 0.0361: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 96, MSE 0.0359, [Valid] 0.0359: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.39it/s]
epoch 97, loss 0.0362: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 97, MSE 0.0360, [Valid] 0.0360: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 98, loss 0.0362: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.34it/s]
epoch 98, MSE 0.0361, [Valid] 0.0361: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.37it/s]
epoch 99, loss 0.0361: 100%|

Saved visualize to /home/zhh24/samples/diffuse_epoch_100.png


epoch 101, loss 0.0360: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.38it/s]
epoch 101, MSE 0.0362, [Valid] 0.0362: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 102, loss 0.0361: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 102, MSE 0.0364, [Valid] 0.0364: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.38it/s]
epoch 103, loss 0.0358: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 103, MSE 0.0358, [Valid] 0.0358: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 104, loss 0.0359: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_105.png


epoch 106, loss 0.0359: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 106, MSE 0.0360, [Valid] 0.0360: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 107, loss 0.0359: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 107, MSE 0.0367, [Valid] 0.0367: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 108, loss 0.0359: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 108, MSE 0.0356, [Valid] 0.0356: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 109, loss 0.0357: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_110.png


epoch 111, loss 0.0357: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 111, MSE 0.0358, [Valid] 0.0358: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 112, loss 0.0356: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 112, MSE 0.0366, [Valid] 0.0366: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.38it/s]
epoch 113, loss 0.0356: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 113, MSE 0.0354, [Valid] 0.0354: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 114, loss 0.0359: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_115.png


epoch 116, loss 0.0354: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:28<00:00,  3.39it/s]
epoch 116, MSE 0.0355, [Valid] 0.0355: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.39it/s]
epoch 117, loss 0.0357: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.39it/s]
epoch 117, MSE 0.0353, [Valid] 0.0353: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 118, loss 0.0355: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 118, MSE 0.0357, [Valid] 0.0357: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.40it/s]
epoch 119, loss 0.0355: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_120.png


epoch 121, loss 0.0355: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 121, MSE 0.0359, [Valid] 0.0359: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.42it/s]
epoch 122, loss 0.0354: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 122, MSE 0.0352, [Valid] 0.0352: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 123, loss 0.0354: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 94/94 [00:29<00:00,  3.38it/s]
epoch 123, MSE 0.0351, [Valid] 0.0351: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:03<00:00,  7.41it/s]
epoch 124, loss 0.0351: 100%

Saved visualize to /home/zhh24/samples/diffuse_epoch_125.png


epoch 126, loss 0.0354:  84%|████████████████████████████████████████████████████████████████████████████████████                | 79/94 [00:24<00:04,  3.24it/s]


KeyboardInterrupt: 