In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [2]:
class VAE(nn.Module):
    """
    Variational Autoencoder (VAE) class.
    
    Args:
        input_dim (int): Dimensionality of the input data.
        hidden_dim (int): Dimensionality of the hidden layer.
        latent_dim (int): Dimensionality of the latent space.
    """
    
    def __init__(self, input_dim, hidden_dim, latent_dim):
        super(VAE, self).__init__()
                
        self.encoder = nn.Sequential(
            nn.Linear(input_dim, hidden_dim),
            nn.SiLU(),  # Swish activation function
            nn.Linear(hidden_dim, hidden_dim // 2),
            nn.SiLU(),  # Swish activation function
            nn.Linear(hidden_dim // 2, hidden_dim // 4),
            nn.SiLU(),  # Swish activation function
            nn.Linear(hidden_dim // 4, hidden_dim // 8),
            nn.SiLU(),  # Swish activation function
            nn.Linear(hidden_dim // 8, 2 * latent_dim), # 2 for mean and variance.
        )
        self.softplus = nn.Softplus()
        
        self.decoder = nn.Sequential(
            nn.Linear(latent_dim, hidden_dim // 8),
            nn.SiLU(),  # Swish activation function
            nn.Linear(hidden_dim // 8, hidden_dim // 4),
            nn.SiLU(),  # Swish activation function
            nn.Linear(hidden_dim // 4, hidden_dim // 2),
            nn.SiLU(),  # Swish activation function
            nn.Linear(hidden_dim // 2, hidden_dim),
            nn.SiLU(),  # Swish activation function
            nn.Linear(hidden_dim, input_dim),
            nn.Sigmoid(),
        )
        
    def encode(self, x, eps: float = 1e-8):
        """
        Encodes the input data into the latent space.
        
        Args:
            x (torch.Tensor): Input data.
            eps (float): Small value to avoid numerical instability.
        
        Returns:
            torch.distributions.MultivariateNormal: Normal distribution of the encoded data.
        """
        x = self.encoder(x)
        mu, logvar = torch.chunk(x, 2, dim=-1)
        scale = self.softplus(logvar) + eps
        scale_tril = torch.diag_embed(scale)
        
        return torch.distributions.MultivariateNormal(mu, scale_tril=scale_tril)
        
    def reparameterize(self, dist):
        """
        Reparameterizes the encoded data to sample from the latent space.
        
        Args:
            dist (torch.distributions.MultivariateNormal): Normal distribution of the encoded data.
        Returns:
            torch.Tensor: Sampled data from the latent space.
        """
        return dist.rsample()
    
    def decode(self, z):
        """
        Decodes the data from the latent space to the original input space.
        
        Args:
            z (torch.Tensor): Data in the latent space.
        
        Returns:
            torch.Tensor: Reconstructed data in the original input space.
        """
        return self.decoder(z)
    
    def forward(self, x, compute_loss: bool = True):
        """
        Performs a forward pass of the VAE.
        
        Args:
            x (torch.Tensor): Input data.
            compute_loss (bool): Whether to compute the loss or not.
        
        Returns:
            VAEOutput: VAE output dataclass.
        """
        dist = self.encode(x)
        z = self.reparameterize(dist)
        recon_x = self.decode(z)
        
        if not compute_loss:
            return VAEOutput(
                z_dist=dist,
                z_sample=z,
                x_recon=recon_x,
                loss=None,
                loss_recon=None,
                loss_kl=None,
            )
        
        # compute loss terms 
        loss_recon = F.binary_cross_entropy(recon_x, x + 0.5, reduction='none').sum(-1).mean()
        std_normal = torch.distributions.MultivariateNormal(
            torch.zeros_like(z, device=z.device),
            scale_tril=torch.eye(z.shape[-1], device=z.device).unsqueeze(0).expand(z.shape[0], -1, -1),
        )
        loss_kl = torch.distributions.kl.kl_divergence(dist, std_normal).mean()
                
        loss = loss_recon + loss_kl
        
        return VAEOutput(
            z_dist=dist,
            z_sample=z,
            x_recon=recon_x,
            loss=loss,
            loss_recon=loss_recon,
            loss_kl=loss_kl,
        )

In [47]:
from dataclasses import dataclass

import torch


@dataclass
class VAEOutput:
    """
    Dataclass for VAE output.
    
    Attributes:
        z_dist (torch.distributions.Distribution): The distribution of the latent variable z.
        z_sample (torch.Tensor): The sampled value of the latent variable z.
        x_recon (torch.Tensor): The reconstructed output from the VAE.
        loss (torch.Tensor): The overall loss of the VAE.
        loss_recon (torch.Tensor): The reconstruction loss component of the VAE loss.
        loss_kl (torch.Tensor): The KL divergence component of the VAE loss.
    """
    z_dist: torch.distributions.Distribution
    z_sample: torch.Tensor
    x_recon: torch.Tensor
    
    loss: torch.Tensor
    loss_recon: torch.Tensor
    loss_kl: torch.Tensor

In [56]:
import torch
from torchvision import datasets
from torchvision.transforms import v2


batch_size = 128
transform = v2.Compose([
    v2.ToImageTensor(), 
    v2.ToDtype(torch.float32),
    v2.Lambda(lambda x: x.view(-1) - 0.5),
])

# Download and load the training data
train_data = datasets.MNIST(
    '~/.pytorch/MNIST_data/', 
    download=True, 
    train=True, 
    transform=transform,
)
# Download and load the test data
test_data = datasets.MNIST(
    '~/.pytorch/MNIST_data/', 
    download=True, 
    train=False, 
    transform=transform,
)

# Create data loaders
train_loader = torch.utils.data.DataLoader(
    train_data, 
    batch_size=batch_size, 
    shuffle=True,
)
test_loader = torch.utils.data.DataLoader(
    test_data, 
    batch_size=batch_size, 
    shuffle=False,
)

In [57]:
from datetime import datetime

from tqdm import tqdm
import torch
from torch.utils.tensorboard import SummaryWriter

learning_rate = 1e-3
weight_decay = 1e-2
num_epochs = 50
latent_dim = 2
hidden_dim = 512

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = VAE(input_dim=784, hidden_dim=hidden_dim, latent_dim=latent_dim).to(device)
optimizer = torch.optim.AdamW(model.parameters(), lr=learning_rate, weight_decay=weight_decay)
writer = SummaryWriter(f'runs/mnist/vae_{datetime.now().strftime("%Y%m%d-%H%M%S")}')

In [58]:
def train(model, dataloader, optimizer, prev_updates, writer=None):
    """
    Trains the model on the given data.
    
    Args:
        model (nn.Module): The model to train.
        dataloader (torch.utils.data.DataLoader): The data loader.
        loss_fn: The loss function.
        optimizer: The optimizer.
    """
    model.train()  # Set the model to training mode
    
    for batch_idx, (data, target) in enumerate(tqdm(dataloader)):
        n_upd = prev_updates + batch_idx
        
        data = data.to(device)
        
        optimizer.zero_grad()  # Zero the gradients
        
        output = model(data)  # Forward pass
        loss = output.loss
        
        loss.backward()
        
        if n_upd % 100 == 0:
            # Calculate and log gradient norms
            total_norm = 0.0
            for p in model.parameters():
                if p.grad is not None:
                    param_norm = p.grad.data.norm(2)
                    total_norm += param_norm.item() ** 2
            total_norm = total_norm ** (1. / 2)
        
            print(f'Step {n_upd:,} (N samples: {n_upd*batch_size:,}), Loss: {loss.item():.4f} (Recon: {output.loss_recon.item():.4f}, KL: {output.loss_kl.item():.4f}) Grad: {total_norm:.4f}')

            if writer is not None:
                global_step = n_upd
                writer.add_scalar('Loss/Train', loss.item(), global_step)
                writer.add_scalar('Loss/Train/BCE', output.loss_recon.item(), global_step)
                writer.add_scalar('Loss/Train/KLD', output.loss_kl.item(), global_step)
                writer.add_scalar('GradNorm/Train', total_norm, global_step)
            
        # gradient clipping
        torch.nn.utils.clip_grad_norm_(model.parameters(), 1.0)    
        
        optimizer.step()  # Update the model parameters
        
    return prev_updates + len(dataloader)

In [59]:
def test(model, dataloader, cur_step, writer=None):
    """
    Tests the model on the given data.
    
    Args:
        model (nn.Module): The model to test.
        dataloader (torch.utils.data.DataLoader): The data loader.
        cur_step (int): The current step.
        writer: The TensorBoard writer.
    """
    model.eval()  # Set the model to evaluation mode
    test_loss = 0
    test_recon_loss = 0
    test_kl_loss = 0
    
    with torch.no_grad():
        for data, target in tqdm(dataloader, desc='Testing'):
            data = data.to(device)
            data = data.view(data.size(0), -1)  # Flatten the data
            
            output = model(data, compute_loss=True)  # Forward pass
            
            test_loss += output.loss.item()
            test_recon_loss += output.loss_recon.item()
            test_kl_loss += output.loss_kl.item()
            
    test_loss /= len(dataloader)
    test_recon_loss /= len(dataloader)
    test_kl_loss /= len(dataloader)
    print(f'====> Test set loss: {test_loss:.4f} (BCE: {test_recon_loss:.4f}, KLD: {test_kl_loss:.4f})')
    
    if writer is not None:
        writer.add_scalar('Loss/Test', test_loss, global_step=cur_step)
        writer.add_scalar('Loss/Test/BCE', output.loss_recon.item(), global_step=cur_step)
        writer.add_scalar('Loss/Test/KLD', output.loss_kl.item(), global_step=cur_step)
        
        # Log reconstructions
        writer.add_images('Test/Reconstructions', output.x_recon.view(-1, 1, 28, 28), global_step=cur_step)
        writer.add_images('Test/Originals', data.view(-1, 1, 28, 28), global_step=cur_step)
        
        # Log random samples from the latent space
        z = torch.randn(16, latent_dim).to(device)
        samples = model.decode(z)
        writer.add_images('Test/Samples', samples.view(-1, 1, 28, 28), global_step=cur_step)

In [60]:
prev_updates = 0
for epoch in range(num_epochs):
    print(f'Epoch {epoch+1}/{num_epochs}')
    prev_updates = train(model, train_loader, optimizer, prev_updates, writer=writer)
    test(model, test_loader, prev_updates, writer=writer)

Epoch 1/50


  1%|██▌                                                                                                                                                                                                                                                | 5/469 [00:00<00:09, 48.92it/s]

Step 0 (N samples: 0), Loss: 584.8366 (Recon: 583.5563, KL: 1.2803) Grad: 1722.8820


 23%|██████████████████████████████████████████████████████▉                                                                                                                                                                                          | 107/469 [00:02<00:06, 53.58it/s]

Step 100 (N samples: 12,800), Loss: -2608299.5000 (Recon: -2608341.0000, KL: 41.5465) Grad: 5035.1964


 45%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                     | 209/469 [00:03<00:04, 53.58it/s]

Step 200 (N samples: 25,600), Loss: -2648776.0000 (Recon: -2648825.0000, KL: 48.9063) Grad: 6998.4119


 66%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                 | 311/469 [00:05<00:02, 53.71it/s]

Step 300 (N samples: 38,400), Loss: -2562962.0000 (Recon: -2562985.5000, KL: 23.5518) Grad: 5284.4809


 87%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                               | 407/469 [00:07<00:01, 53.70it/s]

Step 400 (N samples: 51,200), Loss: -2584539.5000 (Recon: -2584561.5000, KL: 22.0684) Grad: 10415.0423


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.68it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.24it/s]


====> Test set loss: -2606250.1994 (BCE: -2606266.8829, KLD: 16.6732)
Epoch 2/50


  9%|█████████████████████▋                                                                                                                                                                                                                            | 42/469 [00:00<00:08, 53.17it/s]

Step 500 (N samples: 64,000), Loss: -2476512.7500 (Recon: -2476534.7500, KL: 22.0834) Grad: 7563.5768


 29%|██████████████████████████████████████████████████████████████████████▉                                                                                                                                                                          | 138/469 [00:02<00:06, 53.60it/s]

Step 600 (N samples: 76,800), Loss: -2668755.5000 (Recon: -2668771.0000, KL: 15.3901) Grad: 8596.6494


 51%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                     | 240/469 [00:04<00:04, 53.67it/s]

Step 700 (N samples: 89,600), Loss: -2637172.7500 (Recon: -2637189.7500, KL: 16.9787) Grad: 14554.8841


 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                 | 342/469 [00:06<00:02, 53.47it/s]

Step 800 (N samples: 102,400), Loss: -2558924.7500 (Recon: -2558941.7500, KL: 16.9386) Grad: 7781.4026


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                | 438/469 [00:08<00:00, 53.68it/s]

Step 900 (N samples: 115,200), Loss: -2410712.5000 (Recon: -2410733.0000, KL: 20.6088) Grad: 6539.0424


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.70it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.28it/s]


====> Test set loss: -2614256.8339 (BCE: -2614272.8244, KLD: 15.9959)
Epoch 3/50


 15%|█████████████████████████████████████▏                                                                                                                                                                                                            | 72/469 [00:01<00:07, 53.65it/s]

Step 1,000 (N samples: 128,000), Loss: -2619084.5000 (Recon: -2619102.0000, KL: 17.6077) Grad: 7766.6665


 36%|██████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                          | 168/469 [00:03<00:05, 53.62it/s]

Step 1,100 (N samples: 140,800), Loss: -2481396.5000 (Recon: -2481418.5000, KL: 21.8777) Grad: 5394.0519


 58%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                      | 270/469 [00:05<00:03, 53.69it/s]

Step 1,200 (N samples: 153,600), Loss: -2511321.7500 (Recon: -2511343.5000, KL: 21.7592) Grad: 6070.9230


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                 | 372/469 [00:06<00:01, 53.59it/s]

Step 1,300 (N samples: 166,400), Loss: -2564358.0000 (Recon: -2564371.7500, KL: 13.6552) Grad: 9671.7496


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.77it/s]


Step 1,400 (N samples: 179,200), Loss: -2597387.5000 (Recon: -2597402.5000, KL: 14.9595) Grad: 13450.4766


Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.60it/s]


====> Test set loss: -2616423.1551 (BCE: -2616436.6835, KLD: 13.5385)
Epoch 4/50


 22%|████████████████████████████████████████████████████▍                                                                                                                                                                                            | 102/469 [00:01<00:06, 53.60it/s]

Step 1,500 (N samples: 192,000), Loss: -2567898.5000 (Recon: -2567912.2500, KL: 13.7437) Grad: 3223.8000


 43%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                        | 204/469 [00:03<00:04, 53.75it/s]

Step 1,600 (N samples: 204,800), Loss: -2502970.7500 (Recon: -2502984.7500, KL: 13.9434) Grad: 9431.3870


 64%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                      | 300/469 [00:05<00:03, 53.89it/s]

Step 1,700 (N samples: 217,600), Loss: -2496295.0000 (Recon: -2496307.0000, KL: 11.9619) Grad: 10038.1236


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                  | 402/469 [00:07<00:01, 53.94it/s]

Step 1,800 (N samples: 230,400), Loss: -2548877.5000 (Recon: -2548889.5000, KL: 12.0851) Grad: 4933.7256


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.95it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.84it/s]


====> Test set loss: -2617825.5712 (BCE: -2617837.7500, KLD: 12.1815)
Epoch 5/50


  6%|███████████████▍                                                                                                                                                                                                                                  | 30/469 [00:00<00:08, 53.71it/s]

Step 1,900 (N samples: 243,200), Loss: -2502703.7500 (Recon: -2502714.2500, KL: 10.4501) Grad: 5466.7800


 28%|███████████████████████████████████████████████████████████████████▊                                                                                                                                                                             | 132/469 [00:02<00:06, 53.83it/s]

Step 2,000 (N samples: 256,000), Loss: -2626353.0000 (Recon: -2626366.7500, KL: 13.6457) Grad: 4176.3821


 50%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                        | 234/469 [00:04<00:04, 54.09it/s]

Step 2,100 (N samples: 268,800), Loss: -2621561.2500 (Recon: -2621574.0000, KL: 12.7323) Grad: 11859.5013


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                       | 330/469 [00:06<00:02, 53.92it/s]

Step 2,200 (N samples: 281,600), Loss: -2434143.0000 (Recon: -2434155.5000, KL: 12.3842) Grad: 9247.0469


 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                   | 432/469 [00:07<00:00, 53.94it/s]

Step 2,300 (N samples: 294,400), Loss: -2485603.5000 (Recon: -2485615.5000, KL: 12.0922) Grad: 7021.8770


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 54.02it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.55it/s]


====> Test set loss: -2618549.6994 (BCE: -2618562.5032, KLD: 12.8032)
Epoch 6/50


 14%|██████████████████████████████████                                                                                                                                                                                                                | 66/469 [00:01<00:07, 53.83it/s]

Step 2,400 (N samples: 307,200), Loss: -2431817.2500 (Recon: -2431831.0000, KL: 13.6877) Grad: 8268.2193


 35%|███████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                             | 162/469 [00:03<00:05, 53.44it/s]

Step 2,500 (N samples: 320,000), Loss: -2505955.7500 (Recon: -2505967.2500, KL: 11.4539) Grad: 3865.3131


 56%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                         | 264/469 [00:04<00:03, 53.43it/s]

Step 2,600 (N samples: 332,800), Loss: -2529579.2500 (Recon: -2529591.5000, KL: 12.2137) Grad: 5917.0723


 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                     | 366/469 [00:06<00:01, 53.75it/s]

Step 2,700 (N samples: 345,600), Loss: -2566280.7500 (Recon: -2566296.2500, KL: 15.6153) Grad: 5223.5928


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍   | 462/469 [00:08<00:00, 53.67it/s]

Step 2,800 (N samples: 358,400), Loss: -2522706.5000 (Recon: -2522717.0000, KL: 10.5135) Grad: 4605.1879


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.62it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.73it/s]


====> Test set loss: -2619622.9620 (BCE: -2619634.2215, KLD: 11.2566)
Epoch 7/50


 20%|█████████████████████████████████████████████████▌                                                                                                                                                                                                | 96/469 [00:01<00:06, 53.87it/s]

Step 2,900 (N samples: 371,200), Loss: -2585443.2500 (Recon: -2585456.5000, KL: 13.1296) Grad: 6198.3752


 41%|██████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                              | 192/469 [00:03<00:05, 53.67it/s]

Step 3,000 (N samples: 384,000), Loss: -2420464.7500 (Recon: -2420478.7500, KL: 13.9862) Grad: 5914.7644


 63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                          | 294/469 [00:05<00:03, 53.51it/s]

Step 3,100 (N samples: 396,800), Loss: -2726322.2500 (Recon: -2726333.7500, KL: 11.4170) Grad: 7745.5423


 84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 396/469 [00:07<00:01, 53.62it/s]

Step 3,200 (N samples: 409,600), Loss: -2579963.7500 (Recon: -2579976.7500, KL: 12.9188) Grad: 11471.4646


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.89it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.68it/s]


====> Test set loss: -2617019.2373 (BCE: -2617031.1566, KLD: 11.8962)
Epoch 8/50


  5%|████████████▍                                                                                                                                                                                                                                     | 24/469 [00:00<00:08, 53.55it/s]

Step 3,300 (N samples: 422,400), Loss: -2568503.2500 (Recon: -2568517.5000, KL: 14.2064) Grad: 6481.3702


 27%|████████████████████████████████████████████████████████████████▋                                                                                                                                                                                | 126/469 [00:02<00:06, 53.69it/s]

Step 3,400 (N samples: 435,200), Loss: -2489005.0000 (Recon: -2489017.5000, KL: 12.6068) Grad: 5750.4011


 49%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                           | 228/469 [00:04<00:04, 53.81it/s]

Step 3,500 (N samples: 448,000), Loss: -2604282.5000 (Recon: -2604294.7500, KL: 12.1778) Grad: 11508.2916


 69%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                          | 324/469 [00:06<00:02, 54.00it/s]

Step 3,600 (N samples: 460,800), Loss: -2532010.7500 (Recon: -2532022.7500, KL: 11.9801) Grad: 11363.0768


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                      | 426/469 [00:07<00:00, 53.83it/s]

Step 3,700 (N samples: 473,600), Loss: -2660608.5000 (Recon: -2660622.5000, KL: 13.8862) Grad: 6877.6675


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.87it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.31it/s]


====> Test set loss: -2619888.3228 (BCE: -2619899.6361, KLD: 11.3117)
Epoch 9/50


 12%|███████████████████████████▊                                                                                                                                                                                                                      | 54/469 [00:01<00:07, 53.64it/s]

Step 3,800 (N samples: 486,400), Loss: -2530032.2500 (Recon: -2530043.0000, KL: 10.7954) Grad: 4626.4170


 33%|████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                                | 156/469 [00:02<00:05, 53.80it/s]

Step 3,900 (N samples: 499,200), Loss: -2605179.0000 (Recon: -2605192.7500, KL: 13.8522) Grad: 5099.2633


 55%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                            | 258/469 [00:04<00:03, 53.74it/s]

Step 4,000 (N samples: 512,000), Loss: -2510111.5000 (Recon: -2510123.5000, KL: 12.1227) Grad: 6752.7449


 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                           | 354/469 [00:06<00:02, 53.53it/s]

Step 4,100 (N samples: 524,800), Loss: -2717954.5000 (Recon: -2717966.2500, KL: 11.7025) Grad: 6697.5353


 97%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎      | 456/469 [00:08<00:00, 53.99it/s]

Step 4,200 (N samples: 537,600), Loss: -2438558.5000 (Recon: -2438570.0000, KL: 11.4300) Grad: 5285.4378


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.85it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.29it/s]


====> Test set loss: -2620069.8054 (BCE: -2620081.9462, KLD: 12.1341)
Epoch 10/50


 19%|██████████████████████████████████████████████▍                                                                                                                                                                                                   | 90/469 [00:01<00:07, 53.98it/s]

Step 4,300 (N samples: 550,400), Loss: -2536448.0000 (Recon: -2536459.5000, KL: 11.4469) Grad: 3493.8854


 40%|███████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                 | 186/469 [00:03<00:05, 53.93it/s]

Step 4,400 (N samples: 563,200), Loss: -2538537.7500 (Recon: -2538558.5000, KL: 20.8403) Grad: 3882.6772


 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                             | 288/469 [00:05<00:03, 53.83it/s]

Step 4,500 (N samples: 576,000), Loss: -2561988.2500 (Recon: -2562002.0000, KL: 13.7228) Grad: 9343.8499


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                        | 390/469 [00:07<00:01, 53.84it/s]

Step 4,600 (N samples: 588,800), Loss: -2721638.2500 (Recon: -2721649.5000, KL: 11.3603) Grad: 4169.6309


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.99it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.54it/s]


====> Test set loss: -2620270.5079 (BCE: -2620281.6677, KLD: 11.1495)
Epoch 11/50


  4%|█████████▎                                                                                                                                                                                                                                        | 18/469 [00:00<00:08, 53.57it/s]

Step 4,700 (N samples: 601,600), Loss: -2543598.2500 (Recon: -2543609.2500, KL: 11.0660) Grad: 5302.0112


 26%|█████████████████████████████████████████████████████████████▋                                                                                                                                                                                   | 120/469 [00:02<00:06, 53.55it/s]

Step 4,800 (N samples: 614,400), Loss: -2519026.0000 (Recon: -2519037.5000, KL: 11.4580) Grad: 5239.6393


 46%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                  | 216/469 [00:04<00:04, 53.39it/s]

Step 4,900 (N samples: 627,200), Loss: -2473426.5000 (Recon: -2473438.7500, KL: 12.2834) Grad: 3979.9317


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                             | 318/469 [00:05<00:02, 53.48it/s]

Step 5,000 (N samples: 640,000), Loss: -2541415.5000 (Recon: -2541428.5000, KL: 12.9261) Grad: 4287.1809


 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                         | 420/469 [00:07<00:00, 53.61it/s]

Step 5,100 (N samples: 652,800), Loss: -2591288.7500 (Recon: -2591299.7500, KL: 11.0912) Grad: 6828.1505


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.75it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.97it/s]


====> Test set loss: -2620623.3544 (BCE: -2620636.1361, KLD: 12.7662)
Epoch 12/50


 10%|████████████████████████▊                                                                                                                                                                                                                         | 48/469 [00:00<00:07, 53.81it/s]

Step 5,200 (N samples: 665,600), Loss: -2668149.0000 (Recon: -2668162.5000, KL: 13.4723) Grad: 5577.9609


 32%|█████████████████████████████████████████████████████████████████████████████                                                                                                                                                                    | 150/469 [00:02<00:05, 53.86it/s]

Step 5,300 (N samples: 678,400), Loss: -2640282.0000 (Recon: -2640294.0000, KL: 11.9234) Grad: 8953.5659


 54%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                               | 252/469 [00:04<00:04, 53.51it/s]

Step 5,400 (N samples: 691,200), Loss: -2530061.7500 (Recon: -2530073.0000, KL: 11.1553) Grad: 13518.0750


 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                              | 348/469 [00:06<00:02, 53.85it/s]

Step 5,500 (N samples: 704,000), Loss: -2452601.2500 (Recon: -2452613.5000, KL: 12.3641) Grad: 9787.9365


 96%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏         | 450/469 [00:08<00:00, 53.43it/s]

Step 5,600 (N samples: 716,800), Loss: -2515536.5000 (Recon: -2515549.5000, KL: 13.0506) Grad: 5289.4132


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.84it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.60it/s]


====> Test set loss: -2620707.2468 (BCE: -2620719.0222, KLD: 11.7825)
Epoch 13/50


 17%|████████████████████████████████████████▏                                                                                                                                                                                                         | 78/469 [00:01<00:07, 53.11it/s]

Step 5,700 (N samples: 729,600), Loss: -2533722.7500 (Recon: -2533735.0000, KL: 12.2260) Grad: 11260.8004


 38%|████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                    | 180/469 [00:03<00:05, 53.19it/s]

Step 5,800 (N samples: 742,400), Loss: -2585743.0000 (Recon: -2585754.5000, KL: 11.4179) Grad: 3409.1197


 60%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                | 282/469 [00:05<00:03, 53.61it/s]

Step 5,900 (N samples: 755,200), Loss: -2610098.2500 (Recon: -2610111.0000, KL: 12.7097) Grad: 7268.2007


 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                              | 378/469 [00:07<00:01, 53.71it/s]

Step 6,000 (N samples: 768,000), Loss: -2568479.0000 (Recon: -2568490.2500, KL: 11.3123) Grad: 5103.1180


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.69it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.73it/s]


====> Test set loss: -2620436.6994 (BCE: -2620448.4589, KLD: 11.7512)
Epoch 14/50


  1%|███                                                                                                                                                                                                                                                | 6/469 [00:00<00:08, 52.96it/s]

Step 6,100 (N samples: 780,800), Loss: -2544385.7500 (Recon: -2544398.0000, KL: 12.1273) Grad: 6063.7198


 24%|██████████████████████████████████████████████████████████▌                                                                                                                                                                                      | 114/469 [00:02<00:06, 53.90it/s]

Step 6,200 (N samples: 793,600), Loss: -2601266.7500 (Recon: -2601280.2500, KL: 13.4619) Grad: 27815.7983


 45%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                     | 210/469 [00:03<00:04, 54.05it/s]

Step 6,300 (N samples: 806,400), Loss: -2659484.5000 (Recon: -2659497.5000, KL: 13.0281) Grad: 9411.5682


 67%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                | 312/469 [00:05<00:02, 53.95it/s]

Step 6,400 (N samples: 819,200), Loss: -2621319.2500 (Recon: -2621332.0000, KL: 12.8553) Grad: 6283.8536


 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                            | 414/469 [00:07<00:01, 53.84it/s]

Step 6,500 (N samples: 832,000), Loss: -2577750.7500 (Recon: -2577763.2500, KL: 12.3893) Grad: 8684.3745


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 54.05it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.61it/s]


====> Test set loss: -2620873.9541 (BCE: -2620886.4335, KLD: 12.4891)
Epoch 15/50


  9%|█████████████████████▋                                                                                                                                                                                                                            | 42/469 [00:00<00:07, 53.57it/s]

Step 6,600 (N samples: 844,800), Loss: -2530908.0000 (Recon: -2530921.0000, KL: 13.0055) Grad: 4958.4258


 31%|█████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                       | 144/469 [00:02<00:06, 53.88it/s]

Step 6,700 (N samples: 857,600), Loss: -2647786.2500 (Recon: -2647797.5000, KL: 11.1325) Grad: 11803.0929


 51%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                     | 240/469 [00:04<00:04, 53.54it/s]

Step 6,800 (N samples: 870,400), Loss: -2537803.7500 (Recon: -2537817.0000, KL: 13.3320) Grad: 5581.6175


 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                 | 342/469 [00:06<00:02, 53.45it/s]

Step 6,900 (N samples: 883,200), Loss: -2532778.5000 (Recon: -2532790.5000, KL: 12.0486) Grad: 6325.3097


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 444/469 [00:08<00:00, 53.75it/s]

Step 7,000 (N samples: 896,000), Loss: -2586133.7500 (Recon: -2586145.0000, KL: 11.3626) Grad: 12680.3082


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.82it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.78it/s]


====> Test set loss: -2620894.1788 (BCE: -2620906.6646, KLD: 12.4928)
Epoch 16/50


 15%|█████████████████████████████████████▏                                                                                                                                                                                                            | 72/469 [00:01<00:07, 53.54it/s]

Step 7,100 (N samples: 908,800), Loss: -2476579.5000 (Recon: -2476591.0000, KL: 11.5608) Grad: 5856.3221


 37%|█████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                       | 174/469 [00:03<00:05, 53.37it/s]

Step 7,200 (N samples: 921,600), Loss: -2525464.0000 (Recon: -2525476.0000, KL: 12.0451) Grad: 7174.7405


 59%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                   | 276/469 [00:05<00:03, 53.49it/s]

Step 7,300 (N samples: 934,400), Loss: -2584650.7500 (Recon: -2584662.2500, KL: 11.5487) Grad: 7550.3173


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                 | 372/469 [00:06<00:01, 53.46it/s]

Step 7,400 (N samples: 947,200), Loss: -2566019.2500 (Recon: -2566030.2500, KL: 11.0785) Grad: 10183.9023


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.72it/s]


Step 7,500 (N samples: 960,000), Loss: -2599643.5000 (Recon: -2599655.2500, KL: 11.8591) Grad: 7299.5312


Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.93it/s]


====> Test set loss: -2621445.8054 (BCE: -2621458.3434, KLD: 12.5295)
Epoch 17/50


 22%|████████████████████████████████████████████████████▍                                                                                                                                                                                            | 102/469 [00:01<00:06, 53.75it/s]

Step 7,600 (N samples: 972,800), Loss: -2670266.5000 (Recon: -2670279.5000, KL: 12.9195) Grad: 13071.6553


 43%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                        | 204/469 [00:03<00:04, 53.76it/s]

Step 7,700 (N samples: 985,600), Loss: -2600976.7500 (Recon: -2600989.0000, KL: 12.3636) Grad: 9317.0270


 65%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                   | 306/469 [00:05<00:03, 53.44it/s]

Step 7,800 (N samples: 998,400), Loss: -2624908.7500 (Recon: -2624920.5000, KL: 11.7141) Grad: 12421.6079


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                  | 402/469 [00:07<00:01, 53.91it/s]

Step 7,900 (N samples: 1,011,200), Loss: -2583254.0000 (Recon: -2583268.0000, KL: 14.0254) Grad: 5949.6062


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.96it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.59it/s]


====> Test set loss: -2621629.1646 (BCE: -2621640.6028, KLD: 11.4400)
Epoch 18/50


  8%|██████████████████▌                                                                                                                                                                                                                               | 36/469 [00:00<00:08, 53.86it/s]

Step 8,000 (N samples: 1,024,000), Loss: -2491945.5000 (Recon: -2491959.2500, KL: 13.8687) Grad: 7224.9565


 29%|██████████████████████████████████████████████████████████████████████▉                                                                                                                                                                          | 138/469 [00:02<00:06, 54.02it/s]

Step 8,100 (N samples: 1,036,800), Loss: -2707656.7500 (Recon: -2707668.2500, KL: 11.4253) Grad: 13305.7993


 50%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                        | 234/469 [00:04<00:04, 53.67it/s]

Step 8,200 (N samples: 1,049,600), Loss: -2621441.2500 (Recon: -2621453.5000, KL: 12.1990) Grad: 8020.7280


 72%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                    | 336/469 [00:06<00:02, 53.15it/s]

Step 8,300 (N samples: 1,062,400), Loss: -2491170.2500 (Recon: -2491186.5000, KL: 16.2523) Grad: 4717.6305


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                | 438/469 [00:08<00:00, 53.75it/s]

Step 8,400 (N samples: 1,075,200), Loss: -2597030.7500 (Recon: -2597043.0000, KL: 12.1251) Grad: 4189.4690


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.89it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.85it/s]


====> Test set loss: -2621568.7706 (BCE: -2621580.9051, KLD: 12.1229)
Epoch 19/50


 14%|██████████████████████████████████                                                                                                                                                                                                                | 66/469 [00:01<00:07, 53.62it/s]

Step 8,500 (N samples: 1,088,000), Loss: -2578781.2500 (Recon: -2578795.0000, KL: 13.6260) Grad: 3641.7997


 36%|██████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                          | 168/469 [00:03<00:05, 53.26it/s]

Step 8,600 (N samples: 1,100,800), Loss: -2643641.5000 (Recon: -2643652.5000, KL: 11.1057) Grad: 7431.8265


 56%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                         | 264/469 [00:04<00:03, 53.57it/s]

Step 8,700 (N samples: 1,113,600), Loss: -2505129.2500 (Recon: -2505141.0000, KL: 11.6597) Grad: 5402.9219


 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                     | 366/469 [00:06<00:01, 53.77it/s]

Step 8,800 (N samples: 1,126,400), Loss: -2589705.0000 (Recon: -2589718.5000, KL: 13.5906) Grad: 13663.5406


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.67it/s]


Step 8,900 (N samples: 1,139,200), Loss: -2682213.5000 (Recon: -2682225.0000, KL: 11.4849) Grad: 5826.9355


Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.32it/s]


====> Test set loss: -2621768.1123 (BCE: -2621780.6772, KLD: 12.5646)
Epoch 20/50


 20%|█████████████████████████████████████████████████▌                                                                                                                                                                                                | 96/469 [00:01<00:07, 53.05it/s]

Step 9,000 (N samples: 1,152,000), Loss: -2602964.7500 (Recon: -2602976.2500, KL: 11.4245) Grad: 7679.7432


 42%|█████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                           | 198/469 [00:03<00:05, 53.29it/s]

Step 9,100 (N samples: 1,164,800), Loss: -2634330.2500 (Recon: -2634341.5000, KL: 11.2424) Grad: 4101.2071


 64%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                      | 300/469 [00:05<00:03, 53.72it/s]

Step 9,200 (N samples: 1,177,600), Loss: -2640394.2500 (Recon: -2640407.5000, KL: 13.1852) Grad: 9226.6837


 84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 396/469 [00:07<00:01, 53.70it/s]

Step 9,300 (N samples: 1,190,400), Loss: -2528550.0000 (Recon: -2528563.5000, KL: 13.5463) Grad: 6930.7929


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.61it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.61it/s]


====> Test set loss: -2621372.0063 (BCE: -2621384.5364, KLD: 12.5287)
Epoch 21/50


  6%|███████████████▍                                                                                                                                                                                                                                  | 30/469 [00:00<00:08, 53.77it/s]

Step 9,400 (N samples: 1,203,200), Loss: -2531853.0000 (Recon: -2531867.5000, KL: 14.4167) Grad: 14380.5048


 27%|████████████████████████████████████████████████████████████████▋                                                                                                                                                                                | 126/469 [00:02<00:06, 53.73it/s]

Step 9,500 (N samples: 1,216,000), Loss: -2567303.5000 (Recon: -2567316.0000, KL: 12.4283) Grad: 10680.8657


 49%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                           | 228/469 [00:04<00:04, 53.79it/s]

Step 9,600 (N samples: 1,228,800), Loss: -2685888.0000 (Recon: -2685900.5000, KL: 12.5361) Grad: 4005.8543


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                       | 330/469 [00:06<00:02, 53.91it/s]

Step 9,700 (N samples: 1,241,600), Loss: -2554511.0000 (Recon: -2554522.7500, KL: 11.7888) Grad: 10375.0245


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                      | 426/469 [00:07<00:00, 53.62it/s]

Step 9,800 (N samples: 1,254,400), Loss: -2661417.7500 (Recon: -2661429.0000, KL: 11.3156) Grad: 14646.3032


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.89it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.47it/s]


====> Test set loss: -2622024.7991 (BCE: -2622037.7342, KLD: 12.9333)
Epoch 22/50


 13%|██████████████████████████████▉                                                                                                                                                                                                                   | 60/469 [00:01<00:07, 53.62it/s]

Step 9,900 (N samples: 1,267,200), Loss: -2534996.7500 (Recon: -2535009.2500, KL: 12.4310) Grad: 7877.7064


 35%|███████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                             | 162/469 [00:03<00:05, 53.55it/s]

Step 10,000 (N samples: 1,280,000), Loss: -2604927.5000 (Recon: -2604940.2500, KL: 12.7748) Grad: 25596.1871


 55%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                            | 258/469 [00:04<00:03, 53.67it/s]

Step 10,100 (N samples: 1,292,800), Loss: -2561712.5000 (Recon: -2561725.7500, KL: 13.2440) Grad: 7074.1521


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                        | 360/469 [00:06<00:02, 53.60it/s]

Step 10,200 (N samples: 1,305,600), Loss: -2624803.5000 (Recon: -2624815.5000, KL: 11.9022) Grad: 4608.5718


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍   | 462/469 [00:08<00:00, 53.61it/s]

Step 10,300 (N samples: 1,318,400), Loss: -2662105.7500 (Recon: -2662117.7500, KL: 11.9488) Grad: 12855.6916


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.78it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.05it/s]


====> Test set loss: -2622030.7278 (BCE: -2622043.5380, KLD: 12.8131)
Epoch 23/50


 19%|██████████████████████████████████████████████▍                                                                                                                                                                                                   | 90/469 [00:01<00:07, 53.20it/s]

Step 10,400 (N samples: 1,331,200), Loss: -2602569.7500 (Recon: -2602585.0000, KL: 15.2350) Grad: 15040.6269


 41%|██████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                              | 192/469 [00:03<00:05, 53.39it/s]

Step 10,500 (N samples: 1,344,000), Loss: -2547373.7500 (Recon: -2547388.5000, KL: 14.7241) Grad: 6004.2749


 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                             | 288/469 [00:05<00:03, 53.47it/s]

Step 10,600 (N samples: 1,356,800), Loss: -2595299.7500 (Recon: -2595311.5000, KL: 11.6968) Grad: 5344.8122


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                        | 390/469 [00:07<00:01, 53.37it/s]

Step 10,700 (N samples: 1,369,600), Loss: -2472696.5000 (Recon: -2472709.5000, KL: 13.0457) Grad: 6932.3737


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.55it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.24it/s]


====> Test set loss: -2621591.6266 (BCE: -2621604.4066, KLD: 12.7859)
Epoch 24/50


  5%|████████████▍                                                                                                                                                                                                                                     | 24/469 [00:00<00:08, 53.38it/s]

Step 10,800 (N samples: 1,382,400), Loss: -2594803.5000 (Recon: -2594817.2500, KL: 13.7197) Grad: 8638.8602


 26%|█████████████████████████████████████████████████████████████▋                                                                                                                                                                                   | 120/469 [00:02<00:06, 53.52it/s]

Step 10,900 (N samples: 1,395,200), Loss: -2565094.7500 (Recon: -2565106.5000, KL: 11.7164) Grad: 5967.5501


 47%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                               | 222/469 [00:04<00:04, 53.69it/s]

Step 11,000 (N samples: 1,408,000), Loss: -2650162.2500 (Recon: -2650177.2500, KL: 14.9286) Grad: 6239.7449


 69%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                          | 324/469 [00:06<00:02, 53.66it/s]

Step 11,100 (N samples: 1,420,800), Loss: -2661401.2500 (Recon: -2661412.0000, KL: 10.7490) Grad: 10614.4489


 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                         | 420/469 [00:07<00:00, 53.65it/s]

Step 11,200 (N samples: 1,433,600), Loss: -2555435.7500 (Recon: -2555448.5000, KL: 12.8015) Grad: 4921.7376


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.76it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.33it/s]


====> Test set loss: -2621677.0744 (BCE: -2621689.6994, KLD: 12.6283)
Epoch 25/50


 12%|███████████████████████████▊                                                                                                                                                                                                                      | 54/469 [00:01<00:07, 53.67it/s]

Step 11,300 (N samples: 1,446,400), Loss: -2488345.7500 (Recon: -2488357.5000, KL: 11.8726) Grad: 4449.9671


 32%|█████████████████████████████████████████████████████████████████████████████                                                                                                                                                                    | 150/469 [00:02<00:05, 53.48it/s]

Step 11,400 (N samples: 1,459,200), Loss: -2441745.7500 (Recon: -2441757.5000, KL: 11.7997) Grad: 6109.2146


 54%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                               | 252/469 [00:04<00:04, 53.61it/s]

Step 11,500 (N samples: 1,472,000), Loss: -2653542.2500 (Recon: -2653554.5000, KL: 12.2153) Grad: 5181.1112


 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                           | 354/469 [00:06<00:02, 53.88it/s]

Step 11,600 (N samples: 1,484,800), Loss: -2571009.5000 (Recon: -2571022.2500, KL: 12.7327) Grad: 4844.5433


 96%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏         | 450/469 [00:08<00:00, 53.60it/s]

Step 11,700 (N samples: 1,497,600), Loss: -2606307.7500 (Recon: -2606321.0000, KL: 13.1332) Grad: 7527.8308


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.84it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.24it/s]


====> Test set loss: -2621939.0554 (BCE: -2621951.2706, KLD: 12.2129)
Epoch 26/50


 18%|███████████████████████████████████████████▎                                                                                                                                                                                                      | 84/469 [00:01<00:07, 53.71it/s]

Step 11,800 (N samples: 1,510,400), Loss: -2546108.0000 (Recon: -2546120.0000, KL: 12.0450) Grad: 5796.8816


 40%|███████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                 | 186/469 [00:03<00:05, 53.73it/s]

Step 11,900 (N samples: 1,523,200), Loss: -2693537.5000 (Recon: -2693549.5000, KL: 11.9649) Grad: 5873.4831


 60%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                | 282/469 [00:05<00:03, 53.79it/s]

Step 12,000 (N samples: 1,536,000), Loss: -2588884.0000 (Recon: -2588896.0000, KL: 12.0778) Grad: 8940.8362


 82%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                           | 384/469 [00:07<00:01, 53.70it/s]

Step 12,100 (N samples: 1,548,800), Loss: -2429897.7500 (Recon: -2429911.5000, KL: 13.7972) Grad: 5324.2392


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.89it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.15it/s]


====> Test set loss: -2621987.0475 (BCE: -2621999.8070, KLD: 12.7568)
Epoch 27/50


  1%|███                                                                                                                                                                                                                                                | 6/469 [00:00<00:08, 53.63it/s]

Step 12,200 (N samples: 1,561,600), Loss: -2560842.0000 (Recon: -2560857.0000, KL: 14.8901) Grad: 4882.2501


 24%|██████████████████████████████████████████████████████████▌                                                                                                                                                                                      | 114/469 [00:02<00:06, 53.64it/s]

Step 12,300 (N samples: 1,574,400), Loss: -2738910.2500 (Recon: -2738921.0000, KL: 10.8546) Grad: 7953.6697


 46%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                  | 216/469 [00:04<00:04, 53.36it/s]

Step 12,400 (N samples: 1,587,200), Loss: -2612442.7500 (Recon: -2612453.7500, KL: 10.9556) Grad: 14171.2674


 67%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                | 312/469 [00:05<00:02, 53.64it/s]

Step 12,500 (N samples: 1,600,000), Loss: -2559882.5000 (Recon: -2559895.5000, KL: 12.9357) Grad: 5390.0839


 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                            | 414/469 [00:07<00:01, 53.60it/s]

Step 12,600 (N samples: 1,612,800), Loss: -2644893.0000 (Recon: -2644905.5000, KL: 12.5683) Grad: 5193.8963


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.74it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.53it/s]


====> Test set loss: -2622036.4430 (BCE: -2622048.6155, KLD: 12.1781)
Epoch 28/50


 10%|████████████████████████▊                                                                                                                                                                                                                         | 48/469 [00:00<00:07, 53.27it/s]

Step 12,700 (N samples: 1,625,600), Loss: -2408731.5000 (Recon: -2408742.5000, KL: 10.9638) Grad: 7115.0538


 31%|█████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                       | 144/469 [00:02<00:06, 53.65it/s]

Step 12,800 (N samples: 1,638,400), Loss: -2612902.7500 (Recon: -2612916.2500, KL: 13.6136) Grad: 8640.8094


 52%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                  | 246/469 [00:04<00:04, 53.50it/s]

Step 12,900 (N samples: 1,651,200), Loss: -2449770.5000 (Recon: -2449784.2500, KL: 13.8718) Grad: 8258.6859


 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                              | 348/469 [00:06<00:02, 53.66it/s]

Step 13,000 (N samples: 1,664,000), Loss: -2507169.2500 (Recon: -2507185.7500, KL: 16.4581) Grad: 7355.6725


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 444/469 [00:08<00:00, 53.63it/s]

Step 13,100 (N samples: 1,676,800), Loss: -2560610.5000 (Recon: -2560623.0000, KL: 12.4475) Grad: 3233.8050


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.68it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.20it/s]


====> Test set loss: -2622208.9715 (BCE: -2622222.6582, KLD: 13.6866)
Epoch 29/50


 17%|████████████████████████████████████████▏                                                                                                                                                                                                         | 78/469 [00:01<00:07, 53.68it/s]

Step 13,200 (N samples: 1,689,600), Loss: -2635663.7500 (Recon: -2635676.0000, KL: 12.1383) Grad: 11496.8997


 37%|█████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                       | 174/469 [00:03<00:05, 53.50it/s]

Step 13,300 (N samples: 1,702,400), Loss: -2531826.0000 (Recon: -2531839.5000, KL: 13.4617) Grad: 8195.2931


 59%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                   | 276/469 [00:05<00:03, 53.68it/s]

Step 13,400 (N samples: 1,715,200), Loss: -2451261.5000 (Recon: -2451274.0000, KL: 12.6001) Grad: 10465.5660


 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                              | 378/469 [00:07<00:01, 53.75it/s]

Step 13,500 (N samples: 1,728,000), Loss: -2551961.2500 (Recon: -2551973.7500, KL: 12.5264) Grad: 8569.7045


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.78it/s]


Step 13,600 (N samples: 1,740,800), Loss: -2547084.5000 (Recon: -2547100.2500, KL: 15.8649) Grad: 20827.1252


Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.25it/s]


====> Test set loss: -2622260.1566 (BCE: -2622274.3323, KLD: 14.1734)
Epoch 30/50


 23%|███████████████████████████████████████████████████████▍                                                                                                                                                                                         | 108/469 [00:02<00:06, 53.71it/s]

Step 13,700 (N samples: 1,753,600), Loss: -2614174.2500 (Recon: -2614190.2500, KL: 16.0065) Grad: 5156.1723


 45%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                     | 210/469 [00:03<00:04, 53.62it/s]

Step 13,800 (N samples: 1,766,400), Loss: -2511353.2500 (Recon: -2511368.0000, KL: 14.8118) Grad: 6466.6461


 65%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                   | 306/469 [00:05<00:03, 53.74it/s]

Step 13,900 (N samples: 1,779,200), Loss: -2508907.2500 (Recon: -2508919.2500, KL: 12.0255) Grad: 5831.9873


 87%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                               | 408/469 [00:07<00:01, 53.72it/s]

Step 14,000 (N samples: 1,792,000), Loss: -2477227.0000 (Recon: -2477239.7500, KL: 12.8535) Grad: 7056.9246


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.82it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.93it/s]


====> Test set loss: -2622045.0016 (BCE: -2622058.5918, KLD: 13.5875)
Epoch 31/50


  8%|██████████████████▌                                                                                                                                                                                                                               | 36/469 [00:00<00:08, 53.59it/s]

Step 14,100 (N samples: 1,804,800), Loss: -2582675.2500 (Recon: -2582688.5000, KL: 13.2838) Grad: 4882.7391


 29%|██████████████████████████████████████████████████████████████████████▉                                                                                                                                                                          | 138/469 [00:02<00:06, 53.60it/s]

Step 14,200 (N samples: 1,817,600), Loss: -2544004.5000 (Recon: -2544018.0000, KL: 13.5282) Grad: 12966.0183


 51%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                     | 240/469 [00:04<00:04, 53.73it/s]

Step 14,300 (N samples: 1,830,400), Loss: -2637909.7500 (Recon: -2637921.2500, KL: 11.4460) Grad: 4340.6280


 72%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                    | 336/469 [00:06<00:02, 53.62it/s]

Step 14,400 (N samples: 1,843,200), Loss: -2619792.0000 (Recon: -2619803.7500, KL: 11.8221) Grad: 8277.8944


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                | 438/469 [00:08<00:00, 53.70it/s]

Step 14,500 (N samples: 1,856,000), Loss: -2432869.0000 (Recon: -2432883.5000, KL: 14.5096) Grad: 7679.8460


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.84it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.16it/s]


====> Test set loss: -2621888.3734 (BCE: -2621900.6820, KLD: 12.3181)
Epoch 32/50


 15%|█████████████████████████████████████▏                                                                                                                                                                                                            | 72/469 [00:01<00:07, 53.63it/s]

Step 14,600 (N samples: 1,868,800), Loss: -2535999.2500 (Recon: -2536011.5000, KL: 12.3521) Grad: 7830.3995


 36%|██████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                          | 168/469 [00:03<00:05, 53.67it/s]

Step 14,700 (N samples: 1,881,600), Loss: -2487015.2500 (Recon: -2487028.0000, KL: 12.7983) Grad: 29522.7303


 58%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                      | 270/469 [00:05<00:03, 53.63it/s]

Step 14,800 (N samples: 1,894,400), Loss: -2696792.7500 (Recon: -2696805.2500, KL: 12.4307) Grad: 4455.0358


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                 | 372/469 [00:06<00:01, 53.61it/s]

Step 14,900 (N samples: 1,907,200), Loss: -2552224.5000 (Recon: -2552237.0000, KL: 12.5300) Grad: 10457.0622


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.78it/s]


Step 15,000 (N samples: 1,920,000), Loss: -2474138.2500 (Recon: -2474153.0000, KL: 14.7743) Grad: 10593.7182


Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.83it/s]


====> Test set loss: -2622237.3259 (BCE: -2622250.7690, KLD: 13.4460)
Epoch 33/50


 22%|████████████████████████████████████████████████████▍                                                                                                                                                                                            | 102/469 [00:01<00:06, 53.70it/s]

Step 15,100 (N samples: 1,932,800), Loss: -2474459.2500 (Recon: -2474472.7500, KL: 13.5398) Grad: 7379.9876


 42%|█████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                           | 198/469 [00:03<00:05, 53.57it/s]

Step 15,200 (N samples: 1,945,600), Loss: -2616198.5000 (Recon: -2616210.7500, KL: 12.1385) Grad: 7785.7536


 64%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                      | 300/469 [00:05<00:03, 53.51it/s]

Step 15,300 (N samples: 1,958,400), Loss: -2688838.7500 (Recon: -2688850.7500, KL: 12.0231) Grad: 13684.3350


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                  | 402/469 [00:07<00:01, 53.45it/s]

Step 15,400 (N samples: 1,971,200), Loss: -2551175.0000 (Recon: -2551190.5000, KL: 15.5446) Grad: 5511.2674


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.73it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.76it/s]


====> Test set loss: -2622341.1867 (BCE: -2622354.0633, KLD: 12.8685)
Epoch 34/50


  6%|███████████████▍                                                                                                                                                                                                                                  | 30/469 [00:00<00:08, 53.43it/s]

Step 15,500 (N samples: 1,984,000), Loss: -2467741.5000 (Recon: -2467754.0000, KL: 12.5536) Grad: 8998.5220


 28%|███████████████████████████████████████████████████████████████████▊                                                                                                                                                                             | 132/469 [00:02<00:06, 53.65it/s]

Step 15,600 (N samples: 1,996,800), Loss: -2528499.0000 (Recon: -2528512.5000, KL: 13.3773) Grad: 10902.6967


 50%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                        | 234/469 [00:04<00:04, 53.62it/s]

Step 15,700 (N samples: 2,009,600), Loss: -2602314.2500 (Recon: -2602327.2500, KL: 12.9686) Grad: 15387.0770


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                       | 330/469 [00:06<00:02, 53.77it/s]

Step 15,800 (N samples: 2,022,400), Loss: -2588768.5000 (Recon: -2588782.7500, KL: 14.3347) Grad: 5303.7004


 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                   | 432/469 [00:08<00:00, 53.65it/s]

Step 15,900 (N samples: 2,035,200), Loss: -2481485.5000 (Recon: -2481497.5000, KL: 11.9496) Grad: 10746.7652


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.77it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.35it/s]


====> Test set loss: -2622482.6218 (BCE: -2622494.5380, KLD: 11.9201)
Epoch 35/50


 13%|██████████████████████████████▉                                                                                                                                                                                                                   | 60/469 [00:01<00:07, 53.60it/s]

Step 16,000 (N samples: 2,048,000), Loss: -2642116.2500 (Recon: -2642127.2500, KL: 10.8984) Grad: 11116.2493


 35%|███████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                             | 162/469 [00:03<00:05, 53.76it/s]

Step 16,100 (N samples: 2,060,800), Loss: -2543232.0000 (Recon: -2543245.5000, KL: 13.5915) Grad: 7653.9054


 56%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                         | 264/469 [00:04<00:03, 53.75it/s]

Step 16,200 (N samples: 2,073,600), Loss: -2451112.5000 (Recon: -2451124.5000, KL: 12.0132) Grad: 6023.8912


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                        | 360/469 [00:06<00:02, 53.48it/s]

Step 16,300 (N samples: 2,086,400), Loss: -2620002.2500 (Recon: -2620014.2500, KL: 12.0094) Grad: 6443.5457


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍   | 462/469 [00:08<00:00, 53.62it/s]

Step 16,400 (N samples: 2,099,200), Loss: -2501620.0000 (Recon: -2501634.0000, KL: 14.0916) Grad: 7716.8612


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.83it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.08it/s]


====> Test set loss: -2622253.6456 (BCE: -2622265.4668, KLD: 11.8270)
Epoch 36/50


 20%|█████████████████████████████████████████████████▌                                                                                                                                                                                                | 96/469 [00:01<00:06, 53.61it/s]

Step 16,500 (N samples: 2,112,000), Loss: -2682084.7500 (Recon: -2682096.0000, KL: 11.1310) Grad: 5611.2363


 41%|██████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                              | 192/469 [00:03<00:05, 53.71it/s]

Step 16,600 (N samples: 2,124,800), Loss: -2516643.5000 (Recon: -2516655.5000, KL: 11.8860) Grad: 5537.9697


 63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                          | 294/469 [00:05<00:03, 53.63it/s]

Step 16,700 (N samples: 2,137,600), Loss: -2568495.0000 (Recon: -2568507.2500, KL: 12.3437) Grad: 5989.2309


 84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 396/469 [00:07<00:01, 53.63it/s]

Step 16,800 (N samples: 2,150,400), Loss: -2628290.5000 (Recon: -2628302.2500, KL: 11.7455) Grad: 7403.8180


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.81it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 59.64it/s]


====> Test set loss: -2622340.6028 (BCE: -2622353.3703, KLD: 12.7724)
Epoch 37/50


  5%|████████████▍                                                                                                                                                                                                                                     | 24/469 [00:00<00:08, 53.59it/s]

Step 16,900 (N samples: 2,163,200), Loss: -2647128.7500 (Recon: -2647141.0000, KL: 12.1914) Grad: 5802.5342


 27%|████████████████████████████████████████████████████████████████▋                                                                                                                                                                                | 126/469 [00:02<00:06, 53.65it/s]

Step 17,000 (N samples: 2,176,000), Loss: -2641310.0000 (Recon: -2641322.0000, KL: 11.9954) Grad: 10480.8961


 47%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                               | 222/469 [00:04<00:04, 53.60it/s]

Step 17,100 (N samples: 2,188,800), Loss: -2649973.0000 (Recon: -2649985.5000, KL: 12.4766) Grad: 10681.9095


 69%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                          | 324/469 [00:06<00:02, 53.78it/s]

Step 17,200 (N samples: 2,201,600), Loss: -2494379.5000 (Recon: -2494393.0000, KL: 13.5884) Grad: 5778.9630


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                      | 426/469 [00:07<00:00, 53.81it/s]

Step 17,300 (N samples: 2,214,400), Loss: -2576883.5000 (Recon: -2576897.7500, KL: 14.3696) Grad: 8692.8464


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 469/469 [00:08<00:00, 53.84it/s]
Testing: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 60.34it/s]


====> Test set loss: -2622549.0459 (BCE: -2622562.0127, KLD: 12.9743)
Epoch 38/50


 12%|███████████████████████████▊                                                                                                                                                                                                                      | 54/469 [00:01<00:07, 53.71it/s]

Step 17,400 (N samples: 2,227,200), Loss: -2658763.2500 (Recon: -2658780.0000, KL: 16.7009) Grad: 7693.3947


 14%|█████████████████████████████████▌                                                                                                                                                                                                                | 65/469 [00:01<00:07, 52.93it/s]


KeyboardInterrupt: 