In [2]:
import json

#For Loading Images
from PIL import Image

#For displaying loadbar
from tqdm import tqdm

#Importing pytorch to finetune our clip
import torch
import torch.nn as nn
from torch.utils.data import DataLoader

#Here, we import clip model developed by meta
import clip

#Constructs a CLIP processor which wraps a CLIP image processor and a CLIP tokenizer into a single processor.
from transformers import CLIPProcessor, CLIPModel

In [23]:
json_path = 'archive/train_data.json'
image_path = 'archive/images/train/'

In [24]:
input_data = []
with open(json_path, 'r') as f:
	for line in f:
		obj = json.loads(line)
		input_data.append(obj)

In [25]:
model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")
processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

In [26]:
device = "cuda:0" if torch.cuda.is_available() else "cpu" 

In [27]:
model, preprocess = clip.load("ViT-B/32", device=device, jit=False)


In [28]:
class image_title_dataset():
    def __init__(self, list_image_path, list_txt):
        # Initialize image paths and corresponding texts
        self.image_path = list_image_path

        # Tokenize text using CLIP's tokenizer
        self.title = clip.tokenize(list_txt)

    def __len__(self):
        # Define the length of the dataset
        return len(self.title)

    def __getitem__(self, idx):

        # Get an item from the dataset
        # Preprocess image using CLIP's preprocessing function

        image = preprocess(Image.open(self.image_path[idx]))
        title = self.title[idx]
        return image, title

In [29]:
list_image_path = []
list_txt = []
for item in input_data:
    img_path = image_path + item['image_path'].split('/')[-1]
  
  #As we have image text pair, we use product title as description.
    caption = item['product_title'][:40]
    list_image_path.append(img_path)
    list_txt.append(caption)

dataset = image_title_dataset(list_image_path, list_txt)
train_dataloader = DataLoader(dataset, batch_size=50, shuffle=True) 
#Define your own dataloader

# Function to convert model's parameters to FP32 format
#This is done so that our model loads in the provided memory.
def convert_models_to_fp32(model): 
    for p in model.parameters(): 
        p.data = p.data.float() 
        p.grad.data = p.grad.data.float() 

In [30]:
# Check if the device is set to CPU
if device == "cpu":
    model.float()  # Convert the model's parameters to float if using CPU

# Prepare the optimizer
optimizer = torch.optim.Adam(model.parameters(), lr=5e-5, betas=(0.9, 0.98), eps=1e-6 ,weight_decay=0.2) 
    
# Adam optimizer is used with specific hyperparameters
# lr (learning rate) is set to 5e-5, which is considered safe for fine-tuning to a new dataset
# betas are used for the optimization algorithm
# eps is a small value to prevent division by zero
# weight_decay adds L2 regularization to the optimizer

# Specify the loss function for images
loss_img = nn.CrossEntropyLoss()

# Specify the loss function for text
loss_txt = nn.CrossEntropyLoss()

In [31]:
num_epochs = 4 # Number of training epochs
for epoch in range(num_epochs):
    pbar = tqdm(train_dataloader, total=len(train_dataloader))
    
    # Iterate through the batches in the training data
    for batch in pbar:
        optimizer.zero_grad()  # Zero out gradients for the optimizer
        
        # Extract images and texts from the batch
        images, texts = batch
        
        # Print the current device (CPU or GPU)
        print(device)
        
        # Move images and texts to the specified device (CPU or GPU)
        images = images.to(device)
        texts = texts.to(device)

        # Forward pass through the model
        logits_per_image, logits_per_text = model(images, texts)

        # Compute the loss
        ground_truth = torch.arange(len(images), dtype=torch.long, device=device)
        total_loss = (loss_img(logits_per_image, ground_truth) + loss_txt(logits_per_text, ground_truth)) / 2

        # Backward pass and update the model's parameters
        total_loss.backward()
        
        # If the device is CPU, directly update the model
        if device == "cpu":
            optimizer.step()
        else:
            # Convert model's parameters to FP32 format, update, and convert back
            convert_models_to_fp32(model)
            optimizer.step()
            clip.model.convert_weights(model)

        # Update the progress bar with the current epoch and loss
        pbar.set_description(f"Epoch {epoch}/{num_epochs}, Loss: {total_loss.item():.4f}")

  0%|                                                                                         | 0/1824 [00:00<?, ?it/s]

cuda:0


Epoch 0/4, Loss: 3.1562:   0%|                                                      | 1/1824 [00:08<4:08:44,  8.19s/it]

cuda:0


Epoch 0/4, Loss: 6.1250:   0%|                                                      | 2/1824 [00:08<1:51:48,  3.68s/it]

cuda:0


Epoch 0/4, Loss: 3.5430:   0%|                                                      | 3/1824 [00:09<1:08:19,  2.25s/it]

cuda:0


Epoch 0/4, Loss: 3.8848:   0%|                                                        | 4/1824 [00:09<47:55,  1.58s/it]

cuda:0


Epoch 0/4, Loss: 3.3945:   0%|▏                                                       | 5/1824 [00:10<36:18,  1.20s/it]

cuda:0


Epoch 0/4, Loss: 3.1445:   0%|▏                                                       | 6/1824 [00:10<29:09,  1.04it/s]

cuda:0


Epoch 0/4, Loss: 3.3711:   0%|▏                                                       | 7/1824 [00:11<24:39,  1.23it/s]

cuda:0


Epoch 0/4, Loss: 3.4180:   0%|▏                                                       | 8/1824 [00:11<21:41,  1.39it/s]

cuda:0


Epoch 0/4, Loss: 3.4570:   0%|▎                                                       | 9/1824 [00:12<19:46,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.7871:   1%|▎                                                      | 10/1824 [00:12<18:44,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.3027:   1%|▎                                                      | 11/1824 [00:13<17:39,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:   1%|▎                                                      | 12/1824 [00:13<16:43,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.6113:   1%|▍                                                      | 13/1824 [00:14<16:19,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 3.2031:   1%|▍                                                      | 14/1824 [00:14<16:13,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.8574:   1%|▍                                                      | 15/1824 [00:15<16:11,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.6211:   1%|▍                                                      | 16/1824 [00:16<16:21,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.8516:   1%|▌                                                      | 17/1824 [00:16<16:12,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.5391:   1%|▌                                                      | 18/1824 [00:17<16:13,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.6953:   1%|▌                                                      | 19/1824 [00:17<15:46,  1.91it/s]

cuda:0


Epoch 0/4, Loss: 2.5957:   1%|▌                                                      | 20/1824 [00:18<16:14,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.7773:   1%|▋                                                      | 21/1824 [00:18<16:09,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.8809:   1%|▋                                                      | 22/1824 [00:19<16:36,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.7109:   1%|▋                                                      | 23/1824 [00:19<16:27,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:   1%|▋                                                      | 24/1824 [00:20<16:19,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.6836:   1%|▊                                                      | 25/1824 [00:20<16:18,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.7637:   1%|▊                                                      | 26/1824 [00:21<16:25,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.6016:   1%|▊                                                      | 27/1824 [00:22<16:26,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.4492:   2%|▊                                                      | 28/1824 [00:22<16:09,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.3906:   2%|▊                                                      | 29/1824 [00:23<15:58,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.5469:   2%|▉                                                      | 30/1824 [00:23<15:52,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.6641:   2%|▉                                                      | 31/1824 [00:24<15:41,  1.90it/s]

cuda:0


Epoch 0/4, Loss: 2.3867:   2%|▉                                                      | 32/1824 [00:24<15:21,  1.94it/s]

cuda:0


Epoch 0/4, Loss: 2.9648:   2%|▉                                                      | 33/1824 [00:25<15:17,  1.95it/s]

cuda:0


Epoch 0/4, Loss: 2.6582:   2%|█                                                      | 34/1824 [00:25<15:02,  1.98it/s]

cuda:0


Epoch 0/4, Loss: 2.3887:   2%|█                                                      | 35/1824 [00:26<15:26,  1.93it/s]

cuda:0


Epoch 0/4, Loss: 2.1719:   2%|█                                                      | 36/1824 [00:26<15:53,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.4355:   2%|█                                                      | 37/1824 [00:27<15:59,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:   2%|█▏                                                     | 38/1824 [00:27<15:42,  1.90it/s]

cuda:0


Epoch 0/4, Loss: 2.4980:   2%|█▏                                                     | 39/1824 [00:28<15:43,  1.89it/s]

cuda:0


Epoch 0/4, Loss: 2.0312:   2%|█▏                                                     | 40/1824 [00:28<15:22,  1.93it/s]

cuda:0


Epoch 0/4, Loss: 2.3164:   2%|█▏                                                     | 41/1824 [00:29<15:38,  1.90it/s]

cuda:0


Epoch 0/4, Loss: 2.4766:   2%|█▎                                                     | 42/1824 [00:29<15:42,  1.89it/s]

cuda:0


Epoch 0/4, Loss: 2.2871:   2%|█▎                                                     | 43/1824 [00:30<15:38,  1.90it/s]

cuda:0


Epoch 0/4, Loss: 2.4648:   2%|█▎                                                     | 44/1824 [00:30<15:41,  1.89it/s]

cuda:0


Epoch 0/4, Loss: 2.4531:   2%|█▎                                                     | 45/1824 [00:31<15:41,  1.89it/s]

cuda:0


Epoch 0/4, Loss: 2.1250:   3%|█▍                                                     | 46/1824 [00:31<15:53,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 1.9668:   3%|█▍                                                     | 47/1824 [00:32<15:53,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.5273:   3%|█▍                                                     | 48/1824 [00:33<15:45,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.1504:   3%|█▍                                                     | 49/1824 [00:33<15:48,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.1914:   3%|█▌                                                     | 50/1824 [00:34<16:15,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.2969:   3%|█▌                                                     | 51/1824 [00:34<16:14,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.2695:   3%|█▌                                                     | 52/1824 [00:35<15:49,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.3164:   3%|█▌                                                     | 53/1824 [00:35<15:49,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.2344:   3%|█▋                                                     | 54/1824 [00:36<15:50,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.1758:   3%|█▋                                                     | 55/1824 [00:36<15:41,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.0547:   3%|█▋                                                     | 56/1824 [00:37<15:47,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.0742:   3%|█▋                                                     | 57/1824 [00:37<16:04,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.3203:   3%|█▋                                                     | 58/1824 [00:38<16:20,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.2812:   3%|█▊                                                     | 59/1824 [00:39<16:20,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.2324:   3%|█▊                                                     | 60/1824 [00:39<16:09,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.4961:   3%|█▊                                                     | 61/1824 [00:40<16:03,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.3418:   3%|█▊                                                     | 62/1824 [00:40<15:43,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.1797:   3%|█▉                                                     | 63/1824 [00:41<15:57,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.2969:   4%|█▉                                                     | 64/1824 [00:41<15:51,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.3926:   4%|█▉                                                     | 65/1824 [00:42<15:54,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.0703:   4%|█▉                                                     | 66/1824 [00:42<15:37,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.1328:   4%|██                                                     | 67/1824 [00:43<15:54,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 1.8223:   4%|██                                                     | 68/1824 [00:43<15:40,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.0059:   4%|██                                                     | 69/1824 [00:44<15:33,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.1797:   4%|██                                                     | 70/1824 [00:44<15:19,  1.91it/s]

cuda:0


Epoch 0/4, Loss: 1.9297:   4%|██▏                                                    | 71/1824 [00:45<15:29,  1.89it/s]

cuda:0


Epoch 0/4, Loss: 2.7070:   4%|██▏                                                    | 72/1824 [00:45<15:21,  1.90it/s]

cuda:0


Epoch 0/4, Loss: 2.0547:   4%|██▏                                                    | 73/1824 [00:46<15:29,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 1.9355:   4%|██▏                                                    | 74/1824 [00:47<15:17,  1.91it/s]

cuda:0


Epoch 0/4, Loss: 2.1758:   4%|██▎                                                    | 75/1824 [00:47<15:15,  1.91it/s]

cuda:0


Epoch 0/4, Loss: 2.3926:   4%|██▎                                                    | 76/1824 [00:48<15:18,  1.90it/s]

cuda:0


Epoch 0/4, Loss: 2.0957:   4%|██▎                                                    | 77/1824 [00:48<15:09,  1.92it/s]

cuda:0


Epoch 0/4, Loss: 1.9277:   4%|██▎                                                    | 78/1824 [00:49<15:30,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.2695:   4%|██▍                                                    | 79/1824 [00:49<15:30,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.2734:   4%|██▍                                                    | 80/1824 [00:50<15:32,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 1.8281:   4%|██▍                                                    | 81/1824 [00:50<15:45,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.0547:   4%|██▍                                                    | 82/1824 [00:51<15:52,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 1.7832:   5%|██▌                                                    | 83/1824 [00:51<15:33,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.0352:   5%|██▌                                                    | 84/1824 [00:52<15:27,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.1250:   5%|██▌                                                    | 85/1824 [00:52<15:21,  1.89it/s]

cuda:0


Epoch 0/4, Loss: 2.3477:   5%|██▌                                                    | 86/1824 [00:53<15:13,  1.90it/s]

cuda:0


Epoch 0/4, Loss: 1.9092:   5%|██▌                                                    | 87/1824 [00:53<15:35,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 1.9580:   5%|██▋                                                    | 88/1824 [00:54<15:43,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.2383:   5%|██▋                                                    | 89/1824 [00:55<15:41,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.4590:   5%|██▋                                                    | 90/1824 [00:55<15:24,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.2070:   5%|██▋                                                    | 91/1824 [00:56<15:47,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.4043:   5%|██▊                                                    | 92/1824 [00:56<15:35,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.3535:   5%|██▊                                                    | 93/1824 [00:57<15:50,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 1.9785:   5%|██▊                                                    | 94/1824 [00:57<15:34,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.4961:   5%|██▊                                                    | 95/1824 [00:58<15:34,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.3145:   5%|██▉                                                    | 96/1824 [00:58<15:24,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.5000:   5%|██▉                                                    | 97/1824 [00:59<15:18,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.4199:   5%|██▉                                                    | 98/1824 [00:59<15:18,  1.88it/s]

cuda:0


Epoch 0/4, Loss: 2.4785:   5%|██▉                                                    | 99/1824 [01:00<15:10,  1.89it/s]

cuda:0


Epoch 0/4, Loss: 2.0996:   5%|██▉                                                   | 100/1824 [01:01<15:31,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.0254:   6%|██▉                                                   | 101/1824 [01:01<15:39,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.0039:   6%|███                                                   | 102/1824 [01:02<16:05,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.1328:   6%|███                                                   | 103/1824 [01:02<15:48,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 1.9434:   6%|███                                                   | 104/1824 [01:03<15:51,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.2109:   6%|███                                                   | 105/1824 [01:03<15:28,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.5352:   6%|███▏                                                  | 106/1824 [01:04<15:28,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.3340:   6%|███▏                                                  | 107/1824 [01:04<15:09,  1.89it/s]

cuda:0


Epoch 0/4, Loss: 2.1211:   6%|███▏                                                  | 108/1824 [01:05<15:35,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.0117:   6%|███▏                                                  | 109/1824 [01:05<15:42,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.3047:   6%|███▎                                                  | 110/1824 [01:06<15:34,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.2754:   6%|███▎                                                  | 111/1824 [01:07<15:29,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.1211:   6%|███▎                                                  | 112/1824 [01:07<15:19,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.0176:   6%|███▎                                                  | 113/1824 [01:08<15:34,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.3555:   6%|███▍                                                  | 114/1824 [01:08<15:14,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 1.9766:   6%|███▍                                                  | 115/1824 [01:09<15:40,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.2188:   6%|███▍                                                  | 116/1824 [01:09<15:15,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.0547:   6%|███▍                                                  | 117/1824 [01:10<15:18,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 1.7480:   6%|███▍                                                  | 118/1824 [01:10<15:14,  1.87it/s]

cuda:0


Epoch 0/4, Loss: 2.0234:   7%|███▌                                                  | 119/1824 [01:11<15:22,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.1680:   7%|███▌                                                  | 120/1824 [01:11<15:21,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.4961:   7%|███▌                                                  | 121/1824 [01:12<15:38,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 1.8555:   7%|███▌                                                  | 122/1824 [01:13<15:42,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.5469:   7%|███▋                                                  | 123/1824 [01:13<15:34,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.0781:   7%|███▋                                                  | 124/1824 [01:14<15:38,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.0977:   7%|███▋                                                  | 125/1824 [01:14<15:19,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.1875:   7%|███▋                                                  | 126/1824 [01:15<15:13,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 1.7812:   7%|███▊                                                  | 127/1824 [01:15<15:31,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 1.7627:   7%|███▊                                                  | 128/1824 [01:16<15:29,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 1.8027:   7%|███▊                                                  | 129/1824 [01:16<15:30,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.1523:   7%|███▊                                                  | 130/1824 [01:17<15:37,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.3164:   7%|███▉                                                  | 131/1824 [01:17<15:30,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.4609:   7%|███▉                                                  | 132/1824 [01:18<15:24,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.1660:   7%|███▉                                                  | 133/1824 [01:19<15:34,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.5312:   7%|███▉                                                  | 134/1824 [01:19<15:27,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.1758:   7%|███▉                                                  | 135/1824 [01:20<15:28,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.1758:   7%|████                                                  | 136/1824 [01:20<15:30,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.1055:   8%|████                                                  | 137/1824 [01:21<15:39,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.1406:   8%|████                                                  | 138/1824 [01:21<15:42,  1.79it/s]

cuda:0


Epoch 0/4, Loss: 2.1465:   8%|████                                                  | 139/1824 [01:22<16:13,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 1.8633:   8%|████▏                                                 | 140/1824 [01:23<16:18,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.3789:   8%|████▏                                                 | 141/1824 [01:23<15:58,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.4668:   8%|████▏                                                 | 142/1824 [01:24<15:44,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 1.7480:   8%|████▏                                                 | 143/1824 [01:24<15:26,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.0586:   8%|████▎                                                 | 144/1824 [01:25<15:38,  1.79it/s]

cuda:0


Epoch 0/4, Loss: 1.9805:   8%|████▎                                                 | 145/1824 [01:25<15:31,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 1.7441:   8%|████▎                                                 | 146/1824 [01:26<15:57,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.0820:   8%|████▎                                                 | 147/1824 [01:26<15:56,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.1719:   8%|████▍                                                 | 148/1824 [01:27<15:57,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.2168:   8%|████▍                                                 | 149/1824 [01:28<16:02,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 1.6689:   8%|████▍                                                 | 150/1824 [01:28<15:57,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 1.8477:   8%|████▍                                                 | 151/1824 [01:29<15:53,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.1250:   8%|████▌                                                 | 152/1824 [01:29<15:53,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 1.8877:   8%|████▌                                                 | 153/1824 [01:30<15:42,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.3281:   8%|████▌                                                 | 154/1824 [01:30<15:20,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.1875:   8%|████▌                                                 | 155/1824 [01:31<15:17,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 1.9277:   9%|████▌                                                 | 156/1824 [01:31<15:10,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.7188:   9%|████▋                                                 | 157/1824 [01:32<15:25,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.4922:   9%|████▋                                                 | 158/1824 [01:33<15:13,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 1.8730:   9%|████▋                                                 | 159/1824 [01:33<15:12,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.2734:   9%|████▋                                                 | 160/1824 [01:34<15:18,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.2773:   9%|████▊                                                 | 161/1824 [01:34<15:02,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 1.9258:   9%|████▊                                                 | 162/1824 [01:35<15:08,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.1445:   9%|████▊                                                 | 163/1824 [01:35<14:53,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.1094:   9%|████▊                                                 | 164/1824 [01:36<15:01,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.0703:   9%|████▉                                                 | 165/1824 [01:36<14:52,  1.86it/s]

cuda:0


Epoch 0/4, Loss: 2.1719:   9%|████▉                                                 | 166/1824 [01:37<15:21,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.1445:   9%|████▉                                                 | 167/1824 [01:37<15:13,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.2031:   9%|████▉                                                 | 168/1824 [01:38<15:11,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.1602:   9%|█████                                                 | 169/1824 [01:39<15:19,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.3379:   9%|█████                                                 | 170/1824 [01:39<15:22,  1.79it/s]

cuda:0


Epoch 0/4, Loss: 2.1016:   9%|█████                                                 | 171/1824 [01:40<15:26,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.3711:   9%|█████                                                 | 172/1824 [01:40<14:56,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.1562:   9%|█████                                                 | 173/1824 [01:41<15:03,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.4766:  10%|█████▏                                                | 174/1824 [01:41<14:58,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.1289:  10%|█████▏                                                | 175/1824 [01:42<15:22,  1.79it/s]

cuda:0


Epoch 0/4, Loss: 2.2031:  10%|█████▏                                                | 176/1824 [01:42<15:15,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.1699:  10%|█████▏                                                | 177/1824 [01:43<15:12,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.2109:  10%|█████▎                                                | 178/1824 [01:44<15:23,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 1.9336:  10%|█████▎                                                | 179/1824 [01:44<15:34,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 1.9883:  10%|█████▎                                                | 180/1824 [01:45<15:56,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.0938:  10%|█████▎                                                | 181/1824 [01:45<15:28,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.5078:  10%|█████▍                                                | 182/1824 [01:46<15:37,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.2148:  10%|█████▍                                                | 183/1824 [01:46<15:28,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.3438:  10%|█████▍                                                | 184/1824 [01:47<15:25,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.2012:  10%|█████▍                                                | 185/1824 [01:48<15:29,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.1816:  10%|█████▌                                                | 186/1824 [01:48<15:29,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.5234:  10%|█████▌                                                | 187/1824 [01:49<15:21,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.3359:  10%|█████▌                                                | 188/1824 [01:49<14:58,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.3535:  10%|█████▌                                                | 189/1824 [01:50<15:06,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.4297:  10%|█████▋                                                | 190/1824 [01:50<14:53,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 1.9854:  10%|█████▋                                                | 191/1824 [01:51<15:12,  1.79it/s]

cuda:0


Epoch 0/4, Loss: 2.3086:  11%|█████▋                                                | 192/1824 [01:51<15:05,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.2305:  11%|█████▋                                                | 193/1824 [01:52<15:19,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.1406:  11%|█████▋                                                | 194/1824 [01:53<15:17,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.2695:  11%|█████▊                                                | 195/1824 [01:53<15:20,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.1797:  11%|█████▊                                                | 196/1824 [01:54<15:38,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.1875:  11%|█████▊                                                | 197/1824 [01:54<15:04,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.1133:  11%|█████▊                                                | 198/1824 [01:55<15:21,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.4531:  11%|█████▉                                                | 199/1824 [01:55<15:21,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.1465:  11%|█████▉                                                | 200/1824 [01:56<15:22,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.2305:  11%|█████▉                                                | 201/1824 [01:57<15:35,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.1641:  11%|█████▉                                                | 202/1824 [01:57<15:11,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.4180:  11%|██████                                                | 203/1824 [01:58<15:18,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.4980:  11%|██████                                                | 204/1824 [01:58<15:15,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.1953:  11%|██████                                                | 205/1824 [01:59<15:12,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.0742:  11%|██████                                                | 206/1824 [01:59<15:05,  1.79it/s]

cuda:0


Epoch 0/4, Loss: 2.1992:  11%|██████▏                                               | 207/1824 [02:00<15:07,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.3164:  11%|██████▏                                               | 208/1824 [02:00<14:51,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.1406:  11%|██████▏                                               | 209/1824 [02:01<14:56,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.5000:  12%|██████▏                                               | 210/1824 [02:02<14:44,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.5234:  12%|██████▏                                               | 211/1824 [02:02<14:37,  1.84it/s]

cuda:0


Epoch 0/4, Loss: 2.8711:  12%|██████▎                                               | 212/1824 [02:03<14:45,  1.82it/s]

cuda:0


Epoch 0/4, Loss: 2.3477:  12%|██████▎                                               | 213/1824 [02:03<14:38,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 3.2578:  12%|██████▎                                               | 214/1824 [02:04<14:37,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.5977:  12%|██████▎                                               | 215/1824 [02:04<14:28,  1.85it/s]

cuda:0


Epoch 0/4, Loss: 2.4648:  12%|██████▍                                               | 216/1824 [02:05<15:21,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.7539:  12%|██████▍                                               | 217/1824 [02:06<15:23,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.7266:  12%|██████▍                                               | 218/1824 [02:06<15:19,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.4180:  12%|██████▍                                               | 219/1824 [02:07<15:13,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.1719:  12%|██████▌                                               | 220/1824 [02:07<15:06,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.4258:  12%|██████▌                                               | 221/1824 [02:08<15:23,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.2070:  12%|██████▌                                               | 222/1824 [02:08<15:14,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.6445:  12%|██████▌                                               | 223/1824 [02:09<15:22,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.2949:  12%|██████▋                                               | 224/1824 [02:09<15:15,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.1328:  12%|██████▋                                               | 225/1824 [02:10<15:03,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.7305:  12%|██████▋                                               | 226/1824 [02:11<15:21,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.1719:  12%|██████▋                                               | 227/1824 [02:11<14:50,  1.79it/s]

cuda:0


Epoch 0/4, Loss: 2.1094:  12%|██████▊                                               | 228/1824 [02:12<14:58,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.5469:  13%|██████▊                                               | 229/1824 [02:12<14:44,  1.80it/s]

cuda:0


Epoch 0/4, Loss: 2.1992:  13%|██████▊                                               | 230/1824 [02:13<15:02,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.3516:  13%|██████▊                                               | 231/1824 [02:13<15:11,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.5898:  13%|██████▊                                               | 232/1824 [02:14<15:04,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.4609:  13%|██████▉                                               | 233/1824 [02:15<15:02,  1.76it/s]

cuda:0


Epoch 0/4, Loss: 2.5352:  13%|██████▉                                               | 234/1824 [02:15<14:54,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.5820:  13%|██████▉                                               | 235/1824 [02:16<14:59,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.7168:  13%|██████▉                                               | 236/1824 [02:16<14:54,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.2793:  13%|███████                                               | 237/1824 [02:17<15:21,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.2793:  13%|███████                                               | 238/1824 [02:18<15:57,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.3398:  13%|███████                                               | 239/1824 [02:18<15:51,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.3008:  13%|███████                                               | 240/1824 [02:19<16:08,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.4766:  13%|███████▏                                              | 241/1824 [02:19<15:31,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.4805:  13%|███████▏                                              | 242/1824 [02:20<15:41,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.4883:  13%|███████▏                                              | 243/1824 [02:20<15:31,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.4395:  13%|███████▏                                              | 244/1824 [02:21<15:18,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  13%|███████▎                                              | 245/1824 [02:22<15:17,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.1309:  13%|███████▎                                              | 246/1824 [02:22<15:14,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.2266:  14%|███████▎                                              | 247/1824 [02:23<15:33,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.5156:  14%|███████▎                                              | 248/1824 [02:23<15:23,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.3086:  14%|███████▎                                              | 249/1824 [02:24<15:11,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.3008:  14%|███████▍                                              | 250/1824 [02:25<15:17,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.2500:  14%|███████▍                                              | 251/1824 [02:25<15:16,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.1465:  14%|███████▍                                              | 252/1824 [02:26<15:23,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.3750:  14%|███████▍                                              | 253/1824 [02:26<15:28,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.6641:  14%|███████▌                                              | 254/1824 [02:27<15:20,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.4102:  14%|███████▌                                              | 255/1824 [02:27<14:59,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.0898:  14%|███████▌                                              | 256/1824 [02:28<15:21,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.3574:  14%|███████▌                                              | 257/1824 [02:29<15:08,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.4102:  14%|███████▋                                              | 258/1824 [02:29<14:38,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.5781:  14%|███████▋                                              | 259/1824 [02:30<14:32,  1.79it/s]

cuda:0


Epoch 0/4, Loss: 2.0430:  14%|███████▋                                              | 260/1824 [02:30<14:40,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.5195:  14%|███████▋                                              | 261/1824 [02:31<14:39,  1.78it/s]

cuda:0


Epoch 0/4, Loss: 2.8672:  14%|███████▊                                              | 262/1824 [02:31<14:11,  1.83it/s]

cuda:0


Epoch 0/4, Loss: 2.3555:  14%|███████▊                                              | 263/1824 [02:32<14:23,  1.81it/s]

cuda:0


Epoch 0/4, Loss: 2.5684:  14%|███████▊                                              | 264/1824 [02:33<14:55,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.6289:  15%|███████▊                                              | 265/1824 [02:33<14:54,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.4219:  15%|███████▉                                              | 266/1824 [02:34<15:29,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.2539:  15%|███████▉                                              | 267/1824 [02:34<15:15,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.7031:  15%|███████▉                                              | 268/1824 [02:35<15:01,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.5625:  15%|███████▉                                              | 269/1824 [02:35<14:59,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.7910:  15%|███████▉                                              | 270/1824 [02:36<14:55,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.5176:  15%|████████                                              | 271/1824 [02:37<15:02,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.8008:  15%|████████                                              | 272/1824 [02:37<14:51,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.7441:  15%|████████                                              | 273/1824 [02:38<14:54,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.6211:  15%|████████                                              | 274/1824 [02:38<14:37,  1.77it/s]

cuda:0


Epoch 0/4, Loss: 2.3477:  15%|████████▏                                             | 275/1824 [02:39<14:49,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.2695:  15%|████████▏                                             | 276/1824 [02:39<14:54,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.3086:  15%|████████▏                                             | 277/1824 [02:40<15:03,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.4043:  15%|████████▏                                             | 278/1824 [02:41<15:05,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.8301:  15%|████████▎                                             | 279/1824 [02:41<14:48,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 1.9424:  15%|████████▎                                             | 280/1824 [02:42<14:51,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 1.9258:  15%|████████▎                                             | 281/1824 [02:42<14:41,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.3379:  15%|████████▎                                             | 282/1824 [02:43<15:05,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.6914:  16%|████████▍                                             | 283/1824 [02:44<15:00,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.2656:  16%|████████▍                                             | 284/1824 [02:44<15:00,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.5645:  16%|████████▍                                             | 285/1824 [02:45<15:12,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.3398:  16%|████████▍                                             | 286/1824 [02:45<14:52,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.4805:  16%|████████▍                                             | 287/1824 [02:46<14:49,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.4570:  16%|████████▌                                             | 288/1824 [02:46<14:45,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.4922:  16%|████████▌                                             | 289/1824 [02:47<14:50,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.5664:  16%|████████▌                                             | 290/1824 [02:48<14:50,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.3008:  16%|████████▌                                             | 291/1824 [02:48<14:43,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.5820:  16%|████████▋                                             | 292/1824 [02:49<14:56,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.2305:  16%|████████▋                                             | 293/1824 [02:49<14:42,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.6758:  16%|████████▋                                             | 294/1824 [02:50<14:58,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.7559:  16%|████████▋                                             | 295/1824 [02:51<15:11,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.0137:  16%|████████▊                                             | 296/1824 [02:51<15:18,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.5195:  16%|████████▊                                             | 297/1824 [02:52<15:33,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.4434:  16%|████████▊                                             | 298/1824 [02:52<15:34,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.2852:  16%|████████▊                                             | 299/1824 [02:53<15:47,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.5430:  16%|████████▉                                             | 300/1824 [02:54<16:01,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.5781:  17%|████████▉                                             | 301/1824 [02:54<15:24,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.5977:  17%|████████▉                                             | 302/1824 [02:55<15:16,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.9707:  17%|████████▉                                             | 303/1824 [02:56<15:17,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.5859:  17%|█████████                                             | 304/1824 [02:56<15:20,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.5039:  17%|█████████                                             | 305/1824 [02:57<15:25,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.4453:  17%|█████████                                             | 306/1824 [02:57<15:08,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.6914:  17%|█████████                                             | 307/1824 [02:58<15:22,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:  17%|█████████                                             | 308/1824 [02:58<15:00,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.7637:  17%|█████████▏                                            | 309/1824 [02:59<14:53,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.6992:  17%|█████████▏                                            | 310/1824 [03:00<14:48,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 3.0156:  17%|█████████▏                                            | 311/1824 [03:00<14:30,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  17%|█████████▏                                            | 312/1824 [03:01<14:42,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:  17%|█████████▎                                            | 313/1824 [03:01<14:26,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.7617:  17%|█████████▎                                            | 314/1824 [03:02<14:29,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.8438:  17%|█████████▎                                            | 315/1824 [03:03<14:30,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.6953:  17%|█████████▎                                            | 316/1824 [03:03<14:25,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.6211:  17%|█████████▍                                            | 317/1824 [03:04<14:32,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  17%|█████████▍                                            | 318/1824 [03:04<14:40,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.9570:  17%|█████████▍                                            | 319/1824 [03:05<14:42,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  18%|█████████▍                                            | 320/1824 [03:05<14:31,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.8418:  18%|█████████▌                                            | 321/1824 [03:06<14:37,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.8164:  18%|█████████▌                                            | 322/1824 [03:07<14:30,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.8652:  18%|█████████▌                                            | 323/1824 [03:07<14:27,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 3.1211:  18%|█████████▌                                            | 324/1824 [03:08<14:22,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.8086:  18%|█████████▌                                            | 325/1824 [03:08<14:25,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.5625:  18%|█████████▋                                            | 326/1824 [03:09<14:51,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:  18%|█████████▋                                            | 327/1824 [03:10<15:00,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7949:  18%|█████████▋                                            | 328/1824 [03:10<14:53,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.8867:  18%|█████████▋                                            | 329/1824 [03:11<14:21,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.8438:  18%|█████████▊                                            | 330/1824 [03:11<14:26,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  18%|█████████▊                                            | 331/1824 [03:12<14:32,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.4492:  18%|█████████▊                                            | 332/1824 [03:12<14:41,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.3984:  18%|█████████▊                                            | 333/1824 [03:13<14:40,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.7461:  18%|█████████▉                                            | 334/1824 [03:14<14:25,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.7383:  18%|█████████▉                                            | 335/1824 [03:14<14:23,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.8418:  18%|█████████▉                                            | 336/1824 [03:15<14:15,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.9043:  18%|█████████▉                                            | 337/1824 [03:15<14:36,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:  19%|██████████                                            | 338/1824 [03:16<14:41,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.8574:  19%|██████████                                            | 339/1824 [03:17<14:59,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0449:  19%|██████████                                            | 340/1824 [03:17<15:00,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.3750:  19%|██████████                                            | 341/1824 [03:18<15:03,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.6953:  19%|██████████▏                                           | 342/1824 [03:18<14:55,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7461:  19%|██████████▏                                           | 343/1824 [03:19<15:03,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8242:  19%|██████████▏                                           | 344/1824 [03:20<14:52,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7168:  19%|██████████▏                                           | 345/1824 [03:20<14:42,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.7383:  19%|██████████▏                                           | 346/1824 [03:21<14:34,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 3.0664:  19%|██████████▎                                           | 347/1824 [03:21<14:52,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.6875:  19%|██████████▎                                           | 348/1824 [03:22<14:54,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.6367:  19%|██████████▎                                           | 349/1824 [03:23<14:48,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7070:  19%|██████████▎                                           | 350/1824 [03:23<14:55,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.7461:  19%|██████████▍                                           | 351/1824 [03:24<14:57,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7188:  19%|██████████▍                                           | 352/1824 [03:24<14:35,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.2676:  19%|██████████▍                                           | 353/1824 [03:25<14:20,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.2285:  19%|██████████▍                                           | 354/1824 [03:26<14:36,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.2500:  19%|██████████▌                                           | 355/1824 [03:26<14:43,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.4766:  20%|██████████▌                                           | 356/1824 [03:27<14:43,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.6934:  20%|██████████▌                                           | 357/1824 [03:27<14:15,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.6816:  20%|██████████▌                                           | 358/1824 [03:28<14:30,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  20%|██████████▋                                           | 359/1824 [03:29<14:29,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.6211:  20%|██████████▋                                           | 360/1824 [03:29<14:22,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.8203:  20%|██████████▋                                           | 361/1824 [03:30<14:33,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  20%|██████████▋                                           | 362/1824 [03:30<14:16,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.7344:  20%|██████████▋                                           | 363/1824 [03:31<14:11,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.9277:  20%|██████████▊                                           | 364/1824 [03:32<14:16,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.5273:  20%|██████████▊                                           | 365/1824 [03:32<14:31,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.6855:  20%|██████████▊                                           | 366/1824 [03:33<14:37,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.3398:  20%|██████████▊                                           | 367/1824 [03:33<14:48,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8223:  20%|██████████▉                                           | 368/1824 [03:34<14:27,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.6504:  20%|██████████▉                                           | 369/1824 [03:35<14:13,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.7363:  20%|██████████▉                                           | 370/1824 [03:35<14:05,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.3516:  20%|██████████▉                                           | 371/1824 [03:36<13:50,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 3.2168:  20%|███████████                                           | 372/1824 [03:36<13:57,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.8066:  20%|███████████                                           | 373/1824 [03:37<14:07,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.6426:  21%|███████████                                           | 374/1824 [03:37<14:14,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.8184:  21%|███████████                                           | 375/1824 [03:38<14:12,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 3.1445:  21%|███████████▏                                          | 376/1824 [03:39<14:10,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.6660:  21%|███████████▏                                          | 377/1824 [03:39<13:51,  1.74it/s]

cuda:0


Epoch 0/4, Loss: 2.4629:  21%|███████████▏                                          | 378/1824 [03:40<14:07,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.7734:  21%|███████████▏                                          | 379/1824 [03:40<14:20,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.8047:  21%|███████████▎                                          | 380/1824 [03:41<14:34,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.7383:  21%|███████████▎                                          | 381/1824 [03:42<14:27,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7070:  21%|███████████▎                                          | 382/1824 [03:42<14:15,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.6582:  21%|███████████▎                                          | 383/1824 [03:43<14:54,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.6875:  21%|███████████▎                                          | 384/1824 [03:43<14:35,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  21%|███████████▍                                          | 385/1824 [03:44<14:25,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  21%|███████████▍                                          | 386/1824 [03:45<14:21,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.9727:  21%|███████████▍                                          | 387/1824 [03:45<14:31,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1367:  21%|███████████▍                                          | 388/1824 [03:46<14:27,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  21%|███████████▌                                          | 389/1824 [03:46<14:21,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0820:  21%|███████████▌                                          | 390/1824 [03:47<14:19,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.7734:  21%|███████████▌                                          | 391/1824 [03:48<14:31,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  21%|███████████▌                                          | 392/1824 [03:48<14:23,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7930:  22%|███████████▋                                          | 393/1824 [03:49<14:49,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.7480:  22%|███████████▋                                          | 394/1824 [03:49<14:29,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.6094:  22%|███████████▋                                          | 395/1824 [03:50<14:25,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.6484:  22%|███████████▋                                          | 396/1824 [03:51<14:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.2500:  22%|███████████▊                                          | 397/1824 [03:51<14:28,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7461:  22%|███████████▊                                          | 398/1824 [03:52<14:22,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.7266:  22%|███████████▊                                          | 399/1824 [03:52<13:51,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 3.2402:  22%|███████████▊                                          | 400/1824 [03:53<14:00,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.8613:  22%|███████████▊                                          | 401/1824 [03:54<14:27,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  22%|███████████▉                                          | 402/1824 [03:54<14:16,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1953:  22%|███████████▉                                          | 403/1824 [03:55<14:29,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.6367:  22%|███████████▉                                          | 404/1824 [03:56<14:28,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7520:  22%|███████████▉                                          | 405/1824 [03:56<14:14,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7188:  22%|████████████                                          | 406/1824 [03:57<14:19,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.4941:  22%|████████████                                          | 407/1824 [03:57<14:15,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.6562:  22%|████████████                                          | 408/1824 [03:58<14:20,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.7070:  22%|████████████                                          | 409/1824 [03:59<14:18,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  22%|████████████▏                                         | 410/1824 [03:59<13:57,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.9570:  23%|████████████▏                                         | 411/1824 [04:00<13:53,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.5195:  23%|████████████▏                                         | 412/1824 [04:00<13:55,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.7480:  23%|████████████▏                                         | 413/1824 [04:01<14:09,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  23%|████████████▎                                         | 414/1824 [04:01<13:44,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.6660:  23%|████████████▎                                         | 415/1824 [04:02<13:52,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.6348:  23%|████████████▎                                         | 416/1824 [04:03<13:44,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.8066:  23%|████████████▎                                         | 417/1824 [04:03<13:55,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.8965:  23%|████████████▍                                         | 418/1824 [04:04<13:42,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  23%|████████████▍                                         | 419/1824 [04:04<13:21,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.7773:  23%|████████████▍                                         | 420/1824 [04:05<13:23,  1.75it/s]

cuda:0


Epoch 0/4, Loss: 2.9180:  23%|████████████▍                                         | 421/1824 [04:06<13:42,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:  23%|████████████▍                                         | 422/1824 [04:06<13:56,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.3125:  23%|████████████▌                                         | 423/1824 [04:07<13:57,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  23%|████████████▌                                         | 424/1824 [04:07<13:52,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  23%|████████████▌                                         | 425/1824 [04:08<14:00,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.9941:  23%|████████████▌                                         | 426/1824 [04:09<14:01,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.2930:  23%|████████████▋                                         | 427/1824 [04:09<13:46,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.9629:  23%|████████████▋                                         | 428/1824 [04:10<13:55,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.9062:  24%|████████████▋                                         | 429/1824 [04:10<13:50,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.9316:  24%|████████████▋                                         | 430/1824 [04:11<13:51,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.8789:  24%|████████████▊                                         | 431/1824 [04:11<13:35,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  24%|████████████▊                                         | 432/1824 [04:12<13:30,  1.72it/s]

cuda:0


Epoch 0/4, Loss: 2.7266:  24%|████████████▊                                         | 433/1824 [04:13<13:49,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  24%|████████████▊                                         | 434/1824 [04:13<13:37,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  24%|████████████▉                                         | 435/1824 [04:14<13:55,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:  24%|████████████▉                                         | 436/1824 [04:15<13:56,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  24%|████████████▉                                         | 437/1824 [04:15<14:03,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  24%|████████████▉                                         | 438/1824 [04:16<13:55,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1875:  24%|████████████▉                                         | 439/1824 [04:16<14:14,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.6855:  24%|█████████████                                         | 440/1824 [04:17<14:25,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.2148:  24%|█████████████                                         | 441/1824 [04:18<14:25,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.7832:  24%|█████████████                                         | 442/1824 [04:18<14:21,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.6191:  24%|█████████████                                         | 443/1824 [04:19<14:17,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1641:  24%|█████████████▏                                        | 444/1824 [04:19<14:10,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.6465:  24%|█████████████▏                                        | 445/1824 [04:20<14:57,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  24%|█████████████▏                                        | 446/1824 [04:21<15:03,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  25%|█████████████▏                                        | 447/1824 [04:22<15:02,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  25%|█████████████▎                                        | 448/1824 [04:22<14:45,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8691:  25%|█████████████▎                                        | 449/1824 [04:23<14:30,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7969:  25%|█████████████▎                                        | 450/1824 [04:23<14:20,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  25%|█████████████▎                                        | 451/1824 [04:24<14:15,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.7324:  25%|█████████████▍                                        | 452/1824 [04:25<14:07,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7031:  25%|█████████████▍                                        | 453/1824 [04:25<13:51,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  25%|█████████████▍                                        | 454/1824 [04:26<13:49,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.5703:  25%|█████████████▍                                        | 455/1824 [04:26<13:58,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0762:  25%|█████████████▌                                        | 456/1824 [04:27<13:48,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  25%|█████████████▌                                        | 457/1824 [04:28<13:51,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8086:  25%|█████████████▌                                        | 458/1824 [04:28<13:43,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:  25%|█████████████▌                                        | 459/1824 [04:29<13:47,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.7969:  25%|█████████████▌                                        | 460/1824 [04:29<13:50,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7344:  25%|█████████████▋                                        | 461/1824 [04:30<13:48,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8867:  25%|█████████████▋                                        | 462/1824 [04:31<13:45,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.8398:  25%|█████████████▋                                        | 463/1824 [04:31<13:52,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  25%|█████████████▋                                        | 464/1824 [04:32<13:48,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8438:  25%|█████████████▊                                        | 465/1824 [04:32<13:51,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.6953:  26%|█████████████▊                                        | 466/1824 [04:33<13:59,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7480:  26%|█████████████▊                                        | 467/1824 [04:34<14:32,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1641:  26%|█████████████▊                                        | 468/1824 [04:34<14:15,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.8926:  26%|█████████████▉                                        | 469/1824 [04:35<14:00,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8008:  26%|█████████████▉                                        | 470/1824 [04:36<14:04,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1680:  26%|█████████████▉                                        | 471/1824 [04:36<13:58,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9336:  26%|█████████████▉                                        | 472/1824 [04:37<14:03,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1016:  26%|██████████████                                        | 473/1824 [04:38<14:28,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  26%|██████████████                                        | 474/1824 [04:38<14:11,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1719:  26%|██████████████                                        | 475/1824 [04:39<14:06,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9785:  26%|██████████████                                        | 476/1824 [04:39<14:17,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8477:  26%|██████████████                                        | 477/1824 [04:40<14:22,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  26%|██████████████▏                                       | 478/1824 [04:41<14:10,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  26%|██████████████▏                                       | 479/1824 [04:41<14:11,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1406:  26%|██████████████▏                                       | 480/1824 [04:42<14:04,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1348:  26%|██████████████▏                                       | 481/1824 [04:43<14:02,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.6504:  26%|██████████████▎                                       | 482/1824 [04:43<14:16,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.6289:  26%|██████████████▎                                       | 483/1824 [04:44<13:54,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.6602:  27%|██████████████▎                                       | 484/1824 [04:44<14:02,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.5312:  27%|██████████████▎                                       | 485/1824 [04:45<13:39,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  27%|██████████████▍                                       | 486/1824 [04:46<13:51,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9883:  27%|██████████████▍                                       | 487/1824 [04:46<13:40,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  27%|██████████████▍                                       | 488/1824 [04:47<13:42,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  27%|██████████████▍                                       | 489/1824 [04:48<13:51,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1445:  27%|██████████████▌                                       | 490/1824 [04:48<13:38,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2109:  27%|██████████████▌                                       | 491/1824 [04:49<13:45,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  27%|██████████████▌                                       | 492/1824 [04:49<13:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  27%|██████████████▌                                       | 493/1824 [04:50<13:41,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1719:  27%|██████████████▌                                       | 494/1824 [04:51<13:39,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7422:  27%|██████████████▋                                       | 495/1824 [04:51<13:30,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7168:  27%|██████████████▋                                       | 496/1824 [04:52<13:37,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8535:  27%|██████████████▋                                       | 497/1824 [04:52<13:33,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  27%|██████████████▋                                       | 498/1824 [04:53<13:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1855:  27%|██████████████▊                                       | 499/1824 [04:54<13:37,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9199:  27%|██████████████▊                                       | 500/1824 [04:54<13:55,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1094:  27%|██████████████▊                                       | 501/1824 [04:55<13:56,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  28%|██████████████▊                                       | 502/1824 [04:56<13:45,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.6016:  28%|██████████████▉                                       | 503/1824 [04:56<13:46,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.6875:  28%|██████████████▉                                       | 504/1824 [04:57<14:02,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.6719:  28%|██████████████▉                                       | 505/1824 [04:58<14:02,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  28%|██████████████▉                                       | 506/1824 [04:58<13:45,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0254:  28%|███████████████                                       | 507/1824 [04:59<13:47,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0195:  28%|███████████████                                       | 508/1824 [04:59<13:51,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  28%|███████████████                                       | 509/1824 [05:00<13:53,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:  28%|███████████████                                       | 510/1824 [05:01<13:43,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8535:  28%|███████████████▏                                      | 511/1824 [05:01<13:46,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  28%|███████████████▏                                      | 512/1824 [05:02<13:45,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.5645:  28%|███████████████▏                                      | 513/1824 [05:03<13:50,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7461:  28%|███████████████▏                                      | 514/1824 [05:03<13:43,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.7383:  28%|███████████████▏                                      | 515/1824 [05:04<13:31,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9062:  28%|███████████████▎                                      | 516/1824 [05:04<13:48,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.6875:  28%|███████████████▎                                      | 517/1824 [05:05<13:45,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1738:  28%|███████████████▎                                      | 518/1824 [05:06<14:04,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.6953:  28%|███████████████▎                                      | 519/1824 [05:06<14:07,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  29%|███████████████▍                                      | 520/1824 [05:07<14:06,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  29%|███████████████▍                                      | 521/1824 [05:08<14:02,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1289:  29%|███████████████▍                                      | 522/1824 [05:08<13:48,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8125:  29%|███████████████▍                                      | 523/1824 [05:09<13:42,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8574:  29%|███████████████▌                                      | 524/1824 [05:10<13:57,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.5469:  29%|███████████████▌                                      | 525/1824 [05:10<14:01,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9199:  29%|███████████████▌                                      | 526/1824 [05:11<13:53,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  29%|███████████████▌                                      | 527/1824 [05:11<13:40,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  29%|███████████████▋                                      | 528/1824 [05:12<13:28,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.2305:  29%|███████████████▋                                      | 529/1824 [05:13<13:38,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1641:  29%|███████████████▋                                      | 530/1824 [05:13<13:19,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  29%|███████████████▋                                      | 531/1824 [05:14<13:14,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0332:  29%|███████████████▊                                      | 532/1824 [05:15<13:19,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9512:  29%|███████████████▊                                      | 533/1824 [05:15<13:32,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.7539:  29%|███████████████▊                                      | 534/1824 [05:16<13:31,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.8359:  29%|███████████████▊                                      | 535/1824 [05:16<13:34,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.6133:  29%|███████████████▊                                      | 536/1824 [05:17<13:52,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:  29%|███████████████▉                                      | 537/1824 [05:18<14:02,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.3047:  29%|███████████████▉                                      | 538/1824 [05:18<13:45,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  30%|███████████████▉                                      | 539/1824 [05:19<13:29,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9727:  30%|███████████████▉                                      | 540/1824 [05:20<13:31,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  30%|████████████████                                      | 541/1824 [05:20<13:54,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8926:  30%|████████████████                                      | 542/1824 [05:21<13:42,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0430:  30%|████████████████                                      | 543/1824 [05:22<13:37,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.7324:  30%|████████████████                                      | 544/1824 [05:22<13:36,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9082:  30%|████████████████▏                                     | 545/1824 [05:23<13:30,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.6191:  30%|████████████████▏                                     | 546/1824 [05:24<13:27,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.6641:  30%|████████████████▏                                     | 547/1824 [05:24<13:22,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.7266:  30%|████████████████▏                                     | 548/1824 [05:25<13:33,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  30%|████████████████▎                                     | 549/1824 [05:25<13:31,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  30%|████████████████▎                                     | 550/1824 [05:26<13:16,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0625:  30%|████████████████▎                                     | 551/1824 [05:27<13:04,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.4941:  30%|████████████████▎                                     | 552/1824 [05:27<13:35,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1777:  30%|████████████████▎                                     | 553/1824 [05:28<13:41,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.2910:  30%|████████████████▍                                     | 554/1824 [05:29<13:33,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0957:  30%|████████████████▍                                     | 555/1824 [05:29<13:25,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.2891:  30%|████████████████▍                                     | 556/1824 [05:30<13:18,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  31%|████████████████▍                                     | 557/1824 [05:30<13:15,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9883:  31%|████████████████▌                                     | 558/1824 [05:31<13:12,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:  31%|████████████████▌                                     | 559/1824 [05:32<13:21,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  31%|████████████████▌                                     | 560/1824 [05:32<13:24,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9727:  31%|████████████████▌                                     | 561/1824 [05:33<13:07,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  31%|████████████████▋                                     | 562/1824 [05:34<13:21,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9590:  31%|████████████████▋                                     | 563/1824 [05:34<13:37,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.7422:  31%|████████████████▋                                     | 564/1824 [05:35<13:47,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.1895:  31%|████████████████▋                                     | 565/1824 [05:36<13:29,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  31%|████████████████▊                                     | 566/1824 [05:36<13:32,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.3164:  31%|████████████████▊                                     | 567/1824 [05:37<13:14,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.3086:  31%|████████████████▊                                     | 568/1824 [05:38<13:12,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8496:  31%|████████████████▊                                     | 569/1824 [05:38<13:04,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1094:  31%|████████████████▉                                     | 570/1824 [05:39<13:02,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9062:  31%|████████████████▉                                     | 571/1824 [05:39<12:59,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9941:  31%|████████████████▉                                     | 572/1824 [05:40<12:52,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7246:  31%|████████████████▉                                     | 573/1824 [05:41<12:52,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.5176:  31%|████████████████▉                                     | 574/1824 [05:41<12:50,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7578:  32%|█████████████████                                     | 575/1824 [05:42<12:47,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  32%|█████████████████                                     | 576/1824 [05:42<12:38,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  32%|█████████████████                                     | 577/1824 [05:43<13:02,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9512:  32%|█████████████████                                     | 578/1824 [05:44<13:24,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8105:  32%|█████████████████▏                                    | 579/1824 [05:44<13:35,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8086:  32%|█████████████████▏                                    | 580/1824 [05:45<13:27,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1211:  32%|█████████████████▏                                    | 581/1824 [05:46<13:20,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0020:  32%|█████████████████▏                                    | 582/1824 [05:46<13:31,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8398:  32%|█████████████████▎                                    | 583/1824 [05:47<13:01,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  32%|█████████████████▎                                    | 584/1824 [05:48<12:50,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.6016:  32%|█████████████████▎                                    | 585/1824 [05:48<12:44,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  32%|█████████████████▎                                    | 586/1824 [05:49<12:52,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  32%|█████████████████▍                                    | 587/1824 [05:49<12:44,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  32%|█████████████████▍                                    | 588/1824 [05:50<12:58,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1621:  32%|█████████████████▍                                    | 589/1824 [05:51<13:03,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0078:  32%|█████████████████▍                                    | 590/1824 [05:51<12:50,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1113:  32%|█████████████████▍                                    | 591/1824 [05:52<12:40,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7852:  32%|█████████████████▌                                    | 592/1824 [05:53<12:55,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.6797:  33%|█████████████████▌                                    | 593/1824 [05:53<12:58,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1543:  33%|█████████████████▌                                    | 594/1824 [05:54<13:02,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  33%|█████████████████▌                                    | 595/1824 [05:55<13:10,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  33%|█████████████████▋                                    | 596/1824 [05:55<13:30,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  33%|█████████████████▋                                    | 597/1824 [05:56<13:14,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8789:  33%|█████████████████▋                                    | 598/1824 [05:56<13:12,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1875:  33%|█████████████████▋                                    | 599/1824 [05:57<13:21,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1211:  33%|█████████████████▊                                    | 600/1824 [05:58<13:02,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  33%|█████████████████▊                                    | 601/1824 [05:58<12:59,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.6953:  33%|█████████████████▊                                    | 602/1824 [05:59<12:48,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.8672:  33%|█████████████████▊                                    | 603/1824 [06:00<12:52,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  33%|█████████████████▉                                    | 604/1824 [06:00<12:41,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1328:  33%|█████████████████▉                                    | 605/1824 [06:01<12:38,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.5879:  33%|█████████████████▉                                    | 606/1824 [06:01<12:42,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9121:  33%|█████████████████▉                                    | 607/1824 [06:02<12:33,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.5664:  33%|██████████████████                                    | 608/1824 [06:03<12:27,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.6484:  33%|██████████████████                                    | 609/1824 [06:03<12:31,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1914:  33%|██████████████████                                    | 610/1824 [06:04<12:21,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9062:  33%|██████████████████                                    | 611/1824 [06:05<12:28,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1875:  34%|██████████████████                                    | 612/1824 [06:05<12:33,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  34%|██████████████████▏                                   | 613/1824 [06:06<12:27,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8164:  34%|██████████████████▏                                   | 614/1824 [06:06<12:21,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8262:  34%|██████████████████▏                                   | 615/1824 [06:07<12:43,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  34%|██████████████████▏                                   | 616/1824 [06:08<12:47,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9355:  34%|██████████████████▎                                   | 617/1824 [06:08<12:45,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7539:  34%|██████████████████▎                                   | 618/1824 [06:09<12:46,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.3281:  34%|██████████████████▎                                   | 619/1824 [06:10<12:42,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1914:  34%|██████████████████▎                                   | 620/1824 [06:10<12:34,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9746:  34%|██████████████████▍                                   | 621/1824 [06:11<12:37,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1562:  34%|██████████████████▍                                   | 622/1824 [06:11<12:32,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  34%|██████████████████▍                                   | 623/1824 [06:12<12:29,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  34%|██████████████████▍                                   | 624/1824 [06:13<12:33,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.5273:  34%|██████████████████▌                                   | 625/1824 [06:13<12:21,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8906:  34%|██████████████████▌                                   | 626/1824 [06:14<12:26,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  34%|██████████████████▌                                   | 627/1824 [06:15<12:28,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  34%|██████████████████▌                                   | 628/1824 [06:15<12:17,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1094:  34%|██████████████████▌                                   | 629/1824 [06:16<12:17,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  35%|██████████████████▋                                   | 630/1824 [06:16<12:17,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1875:  35%|██████████████████▋                                   | 631/1824 [06:17<12:13,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.3672:  35%|██████████████████▋                                   | 632/1824 [06:18<12:14,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1289:  35%|██████████████████▋                                   | 633/1824 [06:18<12:12,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0625:  35%|██████████████████▊                                   | 634/1824 [06:19<12:17,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.6582:  35%|██████████████████▊                                   | 635/1824 [06:20<12:34,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  35%|██████████████████▊                                   | 636/1824 [06:20<12:49,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  35%|██████████████████▊                                   | 637/1824 [06:21<12:43,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1660:  35%|██████████████████▉                                   | 638/1824 [06:22<12:54,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.7031:  35%|██████████████████▉                                   | 639/1824 [06:22<12:50,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2188:  35%|██████████████████▉                                   | 640/1824 [06:23<12:39,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.5820:  35%|██████████████████▉                                   | 641/1824 [06:23<12:41,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8789:  35%|███████████████████                                   | 642/1824 [06:24<12:35,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8008:  35%|███████████████████                                   | 643/1824 [06:25<12:28,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  35%|███████████████████                                   | 644/1824 [06:25<12:17,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  35%|███████████████████                                   | 645/1824 [06:26<12:15,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.7891:  35%|███████████████████▏                                  | 646/1824 [06:27<12:09,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8359:  35%|███████████████████▏                                  | 647/1824 [06:27<12:16,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  36%|███████████████████▏                                  | 648/1824 [06:28<12:11,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  36%|███████████████████▏                                  | 649/1824 [06:28<12:18,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1191:  36%|███████████████████▏                                  | 650/1824 [06:29<12:11,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  36%|███████████████████▎                                  | 651/1824 [06:30<12:19,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.2891:  36%|███████████████████▎                                  | 652/1824 [06:30<12:21,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  36%|███████████████████▎                                  | 653/1824 [06:31<12:11,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  36%|███████████████████▎                                  | 654/1824 [06:32<12:07,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  36%|███████████████████▍                                  | 655/1824 [06:32<12:03,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0137:  36%|███████████████████▍                                  | 656/1824 [06:33<12:04,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  36%|███████████████████▍                                  | 657/1824 [06:33<12:03,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2383:  36%|███████████████████▍                                  | 658/1824 [06:34<11:56,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2363:  36%|███████████████████▌                                  | 659/1824 [06:35<11:59,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  36%|███████████████████▌                                  | 660/1824 [06:35<11:57,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1309:  36%|███████████████████▌                                  | 661/1824 [06:36<12:00,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2910:  36%|███████████████████▌                                  | 662/1824 [06:36<11:53,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  36%|███████████████████▋                                  | 663/1824 [06:37<11:54,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1152:  36%|███████████████████▋                                  | 664/1824 [06:38<11:47,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0215:  36%|███████████████████▋                                  | 665/1824 [06:38<11:56,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2852:  37%|███████████████████▋                                  | 666/1824 [06:39<11:52,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9941:  37%|███████████████████▋                                  | 667/1824 [06:40<11:56,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  37%|███████████████████▊                                  | 668/1824 [06:40<12:17,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  37%|███████████████████▊                                  | 669/1824 [06:41<12:19,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9473:  37%|███████████████████▊                                  | 670/1824 [06:42<12:30,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8555:  37%|███████████████████▊                                  | 671/1824 [06:42<12:27,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  37%|███████████████████▉                                  | 672/1824 [06:43<12:19,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8711:  37%|███████████████████▉                                  | 673/1824 [06:43<12:18,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  37%|███████████████████▉                                  | 674/1824 [06:44<11:51,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  37%|███████████████████▉                                  | 675/1824 [06:45<11:50,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8223:  37%|████████████████████                                  | 676/1824 [06:45<11:50,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1113:  37%|████████████████████                                  | 677/1824 [06:46<11:57,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8574:  37%|████████████████████                                  | 678/1824 [06:47<12:28,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0625:  37%|████████████████████                                  | 679/1824 [06:47<12:21,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  37%|████████████████████▏                                 | 680/1824 [06:48<12:07,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2266:  37%|████████████████████▏                                 | 681/1824 [06:49<12:02,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8516:  37%|████████████████████▏                                 | 682/1824 [06:49<12:00,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9785:  37%|████████████████████▏                                 | 683/1824 [06:50<12:10,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.7734:  38%|████████████████████▎                                 | 684/1824 [06:50<12:02,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1035:  38%|████████████████████▎                                 | 685/1824 [06:51<11:47,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  38%|████████████████████▎                                 | 686/1824 [06:52<11:44,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0625:  38%|████████████████████▎                                 | 687/1824 [06:52<11:49,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9121:  38%|████████████████████▎                                 | 688/1824 [06:53<11:41,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.3008:  38%|████████████████████▍                                 | 689/1824 [06:53<11:39,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1484:  38%|████████████████████▍                                 | 690/1824 [06:54<11:45,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  38%|████████████████████▍                                 | 691/1824 [06:55<12:03,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0391:  38%|████████████████████▍                                 | 692/1824 [06:55<12:04,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.2266:  38%|████████████████████▌                                 | 693/1824 [06:56<12:11,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1738:  38%|████████████████████▌                                 | 694/1824 [06:57<12:17,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9062:  38%|████████████████████▌                                 | 695/1824 [06:57<11:59,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.7656:  38%|████████████████████▌                                 | 696/1824 [06:58<11:49,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0625:  38%|████████████████████▋                                 | 697/1824 [06:59<12:16,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  38%|████████████████████▋                                 | 698/1824 [06:59<12:05,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  38%|████████████████████▋                                 | 699/1824 [07:00<11:59,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9336:  38%|████████████████████▋                                 | 700/1824 [07:01<12:07,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  38%|████████████████████▊                                 | 701/1824 [07:01<12:07,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2852:  38%|████████████████████▊                                 | 702/1824 [07:02<12:02,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8008:  39%|████████████████████▊                                 | 703/1824 [07:03<12:12,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8477:  39%|████████████████████▊                                 | 704/1824 [07:03<12:05,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  39%|████████████████████▊                                 | 705/1824 [07:04<12:10,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9180:  39%|████████████████████▉                                 | 706/1824 [07:05<12:08,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8125:  39%|████████████████████▉                                 | 707/1824 [07:05<12:02,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  39%|████████████████████▉                                 | 708/1824 [07:06<12:05,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.7480:  39%|████████████████████▉                                 | 709/1824 [07:06<12:06,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  39%|█████████████████████                                 | 710/1824 [07:07<12:10,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  39%|█████████████████████                                 | 711/1824 [07:08<12:11,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  39%|█████████████████████                                 | 712/1824 [07:08<12:13,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  39%|█████████████████████                                 | 713/1824 [07:09<11:53,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.7305:  39%|█████████████████████▏                                | 714/1824 [07:10<11:45,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8164:  39%|█████████████████████▏                                | 715/1824 [07:10<11:38,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0078:  39%|█████████████████████▏                                | 716/1824 [07:11<11:28,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  39%|█████████████████████▏                                | 717/1824 [07:11<11:18,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.7324:  39%|█████████████████████▎                                | 718/1824 [07:12<11:31,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  39%|█████████████████████▎                                | 719/1824 [07:13<11:20,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  39%|█████████████████████▎                                | 720/1824 [07:13<11:21,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2363:  40%|█████████████████████▎                                | 721/1824 [07:14<11:15,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8730:  40%|█████████████████████▍                                | 722/1824 [07:15<11:27,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1641:  40%|█████████████████████▍                                | 723/1824 [07:15<11:14,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  40%|█████████████████████▍                                | 724/1824 [07:16<11:16,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1230:  40%|█████████████████████▍                                | 725/1824 [07:16<11:14,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0039:  40%|█████████████████████▍                                | 726/1824 [07:17<11:40,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0723:  40%|█████████████████████▌                                | 727/1824 [07:18<11:57,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0898:  40%|█████████████████████▌                                | 728/1824 [07:18<12:02,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.8535:  40%|█████████████████████▌                                | 729/1824 [07:19<12:16,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  40%|█████████████████████▌                                | 730/1824 [07:20<12:15,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.2148:  40%|█████████████████████▋                                | 731/1824 [07:21<12:08,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.4102:  40%|█████████████████████▋                                | 732/1824 [07:21<11:53,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0898:  40%|█████████████████████▋                                | 733/1824 [07:22<12:04,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.9707:  40%|█████████████████████▋                                | 734/1824 [07:23<12:11,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.9688:  40%|█████████████████████▊                                | 735/1824 [07:23<12:04,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.1465:  40%|█████████████████████▊                                | 736/1824 [07:24<11:47,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2031:  40%|█████████████████████▊                                | 737/1824 [07:24<11:35,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.4023:  40%|█████████████████████▊                                | 738/1824 [07:25<11:25,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9883:  41%|█████████████████████▉                                | 739/1824 [07:26<11:25,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1504:  41%|█████████████████████▉                                | 740/1824 [07:26<11:19,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1367:  41%|█████████████████████▉                                | 741/1824 [07:27<11:20,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  41%|█████████████████████▉                                | 742/1824 [07:27<11:07,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0898:  41%|█████████████████████▉                                | 743/1824 [07:28<11:10,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1562:  41%|██████████████████████                                | 744/1824 [07:29<11:00,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  41%|██████████████████████                                | 745/1824 [07:29<11:07,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2188:  41%|██████████████████████                                | 746/1824 [07:30<11:01,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  41%|██████████████████████                                | 747/1824 [07:31<10:49,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.9082:  41%|██████████████████████▏                               | 748/1824 [07:31<10:42,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.3047:  41%|██████████████████████▏                               | 749/1824 [07:32<10:58,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2227:  41%|██████████████████████▏                               | 750/1824 [07:32<10:58,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2559:  41%|██████████████████████▏                               | 751/1824 [07:33<10:49,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.9551:  41%|██████████████████████▎                               | 752/1824 [07:34<10:41,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0332:  41%|██████████████████████▎                               | 753/1824 [07:34<10:41,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  41%|██████████████████████▎                               | 754/1824 [07:35<10:50,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.2305:  41%|██████████████████████▎                               | 755/1824 [07:35<10:47,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.4531:  41%|██████████████████████▍                               | 756/1824 [07:36<10:55,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  42%|██████████████████████▍                               | 757/1824 [07:37<11:03,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0156:  42%|██████████████████████▍                               | 758/1824 [07:37<10:42,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  42%|██████████████████████▍                               | 759/1824 [07:38<10:42,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.8594:  42%|██████████████████████▌                               | 760/1824 [07:38<10:47,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  42%|██████████████████████▌                               | 761/1824 [07:39<10:24,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 3.1328:  42%|██████████████████████▌                               | 762/1824 [07:40<10:30,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.0059:  42%|██████████████████████▌                               | 763/1824 [07:40<10:33,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 2.9648:  42%|██████████████████████▌                               | 764/1824 [07:41<10:32,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  42%|██████████████████████▋                               | 765/1824 [07:41<10:37,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  42%|██████████████████████▋                               | 766/1824 [07:42<10:42,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0078:  42%|██████████████████████▋                               | 767/1824 [07:43<10:41,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0938:  42%|██████████████████████▋                               | 768/1824 [07:43<10:26,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  42%|██████████████████████▊                               | 769/1824 [07:44<10:24,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 3.3340:  42%|██████████████████████▊                               | 770/1824 [07:44<10:30,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.8867:  42%|██████████████████████▊                               | 771/1824 [07:45<10:36,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0410:  42%|██████████████████████▊                               | 772/1824 [07:46<10:09,  1.73it/s]

cuda:0


Epoch 0/4, Loss: 2.8242:  42%|██████████████████████▉                               | 773/1824 [07:46<10:54,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2891:  42%|██████████████████████▉                               | 774/1824 [07:47<11:03,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7266:  42%|██████████████████████▉                               | 775/1824 [07:48<11:05,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  43%|██████████████████████▉                               | 776/1824 [07:48<11:02,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8047:  43%|███████████████████████                               | 777/1824 [07:49<11:00,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  43%|███████████████████████                               | 778/1824 [07:49<10:57,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0879:  43%|███████████████████████                               | 779/1824 [07:50<11:01,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9941:  43%|███████████████████████                               | 780/1824 [07:51<11:13,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  43%|███████████████████████                               | 781/1824 [07:51<11:07,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9570:  43%|███████████████████████▏                              | 782/1824 [07:52<11:15,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0020:  43%|███████████████████████▏                              | 783/1824 [07:53<11:28,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.1641:  43%|███████████████████████▏                              | 784/1824 [07:53<11:24,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9316:  43%|███████████████████████▏                              | 785/1824 [07:54<11:32,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.7148:  43%|███████████████████████▎                              | 786/1824 [07:55<11:37,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  43%|███████████████████████▎                              | 787/1824 [07:55<11:14,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:  43%|███████████████████████▎                              | 788/1824 [07:56<11:05,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9648:  43%|███████████████████████▎                              | 789/1824 [07:57<10:54,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  43%|███████████████████████▍                              | 790/1824 [07:57<10:48,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0195:  43%|███████████████████████▍                              | 791/1824 [07:58<10:56,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  43%|███████████████████████▍                              | 792/1824 [07:58<11:00,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.3438:  43%|███████████████████████▍                              | 793/1824 [07:59<11:06,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0195:  44%|███████████████████████▌                              | 794/1824 [08:00<11:09,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  44%|███████████████████████▌                              | 795/1824 [08:00<11:10,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.7812:  44%|███████████████████████▌                              | 796/1824 [08:01<10:55,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9629:  44%|███████████████████████▌                              | 797/1824 [08:02<10:54,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  44%|███████████████████████▋                              | 798/1824 [08:02<10:49,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1270:  44%|███████████████████████▋                              | 799/1824 [08:03<10:33,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0625:  44%|███████████████████████▋                              | 800/1824 [08:04<10:36,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.3086:  44%|███████████████████████▋                              | 801/1824 [08:04<10:32,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  44%|███████████████████████▋                              | 802/1824 [08:05<10:29,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  44%|███████████████████████▊                              | 803/1824 [08:05<10:33,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1543:  44%|███████████████████████▊                              | 804/1824 [08:06<10:27,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1289:  44%|███████████████████████▊                              | 805/1824 [08:07<10:25,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0410:  44%|███████████████████████▊                              | 806/1824 [08:07<10:20,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8496:  44%|███████████████████████▉                              | 807/1824 [08:08<10:41,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0391:  44%|███████████████████████▉                              | 808/1824 [08:09<10:54,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9141:  44%|███████████████████████▉                              | 809/1824 [08:09<11:05,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.7988:  44%|███████████████████████▉                              | 810/1824 [08:10<11:00,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  44%|████████████████████████                              | 811/1824 [08:10<10:43,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1855:  45%|████████████████████████                              | 812/1824 [08:11<10:42,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1445:  45%|████████████████████████                              | 813/1824 [08:12<10:48,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  45%|████████████████████████                              | 814/1824 [08:12<10:36,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.3770:  45%|████████████████████████▏                             | 815/1824 [08:13<10:34,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1758:  45%|████████████████████████▏                             | 816/1824 [08:14<10:15,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  45%|████████████████████████▏                             | 817/1824 [08:14<10:14,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0957:  45%|████████████████████████▏                             | 818/1824 [08:15<10:14,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.2109:  45%|████████████████████████▏                             | 819/1824 [08:15<10:16,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2031:  45%|████████████████████████▎                             | 820/1824 [08:16<10:16,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8379:  45%|████████████████████████▎                             | 821/1824 [08:17<10:40,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.7656:  45%|████████████████████████▎                             | 822/1824 [08:17<10:57,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9336:  45%|████████████████████████▎                             | 823/1824 [08:18<10:57,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.0059:  45%|████████████████████████▍                             | 824/1824 [08:19<10:41,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  45%|████████████████████████▍                             | 825/1824 [08:19<10:50,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2305:  45%|████████████████████████▍                             | 826/1824 [08:20<10:43,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  45%|████████████████████████▍                             | 827/1824 [08:21<10:40,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1211:  45%|████████████████████████▌                             | 828/1824 [08:21<10:29,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.3398:  45%|████████████████████████▌                             | 829/1824 [08:22<10:30,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  46%|████████████████████████▌                             | 830/1824 [08:23<10:37,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  46%|████████████████████████▌                             | 831/1824 [08:23<10:34,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9688:  46%|████████████████████████▋                             | 832/1824 [08:24<10:36,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9727:  46%|████████████████████████▋                             | 833/1824 [08:24<10:26,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0664:  46%|████████████████████████▋                             | 834/1824 [08:25<10:21,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1797:  46%|████████████████████████▋                             | 835/1824 [08:26<10:15,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.7676:  46%|████████████████████████▊                             | 836/1824 [08:26<10:17,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0156:  46%|████████████████████████▊                             | 837/1824 [08:27<10:28,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1113:  46%|████████████████████████▊                             | 838/1824 [08:28<10:26,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8047:  46%|████████████████████████▊                             | 839/1824 [08:28<10:14,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  46%|████████████████████████▊                             | 840/1824 [08:29<10:20,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8164:  46%|████████████████████████▉                             | 841/1824 [08:29<10:22,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7656:  46%|████████████████████████▉                             | 842/1824 [08:30<10:24,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9980:  46%|████████████████████████▉                             | 843/1824 [08:31<10:32,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0176:  46%|████████████████████████▉                             | 844/1824 [08:31<10:38,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  46%|█████████████████████████                             | 845/1824 [08:32<10:30,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  46%|█████████████████████████                             | 846/1824 [08:33<10:35,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2578:  46%|█████████████████████████                             | 847/1824 [08:33<10:19,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  46%|█████████████████████████                             | 848/1824 [08:34<10:21,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1289:  47%|█████████████████████████▏                            | 849/1824 [08:35<10:27,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9082:  47%|█████████████████████████▏                            | 850/1824 [08:35<10:34,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  47%|█████████████████████████▏                            | 851/1824 [08:36<10:36,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  47%|█████████████████████████▏                            | 852/1824 [08:37<10:52,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  47%|█████████████████████████▎                            | 853/1824 [08:37<10:47,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  47%|█████████████████████████▎                            | 854/1824 [08:38<10:50,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.9395:  47%|█████████████████████████▎                            | 855/1824 [08:39<10:34,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.2930:  47%|█████████████████████████▎                            | 856/1824 [08:39<10:56,  1.47it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  47%|█████████████████████████▎                            | 857/1824 [08:40<10:59,  1.47it/s]

cuda:0


Epoch 0/4, Loss: 3.2188:  47%|█████████████████████████▍                            | 858/1824 [08:41<11:03,  1.46it/s]

cuda:0


Epoch 0/4, Loss: 3.0898:  47%|█████████████████████████▍                            | 859/1824 [08:41<11:04,  1.45it/s]

cuda:0


Epoch 0/4, Loss: 3.0078:  47%|█████████████████████████▍                            | 860/1824 [08:42<10:56,  1.47it/s]

cuda:0


Epoch 0/4, Loss: 3.1191:  47%|█████████████████████████▍                            | 861/1824 [08:43<10:48,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  47%|█████████████████████████▌                            | 862/1824 [08:43<10:48,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 2.5898:  47%|█████████████████████████▌                            | 863/1824 [08:44<10:24,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.3008:  47%|█████████████████████████▌                            | 864/1824 [08:45<10:17,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.5801:  47%|█████████████████████████▌                            | 865/1824 [08:45<10:10,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.3359:  47%|█████████████████████████▋                            | 866/1824 [08:46<10:07,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.3906:  48%|█████████████████████████▋                            | 867/1824 [08:47<10:06,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.3789:  48%|█████████████████████████▋                            | 868/1824 [08:47<10:01,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.3008:  48%|█████████████████████████▋                            | 869/1824 [08:48<10:00,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  48%|█████████████████████████▊                            | 870/1824 [08:48<09:47,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2285:  48%|█████████████████████████▊                            | 871/1824 [08:49<09:49,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  48%|█████████████████████████▊                            | 872/1824 [08:50<09:44,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  48%|█████████████████████████▊                            | 873/1824 [08:50<09:46,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0430:  48%|█████████████████████████▉                            | 874/1824 [08:51<09:44,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.3613:  48%|█████████████████████████▉                            | 875/1824 [08:51<09:39,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.4922:  48%|█████████████████████████▉                            | 876/1824 [08:52<09:51,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.3105:  48%|█████████████████████████▉                            | 877/1824 [08:53<09:43,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1230:  48%|█████████████████████████▉                            | 878/1824 [08:53<09:45,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1758:  48%|██████████████████████████                            | 879/1824 [08:54<09:44,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2383:  48%|██████████████████████████                            | 880/1824 [08:55<09:42,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1875:  48%|██████████████████████████                            | 881/1824 [08:55<10:00,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  48%|██████████████████████████                            | 882/1824 [08:56<09:52,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.3184:  48%|██████████████████████████▏                           | 883/1824 [08:56<09:50,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9688:  48%|██████████████████████████▏                           | 884/1824 [08:57<09:50,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1699:  49%|██████████████████████████▏                           | 885/1824 [08:58<09:37,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  49%|██████████████████████████▏                           | 886/1824 [08:58<09:55,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9160:  49%|██████████████████████████▎                           | 887/1824 [08:59<10:08,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2344:  49%|██████████████████████████▎                           | 888/1824 [09:00<10:07,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  49%|██████████████████████████▎                           | 889/1824 [09:00<10:02,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  49%|██████████████████████████▎                           | 890/1824 [09:01<09:56,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  49%|██████████████████████████▍                           | 891/1824 [09:02<09:44,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  49%|██████████████████████████▍                           | 892/1824 [09:02<09:41,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  49%|██████████████████████████▍                           | 893/1824 [09:03<09:40,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0039:  49%|██████████████████████████▍                           | 894/1824 [09:03<09:49,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  49%|██████████████████████████▍                           | 895/1824 [09:04<09:49,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1797:  49%|██████████████████████████▌                           | 896/1824 [09:05<09:52,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0195:  49%|██████████████████████████▌                           | 897/1824 [09:05<09:42,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  49%|██████████████████████████▌                           | 898/1824 [09:06<09:43,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  49%|██████████████████████████▌                           | 899/1824 [09:07<09:38,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.7578:  49%|██████████████████████████▋                           | 900/1824 [09:07<09:49,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0879:  49%|██████████████████████████▋                           | 901/1824 [09:08<09:39,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.8555:  49%|██████████████████████████▋                           | 902/1824 [09:08<09:30,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0664:  50%|██████████████████████████▋                           | 903/1824 [09:09<09:29,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2109:  50%|██████████████████████████▊                           | 904/1824 [09:10<09:18,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1484:  50%|██████████████████████████▊                           | 905/1824 [09:10<09:22,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1309:  50%|██████████████████████████▊                           | 906/1824 [09:11<09:32,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0820:  50%|██████████████████████████▊                           | 907/1824 [09:12<09:26,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0566:  50%|██████████████████████████▉                           | 908/1824 [09:12<09:34,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  50%|██████████████████████████▉                           | 909/1824 [09:13<09:22,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.6914:  50%|██████████████████████████▉                           | 910/1824 [09:13<09:28,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1348:  50%|██████████████████████████▉                           | 911/1824 [09:14<09:17,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1973:  50%|███████████████████████████                           | 912/1824 [09:15<09:19,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1719:  50%|███████████████████████████                           | 913/1824 [09:15<09:13,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1719:  50%|███████████████████████████                           | 914/1824 [09:16<09:11,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  50%|███████████████████████████                           | 915/1824 [09:16<09:29,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  50%|███████████████████████████                           | 916/1824 [09:17<09:17,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  50%|███████████████████████████▏                          | 917/1824 [09:18<09:22,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  50%|███████████████████████████▏                          | 918/1824 [09:18<09:20,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2207:  50%|███████████████████████████▏                          | 919/1824 [09:19<09:39,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0645:  50%|███████████████████████████▏                          | 920/1824 [09:20<09:43,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1113:  50%|███████████████████████████▎                          | 921/1824 [09:20<09:43,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0254:  51%|███████████████████████████▎                          | 922/1824 [09:21<09:42,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  51%|███████████████████████████▎                          | 923/1824 [09:22<09:45,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8359:  51%|███████████████████████████▎                          | 924/1824 [09:22<09:26,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0938:  51%|███████████████████████████▍                          | 925/1824 [09:23<09:23,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0391:  51%|███████████████████████████▍                          | 926/1824 [09:23<09:20,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.2344:  51%|███████████████████████████▍                          | 927/1824 [09:24<09:28,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7480:  51%|███████████████████████████▍                          | 928/1824 [09:25<09:26,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  51%|███████████████████████████▌                          | 929/1824 [09:25<09:23,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.5625:  51%|███████████████████████████▌                          | 930/1824 [09:26<09:30,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  51%|███████████████████████████▌                          | 931/1824 [09:27<09:28,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8730:  51%|███████████████████████████▌                          | 932/1824 [09:27<09:34,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  51%|███████████████████████████▌                          | 933/1824 [09:28<09:25,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0840:  51%|███████████████████████████▋                          | 934/1824 [09:29<09:23,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  51%|███████████████████████████▋                          | 935/1824 [09:29<09:27,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.7168:  51%|███████████████████████████▋                          | 936/1824 [09:30<09:29,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9746:  51%|███████████████████████████▋                          | 937/1824 [09:30<09:32,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  51%|███████████████████████████▊                          | 938/1824 [09:31<08:56,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0996:  51%|███████████████████████████▊                          | 939/1824 [09:32<09:06,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  52%|███████████████████████████▊                          | 940/1824 [09:32<09:13,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.7305:  52%|███████████████████████████▊                          | 941/1824 [09:33<09:15,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  52%|███████████████████████████▉                          | 942/1824 [09:34<09:21,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8672:  52%|███████████████████████████▉                          | 943/1824 [09:34<09:10,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.5586:  52%|███████████████████████████▉                          | 944/1824 [09:35<09:17,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  52%|███████████████████████████▉                          | 945/1824 [09:35<09:06,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1250:  52%|████████████████████████████                          | 946/1824 [09:36<09:06,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  52%|████████████████████████████                          | 947/1824 [09:37<09:19,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  52%|████████████████████████████                          | 948/1824 [09:37<09:28,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  52%|████████████████████████████                          | 949/1824 [09:38<09:32,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  52%|████████████████████████████▏                         | 950/1824 [09:39<09:41,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.8672:  52%|████████████████████████████▏                         | 951/1824 [09:39<09:33,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.8906:  52%|████████████████████████████▏                         | 952/1824 [09:40<09:18,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0391:  52%|████████████████████████████▏                         | 953/1824 [09:41<09:03,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.3398:  52%|████████████████████████████▏                         | 954/1824 [09:41<09:07,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  52%|████████████████████████████▎                         | 955/1824 [09:42<09:05,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.7617:  52%|████████████████████████████▎                         | 956/1824 [09:42<09:10,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  52%|████████████████████████████▎                         | 957/1824 [09:43<09:10,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1641:  53%|████████████████████████████▎                         | 958/1824 [09:44<08:47,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  53%|████████████████████████████▍                         | 959/1824 [09:44<08:59,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  53%|████████████████████████████▍                         | 960/1824 [09:45<08:49,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8691:  53%|████████████████████████████▍                         | 961/1824 [09:46<08:45,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.3770:  53%|████████████████████████████▍                         | 962/1824 [09:46<09:10,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2695:  53%|████████████████████████████▌                         | 963/1824 [09:47<09:09,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  53%|████████████████████████████▌                         | 964/1824 [09:47<09:03,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.2383:  53%|████████████████████████████▌                         | 965/1824 [09:48<08:53,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8203:  53%|████████████████████████████▌                         | 966/1824 [09:49<09:07,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8652:  53%|████████████████████████████▋                         | 967/1824 [09:49<08:54,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  53%|████████████████████████████▋                         | 968/1824 [09:50<08:48,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0059:  53%|████████████████████████████▋                         | 969/1824 [09:51<09:04,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  53%|████████████████████████████▋                         | 970/1824 [09:51<09:00,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  53%|████████████████████████████▋                         | 971/1824 [09:52<08:50,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1582:  53%|████████████████████████████▊                         | 972/1824 [09:52<08:49,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1719:  53%|████████████████████████████▊                         | 973/1824 [09:53<08:43,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0938:  53%|████████████████████████████▊                         | 974/1824 [09:54<08:52,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  53%|████████████████████████████▊                         | 975/1824 [09:54<08:46,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  54%|████████████████████████████▉                         | 976/1824 [09:55<08:44,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8086:  54%|████████████████████████████▉                         | 977/1824 [09:56<08:44,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9180:  54%|████████████████████████████▉                         | 978/1824 [09:56<08:44,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.4727:  54%|████████████████████████████▉                         | 979/1824 [09:57<08:40,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2227:  54%|█████████████████████████████                         | 980/1824 [09:57<08:36,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2812:  54%|█████████████████████████████                         | 981/1824 [09:58<08:35,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  54%|█████████████████████████████                         | 982/1824 [09:59<08:24,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  54%|█████████████████████████████                         | 983/1824 [09:59<08:24,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.8613:  54%|█████████████████████████████▏                        | 984/1824 [10:00<08:31,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9590:  54%|█████████████████████████████▏                        | 985/1824 [10:00<08:25,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.8359:  54%|█████████████████████████████▏                        | 986/1824 [10:01<08:25,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  54%|█████████████████████████████▏                        | 987/1824 [10:02<08:27,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.7969:  54%|█████████████████████████████▏                        | 988/1824 [10:02<08:37,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8594:  54%|█████████████████████████████▎                        | 989/1824 [10:03<08:34,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0293:  54%|█████████████████████████████▎                        | 990/1824 [10:03<08:29,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.2109:  54%|█████████████████████████████▎                        | 991/1824 [10:04<08:32,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0137:  54%|█████████████████████████████▎                        | 992/1824 [10:05<08:33,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  54%|█████████████████████████████▍                        | 993/1824 [10:05<08:32,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8262:  54%|█████████████████████████████▍                        | 994/1824 [10:06<08:28,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2109:  55%|█████████████████████████████▍                        | 995/1824 [10:07<08:29,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  55%|█████████████████████████████▍                        | 996/1824 [10:07<08:25,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  55%|█████████████████████████████▌                        | 997/1824 [10:08<08:25,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7109:  55%|█████████████████████████████▌                        | 998/1824 [10:08<08:35,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0293:  55%|█████████████████████████████▌                        | 999/1824 [10:09<08:31,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2734:  55%|█████████████████████████████                        | 1000/1824 [10:10<08:29,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0801:  55%|█████████████████████████████                        | 1001/1824 [10:10<08:26,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0938:  55%|█████████████████████████████                        | 1002/1824 [10:11<08:21,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  55%|█████████████████████████████▏                       | 1003/1824 [10:12<08:38,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  55%|█████████████████████████████▏                       | 1004/1824 [10:12<08:31,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  55%|█████████████████████████████▏                       | 1005/1824 [10:13<08:26,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.5254:  55%|█████████████████████████████▏                       | 1006/1824 [10:13<08:08,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  55%|█████████████████████████████▎                       | 1007/1824 [10:14<08:10,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1328:  55%|█████████████████████████████▎                       | 1008/1824 [10:15<08:16,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.2500:  55%|█████████████████████████████▎                       | 1009/1824 [10:15<08:15,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1348:  55%|█████████████████████████████▎                       | 1010/1824 [10:16<08:18,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2363:  55%|█████████████████████████████▍                       | 1011/1824 [10:16<08:22,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.3242:  55%|█████████████████████████████▍                       | 1012/1824 [10:17<08:22,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.3281:  56%|█████████████████████████████▍                       | 1013/1824 [10:18<08:14,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.2012:  56%|█████████████████████████████▍                       | 1014/1824 [10:18<08:09,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1719:  56%|█████████████████████████████▍                       | 1015/1824 [10:19<08:30,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1445:  56%|█████████████████████████████▌                       | 1016/1824 [10:20<08:30,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  56%|█████████████████████████████▌                       | 1017/1824 [10:20<08:22,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  56%|█████████████████████████████▌                       | 1018/1824 [10:21<08:22,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  56%|█████████████████████████████▌                       | 1019/1824 [10:21<08:19,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9512:  56%|█████████████████████████████▋                       | 1020/1824 [10:22<08:16,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7578:  56%|█████████████████████████████▋                       | 1021/1824 [10:23<08:18,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  56%|█████████████████████████████▋                       | 1022/1824 [10:23<08:10,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.3945:  56%|█████████████████████████████▋                       | 1023/1824 [10:24<08:17,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1777:  56%|█████████████████████████████▊                       | 1024/1824 [10:24<08:08,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  56%|█████████████████████████████▊                       | 1025/1824 [10:25<08:16,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.7441:  56%|█████████████████████████████▊                       | 1026/1824 [10:26<08:05,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0605:  56%|█████████████████████████████▊                       | 1027/1824 [10:26<08:08,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.6758:  56%|█████████████████████████████▊                       | 1028/1824 [10:27<08:10,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9941:  56%|█████████████████████████████▉                       | 1029/1824 [10:27<08:07,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8809:  56%|█████████████████████████████▉                       | 1030/1824 [10:28<08:24,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  57%|█████████████████████████████▉                       | 1031/1824 [10:29<08:22,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.3320:  57%|█████████████████████████████▉                       | 1032/1824 [10:29<08:19,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.7773:  57%|██████████████████████████████                       | 1033/1824 [10:30<08:25,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1543:  57%|██████████████████████████████                       | 1034/1824 [10:31<08:21,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  57%|██████████████████████████████                       | 1035/1824 [10:31<08:31,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2363:  57%|██████████████████████████████                       | 1036/1824 [10:32<08:21,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  57%|██████████████████████████████▏                      | 1037/1824 [10:33<08:13,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  57%|██████████████████████████████▏                      | 1038/1824 [10:33<08:11,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.2031:  57%|██████████████████████████████▏                      | 1039/1824 [10:34<08:13,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9883:  57%|██████████████████████████████▏                      | 1040/1824 [10:34<08:08,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.7148:  57%|██████████████████████████████▏                      | 1041/1824 [10:35<07:58,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.7188:  57%|██████████████████████████████▎                      | 1042/1824 [10:36<08:03,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  57%|██████████████████████████████▎                      | 1043/1824 [10:36<07:59,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  57%|██████████████████████████████▎                      | 1044/1824 [10:37<08:00,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  57%|██████████████████████████████▎                      | 1045/1824 [10:38<08:17,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2344:  57%|██████████████████████████████▍                      | 1046/1824 [10:38<07:55,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.2422:  57%|██████████████████████████████▍                      | 1047/1824 [10:39<08:13,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2695:  57%|██████████████████████████████▍                      | 1048/1824 [10:39<08:12,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8066:  58%|██████████████████████████████▍                      | 1049/1824 [10:40<08:06,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1758:  58%|██████████████████████████████▌                      | 1050/1824 [10:41<08:09,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.3750:  58%|██████████████████████████████▌                      | 1051/1824 [10:41<07:52,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  58%|██████████████████████████████▌                      | 1052/1824 [10:42<08:00,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  58%|██████████████████████████████▌                      | 1053/1824 [10:43<07:57,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0664:  58%|██████████████████████████████▋                      | 1054/1824 [10:43<07:59,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2578:  58%|██████████████████████████████▋                      | 1055/1824 [10:44<08:02,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  58%|██████████████████████████████▋                      | 1056/1824 [10:44<07:59,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1016:  58%|██████████████████████████████▋                      | 1057/1824 [10:45<08:08,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2070:  58%|██████████████████████████████▋                      | 1058/1824 [10:46<08:03,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1660:  58%|██████████████████████████████▊                      | 1059/1824 [10:46<07:55,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1641:  58%|██████████████████████████████▊                      | 1060/1824 [10:47<07:52,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  58%|██████████████████████████████▊                      | 1061/1824 [10:48<07:51,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  58%|██████████████████████████████▊                      | 1062/1824 [10:48<07:52,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  58%|██████████████████████████████▉                      | 1063/1824 [10:49<07:45,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8086:  58%|██████████████████████████████▉                      | 1064/1824 [10:49<07:56,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1211:  58%|██████████████████████████████▉                      | 1065/1824 [10:50<07:47,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1250:  58%|██████████████████████████████▉                      | 1066/1824 [10:51<07:47,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  58%|███████████████████████████████                      | 1067/1824 [10:51<07:48,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2422:  59%|███████████████████████████████                      | 1068/1824 [10:52<07:47,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  59%|███████████████████████████████                      | 1069/1824 [10:52<07:42,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.3340:  59%|███████████████████████████████                      | 1070/1824 [10:53<07:38,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.9941:  59%|███████████████████████████████                      | 1071/1824 [10:54<07:53,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.2344:  59%|███████████████████████████████▏                     | 1072/1824 [10:54<07:57,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1152:  59%|███████████████████████████████▏                     | 1073/1824 [10:55<07:50,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0566:  59%|███████████████████████████████▏                     | 1074/1824 [10:56<07:34,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1953:  59%|███████████████████████████████▏                     | 1075/1824 [10:56<07:31,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:  59%|███████████████████████████████▎                     | 1076/1824 [10:57<07:32,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0391:  59%|███████████████████████████████▎                     | 1077/1824 [10:57<07:36,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9648:  59%|███████████████████████████████▎                     | 1078/1824 [10:58<07:34,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8184:  59%|███████████████████████████████▎                     | 1079/1824 [10:59<07:33,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8164:  59%|███████████████████████████████▍                     | 1080/1824 [10:59<07:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  59%|███████████████████████████████▍                     | 1081/1824 [11:00<07:24,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0371:  59%|███████████████████████████████▍                     | 1082/1824 [11:00<07:38,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2109:  59%|███████████████████████████████▍                     | 1083/1824 [11:01<07:36,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8477:  59%|███████████████████████████████▍                     | 1084/1824 [11:02<07:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  59%|███████████████████████████████▌                     | 1085/1824 [11:02<07:38,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  60%|███████████████████████████████▌                     | 1086/1824 [11:03<07:37,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2383:  60%|███████████████████████████████▌                     | 1087/1824 [11:04<07:38,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  60%|███████████████████████████████▌                     | 1088/1824 [11:04<07:28,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  60%|███████████████████████████████▋                     | 1089/1824 [11:05<07:31,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  60%|███████████████████████████████▋                     | 1090/1824 [11:05<07:28,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1523:  60%|███████████████████████████████▋                     | 1091/1824 [11:06<07:33,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  60%|███████████████████████████████▋                     | 1092/1824 [11:07<07:33,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  60%|███████████████████████████████▊                     | 1093/1824 [11:07<07:19,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.9043:  60%|███████████████████████████████▊                     | 1094/1824 [11:08<07:19,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.6289:  60%|███████████████████████████████▊                     | 1095/1824 [11:08<07:23,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  60%|███████████████████████████████▊                     | 1096/1824 [11:09<07:32,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  60%|███████████████████████████████▉                     | 1097/1824 [11:10<07:32,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0957:  60%|███████████████████████████████▉                     | 1098/1824 [11:10<07:28,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1914:  60%|███████████████████████████████▉                     | 1099/1824 [11:11<07:32,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1094:  60%|███████████████████████████████▉                     | 1100/1824 [11:12<07:24,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1016:  60%|███████████████████████████████▉                     | 1101/1824 [11:12<07:23,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.3750:  60%|████████████████████████████████                     | 1102/1824 [11:13<07:28,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8125:  60%|████████████████████████████████                     | 1103/1824 [11:13<07:19,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.6602:  61%|████████████████████████████████                     | 1104/1824 [11:14<07:23,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:  61%|████████████████████████████████                     | 1105/1824 [11:15<07:19,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.5859:  61%|████████████████████████████████▏                    | 1106/1824 [11:15<07:21,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2148:  61%|████████████████████████████████▏                    | 1107/1824 [11:16<07:20,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  61%|████████████████████████████████▏                    | 1108/1824 [11:16<07:24,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  61%|████████████████████████████████▏                    | 1109/1824 [11:17<07:35,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9551:  61%|████████████████████████████████▎                    | 1110/1824 [11:18<07:46,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0566:  61%|████████████████████████████████▎                    | 1111/1824 [11:18<07:42,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  61%|████████████████████████████████▎                    | 1112/1824 [11:19<07:36,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  61%|████████████████████████████████▎                    | 1113/1824 [11:20<07:45,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0039:  61%|████████████████████████████████▎                    | 1114/1824 [11:20<07:36,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  61%|████████████████████████████████▍                    | 1115/1824 [11:21<07:16,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0801:  61%|████████████████████████████████▍                    | 1116/1824 [11:22<07:09,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.2500:  61%|████████████████████████████████▍                    | 1117/1824 [11:22<07:12,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  61%|████████████████████████████████▍                    | 1118/1824 [11:23<07:11,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1934:  61%|████████████████████████████████▌                    | 1119/1824 [11:23<07:11,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  61%|████████████████████████████████▌                    | 1120/1824 [11:24<07:13,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0664:  61%|████████████████████████████████▌                    | 1121/1824 [11:25<07:06,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1211:  62%|████████████████████████████████▌                    | 1122/1824 [11:25<07:06,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:  62%|████████████████████████████████▋                    | 1123/1824 [11:26<07:03,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.3633:  62%|████████████████████████████████▋                    | 1124/1824 [11:26<07:07,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.3281:  62%|████████████████████████████████▋                    | 1125/1824 [11:27<07:08,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1816:  62%|████████████████████████████████▋                    | 1126/1824 [11:28<07:05,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.2461:  62%|████████████████████████████████▋                    | 1127/1824 [11:28<07:14,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  62%|████████████████████████████████▊                    | 1128/1824 [11:29<07:13,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2383:  62%|████████████████████████████████▊                    | 1129/1824 [11:30<07:17,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  62%|████████████████████████████████▊                    | 1130/1824 [11:30<07:09,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.6992:  62%|████████████████████████████████▊                    | 1131/1824 [11:31<07:07,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.3477:  62%|████████████████████████████████▉                    | 1132/1824 [11:31<07:02,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7422:  62%|████████████████████████████████▉                    | 1133/1824 [11:32<07:17,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8477:  62%|████████████████████████████████▉                    | 1134/1824 [11:33<07:04,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.5469:  62%|████████████████████████████████▉                    | 1135/1824 [11:33<07:04,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1035:  62%|█████████████████████████████████                    | 1136/1824 [11:34<07:03,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8672:  62%|█████████████████████████████████                    | 1137/1824 [11:34<06:58,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  62%|█████████████████████████████████                    | 1138/1824 [11:35<06:56,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0918:  62%|█████████████████████████████████                    | 1139/1824 [11:36<06:56,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1797:  62%|█████████████████████████████████▏                   | 1140/1824 [11:36<07:18,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1250:  63%|█████████████████████████████████▏                   | 1141/1824 [11:37<07:11,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:  63%|█████████████████████████████████▏                   | 1142/1824 [11:38<07:08,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0371:  63%|█████████████████████████████████▏                   | 1143/1824 [11:38<07:30,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.8125:  63%|█████████████████████████████████▏                   | 1144/1824 [11:39<07:09,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1348:  63%|█████████████████████████████████▎                   | 1145/1824 [11:40<07:04,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  63%|█████████████████████████████████▎                   | 1146/1824 [11:40<07:04,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1152:  63%|█████████████████████████████████▎                   | 1147/1824 [11:41<06:58,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  63%|█████████████████████████████████▎                   | 1148/1824 [11:41<07:04,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  63%|█████████████████████████████████▍                   | 1149/1824 [11:42<06:53,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9082:  63%|█████████████████████████████████▍                   | 1150/1824 [11:43<06:59,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.3340:  63%|█████████████████████████████████▍                   | 1151/1824 [11:43<06:53,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1406:  63%|█████████████████████████████████▍                   | 1152/1824 [11:44<06:53,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2031:  63%|█████████████████████████████████▌                   | 1153/1824 [11:45<07:02,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.7734:  63%|█████████████████████████████████▌                   | 1154/1824 [11:45<07:16,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  63%|█████████████████████████████████▌                   | 1155/1824 [11:46<07:16,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9980:  63%|█████████████████████████████████▌                   | 1156/1824 [11:46<07:09,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0391:  63%|█████████████████████████████████▌                   | 1157/1824 [11:47<07:10,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  63%|█████████████████████████████████▋                   | 1158/1824 [11:48<07:01,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9570:  64%|█████████████████████████████████▋                   | 1159/1824 [11:48<06:55,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0156:  64%|█████████████████████████████████▋                   | 1160/1824 [11:49<06:53,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8027:  64%|█████████████████████████████████▋                   | 1161/1824 [11:50<06:51,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1914:  64%|█████████████████████████████████▊                   | 1162/1824 [11:50<06:47,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.3594:  64%|█████████████████████████████████▊                   | 1163/1824 [11:51<06:44,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1543:  64%|█████████████████████████████████▊                   | 1164/1824 [11:51<06:41,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0410:  64%|█████████████████████████████████▊                   | 1165/1824 [11:52<06:41,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9512:  64%|█████████████████████████████████▉                   | 1166/1824 [11:53<06:42,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  64%|█████████████████████████████████▉                   | 1167/1824 [11:53<06:41,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1016:  64%|█████████████████████████████████▉                   | 1168/1824 [11:54<06:35,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0977:  64%|█████████████████████████████████▉                   | 1169/1824 [11:54<06:38,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  64%|█████████████████████████████████▉                   | 1170/1824 [11:55<06:45,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2637:  64%|██████████████████████████████████                   | 1171/1824 [11:56<06:45,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.3301:  64%|██████████████████████████████████                   | 1172/1824 [11:56<06:42,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  64%|██████████████████████████████████                   | 1173/1824 [11:57<06:46,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0176:  64%|██████████████████████████████████                   | 1174/1824 [11:58<06:46,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.4023:  64%|██████████████████████████████████▏                  | 1175/1824 [11:58<06:37,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  64%|██████████████████████████████████▏                  | 1176/1824 [11:59<06:39,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2773:  65%|██████████████████████████████████▏                  | 1177/1824 [11:59<06:38,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  65%|██████████████████████████████████▏                  | 1178/1824 [12:00<06:39,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9043:  65%|██████████████████████████████████▎                  | 1179/1824 [12:01<06:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8281:  65%|██████████████████████████████████▎                  | 1180/1824 [12:01<06:39,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.3477:  65%|██████████████████████████████████▎                  | 1181/1824 [12:02<06:35,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7363:  65%|██████████████████████████████████▎                  | 1182/1824 [12:03<06:40,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  65%|██████████████████████████████████▎                  | 1183/1824 [12:03<06:39,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  65%|██████████████████████████████████▍                  | 1184/1824 [12:04<06:35,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  65%|██████████████████████████████████▍                  | 1185/1824 [12:04<06:36,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  65%|██████████████████████████████████▍                  | 1186/1824 [12:05<06:36,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  65%|██████████████████████████████████▍                  | 1187/1824 [12:06<06:30,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0645:  65%|██████████████████████████████████▌                  | 1188/1824 [12:06<06:27,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  65%|██████████████████████████████████▌                  | 1189/1824 [12:07<06:21,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  65%|██████████████████████████████████▌                  | 1190/1824 [12:07<06:17,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  65%|██████████████████████████████████▌                  | 1191/1824 [12:08<06:21,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.9062:  65%|██████████████████████████████████▋                  | 1192/1824 [12:09<06:42,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2109:  65%|██████████████████████████████████▋                  | 1193/1824 [12:09<06:39,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  65%|██████████████████████████████████▋                  | 1194/1824 [12:10<06:30,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.7891:  66%|██████████████████████████████████▋                  | 1195/1824 [12:11<06:34,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8730:  66%|██████████████████████████████████▊                  | 1196/1824 [12:11<06:25,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.5664:  66%|██████████████████████████████████▊                  | 1197/1824 [12:12<06:29,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.7266:  66%|██████████████████████████████████▊                  | 1198/1824 [12:12<06:23,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1875:  66%|██████████████████████████████████▊                  | 1199/1824 [12:13<06:27,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9434:  66%|██████████████████████████████████▊                  | 1200/1824 [12:14<06:19,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.4395:  66%|██████████████████████████████████▉                  | 1201/1824 [12:14<06:15,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.2051:  66%|██████████████████████████████████▉                  | 1202/1824 [12:15<06:21,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.4258:  66%|██████████████████████████████████▉                  | 1203/1824 [12:15<06:21,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2812:  66%|██████████████████████████████████▉                  | 1204/1824 [12:16<06:34,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.3262:  66%|███████████████████████████████████                  | 1205/1824 [12:17<06:36,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9336:  66%|███████████████████████████████████                  | 1206/1824 [12:17<06:43,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0176:  66%|███████████████████████████████████                  | 1207/1824 [12:18<06:52,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.8555:  66%|███████████████████████████████████                  | 1208/1824 [12:19<06:39,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  66%|███████████████████████████████████▏                 | 1209/1824 [12:19<06:38,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.4922:  66%|███████████████████████████████████▏                 | 1210/1824 [12:20<06:36,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  66%|███████████████████████████████████▏                 | 1211/1824 [12:21<06:37,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  66%|███████████████████████████████████▏                 | 1212/1824 [12:21<06:36,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1328:  67%|███████████████████████████████████▏                 | 1213/1824 [12:22<06:34,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  67%|███████████████████████████████████▎                 | 1214/1824 [12:23<06:33,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.2090:  67%|███████████████████████████████████▎                 | 1215/1824 [12:23<06:28,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0898:  67%|███████████████████████████████████▎                 | 1216/1824 [12:24<06:19,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0488:  67%|███████████████████████████████████▎                 | 1217/1824 [12:24<06:17,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9180:  67%|███████████████████████████████████▍                 | 1218/1824 [12:25<06:13,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0137:  67%|███████████████████████████████████▍                 | 1219/1824 [12:26<06:14,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9883:  67%|███████████████████████████████████▍                 | 1220/1824 [12:26<06:16,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1328:  67%|███████████████████████████████████▍                 | 1221/1824 [12:27<06:06,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8789:  67%|███████████████████████████████████▌                 | 1222/1824 [12:28<06:13,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  67%|███████████████████████████████████▌                 | 1223/1824 [12:28<06:03,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  67%|███████████████████████████████████▌                 | 1224/1824 [12:29<06:09,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  67%|███████████████████████████████████▌                 | 1225/1824 [12:29<06:10,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.6641:  67%|███████████████████████████████████▌                 | 1226/1824 [12:30<06:17,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9395:  67%|███████████████████████████████████▋                 | 1227/1824 [12:31<06:19,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.5586:  67%|███████████████████████████████████▋                 | 1228/1824 [12:31<06:01,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1367:  67%|███████████████████████████████████▋                 | 1229/1824 [12:32<06:00,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  67%|███████████████████████████████████▋                 | 1230/1824 [12:32<06:00,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  67%|███████████████████████████████████▊                 | 1231/1824 [12:33<06:02,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  68%|███████████████████████████████████▊                 | 1232/1824 [12:34<06:12,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.2266:  68%|███████████████████████████████████▊                 | 1233/1824 [12:34<06:09,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  68%|███████████████████████████████████▊                 | 1234/1824 [12:35<06:09,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1504:  68%|███████████████████████████████████▉                 | 1235/1824 [12:36<06:10,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  68%|███████████████████████████████████▉                 | 1236/1824 [12:36<06:10,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1758:  68%|███████████████████████████████████▉                 | 1237/1824 [12:37<06:05,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  68%|███████████████████████████████████▉                 | 1238/1824 [12:37<06:02,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  68%|████████████████████████████████████                 | 1239/1824 [12:38<06:02,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.3320:  68%|████████████████████████████████████                 | 1240/1824 [12:39<06:07,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  68%|████████████████████████████████████                 | 1241/1824 [12:39<06:09,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  68%|████████████████████████████████████                 | 1242/1824 [12:40<06:02,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1094:  68%|████████████████████████████████████                 | 1243/1824 [12:41<05:58,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7871:  68%|████████████████████████████████████▏                | 1244/1824 [12:41<06:00,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.4688:  68%|████████████████████████████████████▏                | 1245/1824 [12:42<05:59,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  68%|████████████████████████████████████▏                | 1246/1824 [12:42<05:55,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0078:  68%|████████████████████████████████████▏                | 1247/1824 [12:43<06:03,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  68%|████████████████████████████████████▎                | 1248/1824 [12:44<06:00,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8047:  68%|████████████████████████████████████▎                | 1249/1824 [12:44<06:05,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  69%|████████████████████████████████████▎                | 1250/1824 [12:45<06:16,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.7246:  69%|████████████████████████████████████▎                | 1251/1824 [12:46<06:22,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  69%|████████████████████████████████████▍                | 1252/1824 [12:46<06:24,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.7480:  69%|████████████████████████████████████▍                | 1253/1824 [12:47<06:25,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  69%|████████████████████████████████████▍                | 1254/1824 [12:48<06:25,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 2.7461:  69%|████████████████████████████████████▍                | 1255/1824 [12:48<06:12,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.6445:  69%|████████████████████████████████████▍                | 1256/1824 [12:49<06:07,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  69%|████████████████████████████████████▌                | 1257/1824 [12:50<06:01,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9160:  69%|████████████████████████████████████▌                | 1258/1824 [12:50<06:04,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0938:  69%|████████████████████████████████████▌                | 1259/1824 [12:51<06:03,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  69%|████████████████████████████████████▌                | 1260/1824 [12:52<06:05,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8008:  69%|████████████████████████████████████▋                | 1261/1824 [12:52<05:59,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  69%|████████████████████████████████████▋                | 1262/1824 [12:53<05:59,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.6602:  69%|████████████████████████████████████▋                | 1263/1824 [12:53<05:56,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0605:  69%|████████████████████████████████████▋                | 1264/1824 [12:54<05:51,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  69%|████████████████████████████████████▊                | 1265/1824 [12:55<05:52,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  69%|████████████████████████████████████▊                | 1266/1824 [12:55<05:57,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0527:  69%|████████████████████████████████████▊                | 1267/1824 [12:56<05:59,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8223:  70%|████████████████████████████████████▊                | 1268/1824 [12:57<06:04,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.7617:  70%|████████████████████████████████████▊                | 1269/1824 [12:57<06:07,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  70%|████████████████████████████████████▉                | 1270/1824 [12:58<05:59,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.5391:  70%|████████████████████████████████████▉                | 1271/1824 [12:59<05:53,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  70%|████████████████████████████████████▉                | 1272/1824 [12:59<05:49,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1348:  70%|████████████████████████████████████▉                | 1273/1824 [13:00<05:42,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  70%|█████████████████████████████████████                | 1274/1824 [13:00<05:44,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1094:  70%|█████████████████████████████████████                | 1275/1824 [13:01<05:39,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8203:  70%|█████████████████████████████████████                | 1276/1824 [13:02<05:38,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9395:  70%|█████████████████████████████████████                | 1277/1824 [13:02<05:37,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8672:  70%|█████████████████████████████████████▏               | 1278/1824 [13:03<05:38,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8359:  70%|█████████████████████████████████████▏               | 1279/1824 [13:04<05:33,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9336:  70%|█████████████████████████████████████▏               | 1280/1824 [13:04<05:38,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  70%|█████████████████████████████████████▏               | 1281/1824 [13:05<05:33,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  70%|█████████████████████████████████████▎               | 1282/1824 [13:05<05:41,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.5273:  70%|█████████████████████████████████████▎               | 1283/1824 [13:06<05:49,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  70%|█████████████████████████████████████▎               | 1284/1824 [13:07<05:53,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  70%|█████████████████████████████████████▎               | 1285/1824 [13:08<06:04,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  71%|█████████████████████████████████████▎               | 1286/1824 [13:08<05:57,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  71%|█████████████████████████████████████▍               | 1287/1824 [13:09<05:56,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.9336:  71%|█████████████████████████████████████▍               | 1288/1824 [13:09<05:53,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.7676:  71%|█████████████████████████████████████▍               | 1289/1824 [13:10<05:45,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  71%|█████████████████████████████████████▍               | 1290/1824 [13:11<05:44,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9551:  71%|█████████████████████████████████████▌               | 1291/1824 [13:11<05:35,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.5938:  71%|█████████████████████████████████████▌               | 1292/1824 [13:12<05:38,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0078:  71%|█████████████████████████████████████▌               | 1293/1824 [13:13<05:37,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8359:  71%|█████████████████████████████████████▌               | 1294/1824 [13:13<05:40,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.7773:  71%|█████████████████████████████████████▋               | 1295/1824 [13:14<05:39,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  71%|█████████████████████████████████████▋               | 1296/1824 [13:15<05:41,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0938:  71%|█████████████████████████████████████▋               | 1297/1824 [13:15<05:39,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1016:  71%|█████████████████████████████████████▋               | 1298/1824 [13:16<05:35,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  71%|█████████████████████████████████████▋               | 1299/1824 [13:17<05:40,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  71%|█████████████████████████████████████▊               | 1300/1824 [13:17<05:42,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  71%|█████████████████████████████████████▊               | 1301/1824 [13:18<05:36,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0156:  71%|█████████████████████████████████████▊               | 1302/1824 [13:19<05:48,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.6270:  71%|█████████████████████████████████████▊               | 1303/1824 [13:19<05:47,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.8438:  71%|█████████████████████████████████████▉               | 1304/1824 [13:20<05:44,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.6699:  72%|█████████████████████████████████████▉               | 1305/1824 [13:21<05:51,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 3.2773:  72%|█████████████████████████████████████▉               | 1306/1824 [13:21<05:43,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.0195:  72%|█████████████████████████████████████▉               | 1307/1824 [13:22<05:33,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1562:  72%|██████████████████████████████████████               | 1308/1824 [13:22<05:29,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0039:  72%|██████████████████████████████████████               | 1309/1824 [13:23<05:28,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0195:  72%|██████████████████████████████████████               | 1310/1824 [13:24<05:30,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.7969:  72%|██████████████████████████████████████               | 1311/1824 [13:24<05:31,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9141:  72%|██████████████████████████████████████               | 1312/1824 [13:25<05:30,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9668:  72%|██████████████████████████████████████▏              | 1313/1824 [13:26<05:32,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1016:  72%|██████████████████████████████████████▏              | 1314/1824 [13:26<05:26,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.7461:  72%|██████████████████████████████████████▏              | 1315/1824 [13:27<05:22,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9648:  72%|██████████████████████████████████████▏              | 1316/1824 [13:28<05:22,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:  72%|██████████████████████████████████████▎              | 1317/1824 [13:28<05:17,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0605:  72%|██████████████████████████████████████▎              | 1318/1824 [13:29<05:15,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9473:  72%|██████████████████████████████████████▎              | 1319/1824 [13:29<05:19,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8711:  72%|██████████████████████████████████████▎              | 1320/1824 [13:30<05:24,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  72%|██████████████████████████████████████▍              | 1321/1824 [13:31<05:25,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9688:  72%|██████████████████████████████████████▍              | 1322/1824 [13:31<05:17,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1562:  73%|██████████████████████████████████████▍              | 1323/1824 [13:32<05:15,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.7012:  73%|██████████████████████████████████████▍              | 1324/1824 [13:33<05:15,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1504:  73%|██████████████████████████████████████▌              | 1325/1824 [13:33<05:18,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.7129:  73%|██████████████████████████████████████▌              | 1326/1824 [13:34<05:20,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  73%|██████████████████████████████████████▌              | 1327/1824 [13:34<05:10,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8223:  73%|██████████████████████████████████████▌              | 1328/1824 [13:35<05:11,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  73%|██████████████████████████████████████▌              | 1329/1824 [13:36<05:16,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  73%|██████████████████████████████████████▋              | 1330/1824 [13:36<05:20,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1914:  73%|██████████████████████████████████████▋              | 1331/1824 [13:37<05:23,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.2383:  73%|██████████████████████████████████████▋              | 1332/1824 [13:38<05:18,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.3301:  73%|██████████████████████████████████████▋              | 1333/1824 [13:38<05:13,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.4258:  73%|██████████████████████████████████████▊              | 1334/1824 [13:39<05:06,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.2773:  73%|██████████████████████████████████████▊              | 1335/1824 [13:40<05:11,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  73%|██████████████████████████████████████▊              | 1336/1824 [13:40<05:08,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8359:  73%|██████████████████████████████████████▊              | 1337/1824 [13:41<05:09,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2676:  73%|██████████████████████████████████████▉              | 1338/1824 [13:42<05:13,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  73%|██████████████████████████████████████▉              | 1339/1824 [13:42<05:14,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2930:  73%|██████████████████████████████████████▉              | 1340/1824 [13:43<05:15,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  74%|██████████████████████████████████████▉              | 1341/1824 [13:44<05:14,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9980:  74%|██████████████████████████████████████▉              | 1342/1824 [13:44<05:09,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  74%|███████████████████████████████████████              | 1343/1824 [13:45<05:15,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.0664:  74%|███████████████████████████████████████              | 1344/1824 [13:46<05:28,  1.46it/s]

cuda:0


Epoch 0/4, Loss: 2.8867:  74%|███████████████████████████████████████              | 1345/1824 [13:46<05:42,  1.40it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  74%|███████████████████████████████████████              | 1346/1824 [13:47<05:22,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  74%|███████████████████████████████████████▏             | 1347/1824 [13:48<05:19,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.9570:  74%|███████████████████████████████████████▏             | 1348/1824 [13:48<05:04,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  74%|███████████████████████████████████████▏             | 1349/1824 [13:49<05:02,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1406:  74%|███████████████████████████████████████▏             | 1350/1824 [13:49<04:57,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.2324:  74%|███████████████████████████████████████▎             | 1351/1824 [13:50<05:01,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  74%|███████████████████████████████████████▎             | 1352/1824 [13:51<05:03,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8477:  74%|███████████████████████████████████████▎             | 1353/1824 [13:51<05:07,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8672:  74%|███████████████████████████████████████▎             | 1354/1824 [13:52<05:11,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.8477:  74%|███████████████████████████████████████▎             | 1355/1824 [13:53<05:01,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8262:  74%|███████████████████████████████████████▍             | 1356/1824 [13:53<04:57,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  74%|███████████████████████████████████████▍             | 1357/1824 [13:54<04:56,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.2480:  74%|███████████████████████████████████████▍             | 1358/1824 [13:55<04:54,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:  75%|███████████████████████████████████████▍             | 1359/1824 [13:55<04:49,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0449:  75%|███████████████████████████████████████▌             | 1360/1824 [13:56<05:02,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.3867:  75%|███████████████████████████████████████▌             | 1361/1824 [13:57<05:06,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.9629:  75%|███████████████████████████████████████▌             | 1362/1824 [13:57<04:59,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9727:  75%|███████████████████████████████████████▌             | 1363/1824 [13:58<04:56,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9512:  75%|███████████████████████████████████████▋             | 1364/1824 [13:58<04:50,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1230:  75%|███████████████████████████████████████▋             | 1365/1824 [13:59<04:48,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.7617:  75%|███████████████████████████████████████▋             | 1366/1824 [14:00<04:43,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9473:  75%|███████████████████████████████████████▋             | 1367/1824 [14:00<04:44,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.3359:  75%|███████████████████████████████████████▊             | 1368/1824 [14:01<04:43,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0938:  75%|███████████████████████████████████████▊             | 1369/1824 [14:02<04:43,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2305:  75%|███████████████████████████████████████▊             | 1370/1824 [14:02<04:38,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1523:  75%|███████████████████████████████████████▊             | 1371/1824 [14:03<04:40,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2090:  75%|███████████████████████████████████████▊             | 1372/1824 [14:03<04:48,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1523:  75%|███████████████████████████████████████▉             | 1373/1824 [14:04<04:53,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.6973:  75%|███████████████████████████████████████▉             | 1374/1824 [14:05<04:59,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  75%|███████████████████████████████████████▉             | 1375/1824 [14:06<05:01,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  75%|███████████████████████████████████████▉             | 1376/1824 [14:06<05:00,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.7383:  75%|████████████████████████████████████████             | 1377/1824 [14:07<05:00,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.9141:  76%|████████████████████████████████████████             | 1378/1824 [14:08<04:59,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.9199:  76%|████████████████████████████████████████             | 1379/1824 [14:08<04:53,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.1328:  76%|████████████████████████████████████████             | 1380/1824 [14:09<04:57,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.1406:  76%|████████████████████████████████████████▏            | 1381/1824 [14:09<04:54,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.2207:  76%|████████████████████████████████████████▏            | 1382/1824 [14:10<04:48,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.2129:  76%|████████████████████████████████████████▏            | 1383/1824 [14:11<04:40,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1348:  76%|████████████████████████████████████████▏            | 1384/1824 [14:11<04:39,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  76%|████████████████████████████████████████▏            | 1385/1824 [14:12<04:36,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  76%|████████████████████████████████████████▎            | 1386/1824 [14:13<04:39,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8105:  76%|████████████████████████████████████████▎            | 1387/1824 [14:13<04:41,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  76%|████████████████████████████████████████▎            | 1388/1824 [14:14<04:44,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0801:  76%|████████████████████████████████████████▎            | 1389/1824 [14:15<04:44,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8613:  76%|████████████████████████████████████████▍            | 1390/1824 [14:15<04:38,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8125:  76%|████████████████████████████████████████▍            | 1391/1824 [14:16<04:34,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0430:  76%|████████████████████████████████████████▍            | 1392/1824 [14:16<04:35,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9629:  76%|████████████████████████████████████████▍            | 1393/1824 [14:17<04:40,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.2695:  76%|████████████████████████████████████████▌            | 1394/1824 [14:18<04:36,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9473:  76%|████████████████████████████████████████▌            | 1395/1824 [14:19<04:45,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  77%|████████████████████████████████████████▌            | 1396/1824 [14:19<04:48,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 2.8887:  77%|████████████████████████████████████████▌            | 1397/1824 [14:20<04:48,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 2.6211:  77%|████████████████████████████████████████▌            | 1398/1824 [14:21<04:52,  1.46it/s]

cuda:0


Epoch 0/4, Loss: 3.1816:  77%|████████████████████████████████████████▋            | 1399/1824 [14:21<04:42,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.3594:  77%|████████████████████████████████████████▋            | 1400/1824 [14:22<04:41,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.3047:  77%|████████████████████████████████████████▋            | 1401/1824 [14:23<04:38,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.0625:  77%|████████████████████████████████████████▋            | 1402/1824 [14:23<04:36,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9727:  77%|████████████████████████████████████████▊            | 1403/1824 [14:24<04:37,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  77%|████████████████████████████████████████▊            | 1404/1824 [14:24<04:33,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0566:  77%|████████████████████████████████████████▊            | 1405/1824 [14:25<04:35,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.8418:  77%|████████████████████████████████████████▊            | 1406/1824 [14:26<04:31,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  77%|████████████████████████████████████████▉            | 1407/1824 [14:26<04:29,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  77%|████████████████████████████████████████▉            | 1408/1824 [14:27<04:30,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  77%|████████████████████████████████████████▉            | 1409/1824 [14:28<04:33,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.3477:  77%|████████████████████████████████████████▉            | 1410/1824 [14:28<04:30,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  77%|████████████████████████████████████████▉            | 1411/1824 [14:29<04:29,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  77%|█████████████████████████████████████████            | 1412/1824 [14:30<04:30,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  77%|█████████████████████████████████████████            | 1413/1824 [14:30<04:26,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  78%|█████████████████████████████████████████            | 1414/1824 [14:31<04:26,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  78%|█████████████████████████████████████████            | 1415/1824 [14:32<04:26,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  78%|█████████████████████████████████████████▏           | 1416/1824 [14:32<04:25,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.7500:  78%|█████████████████████████████████████████▏           | 1417/1824 [14:33<04:25,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2441:  78%|█████████████████████████████████████████▏           | 1418/1824 [14:34<04:25,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8184:  78%|█████████████████████████████████████████▏           | 1419/1824 [14:34<04:22,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1523:  78%|█████████████████████████████████████████▎           | 1420/1824 [14:35<04:23,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1738:  78%|█████████████████████████████████████████▎           | 1421/1824 [14:36<04:16,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0293:  78%|█████████████████████████████████████████▎           | 1422/1824 [14:36<04:14,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  78%|█████████████████████████████████████████▎           | 1423/1824 [14:37<04:10,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.6348:  78%|█████████████████████████████████████████▍           | 1424/1824 [14:37<04:08,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2852:  78%|█████████████████████████████████████████▍           | 1425/1824 [14:38<04:05,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9727:  78%|█████████████████████████████████████████▍           | 1426/1824 [14:39<04:06,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1387:  78%|█████████████████████████████████████████▍           | 1427/1824 [14:39<04:13,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8555:  78%|█████████████████████████████████████████▍           | 1428/1824 [14:40<04:11,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9688:  78%|█████████████████████████████████████████▌           | 1429/1824 [14:41<04:15,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8203:  78%|█████████████████████████████████████████▌           | 1430/1824 [14:41<04:12,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1152:  78%|█████████████████████████████████████████▌           | 1431/1824 [14:42<04:23,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.8555:  79%|█████████████████████████████████████████▌           | 1432/1824 [14:43<04:22,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.3633:  79%|█████████████████████████████████████████▋           | 1433/1824 [14:43<04:21,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.9785:  79%|█████████████████████████████████████████▋           | 1434/1824 [14:44<04:17,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.2578:  79%|█████████████████████████████████████████▋           | 1435/1824 [14:45<04:12,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  79%|█████████████████████████████████████████▋           | 1436/1824 [14:45<04:07,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8965:  79%|█████████████████████████████████████████▊           | 1437/1824 [14:46<04:04,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8516:  79%|█████████████████████████████████████████▊           | 1438/1824 [14:46<04:00,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8398:  79%|█████████████████████████████████████████▊           | 1439/1824 [14:47<04:08,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  79%|█████████████████████████████████████████▊           | 1440/1824 [14:48<04:05,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8262:  79%|█████████████████████████████████████████▊           | 1441/1824 [14:48<04:05,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.3945:  79%|█████████████████████████████████████████▉           | 1442/1824 [14:49<04:04,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  79%|█████████████████████████████████████████▉           | 1443/1824 [14:50<04:04,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8008:  79%|█████████████████████████████████████████▉           | 1444/1824 [14:50<04:04,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  79%|█████████████████████████████████████████▉           | 1445/1824 [14:51<04:06,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8672:  79%|██████████████████████████████████████████           | 1446/1824 [14:52<04:07,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.3184:  79%|██████████████████████████████████████████           | 1447/1824 [14:52<03:59,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0410:  79%|██████████████████████████████████████████           | 1448/1824 [14:53<04:00,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.4023:  79%|██████████████████████████████████████████           | 1449/1824 [14:53<03:59,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2031:  79%|██████████████████████████████████████████▏          | 1450/1824 [14:54<03:59,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.2539:  80%|██████████████████████████████████████████▏          | 1451/1824 [14:55<04:00,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.4062:  80%|██████████████████████████████████████████▏          | 1452/1824 [14:55<03:56,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  80%|██████████████████████████████████████████▏          | 1453/1824 [14:56<03:59,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1094:  80%|██████████████████████████████████████████▏          | 1454/1824 [14:57<04:00,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0312:  80%|██████████████████████████████████████████▎          | 1455/1824 [14:57<04:05,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  80%|██████████████████████████████████████████▎          | 1456/1824 [14:58<03:58,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1660:  80%|██████████████████████████████████████████▎          | 1457/1824 [14:59<03:56,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.2695:  80%|██████████████████████████████████████████▎          | 1458/1824 [14:59<03:50,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  80%|██████████████████████████████████████████▍          | 1459/1824 [15:00<03:51,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  80%|██████████████████████████████████████████▍          | 1460/1824 [15:01<03:53,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0840:  80%|██████████████████████████████████████████▍          | 1461/1824 [15:01<03:55,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9961:  80%|██████████████████████████████████████████▍          | 1462/1824 [15:02<03:50,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8711:  80%|██████████████████████████████████████████▌          | 1463/1824 [15:03<03:53,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  80%|██████████████████████████████████████████▌          | 1464/1824 [15:03<03:50,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  80%|██████████████████████████████████████████▌          | 1465/1824 [15:04<03:49,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.2344:  80%|██████████████████████████████████████████▌          | 1466/1824 [15:04<03:45,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.2031:  80%|██████████████████████████████████████████▋          | 1467/1824 [15:05<03:45,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.4844:  80%|██████████████████████████████████████████▋          | 1468/1824 [15:06<03:45,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  81%|██████████████████████████████████████████▋          | 1469/1824 [15:06<03:48,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  81%|██████████████████████████████████████████▋          | 1470/1824 [15:07<03:47,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1016:  81%|██████████████████████████████████████████▋          | 1471/1824 [15:08<03:46,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.2891:  81%|██████████████████████████████████████████▊          | 1472/1824 [15:08<03:44,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0840:  81%|██████████████████████████████████████████▊          | 1473/1824 [15:09<03:46,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1250:  81%|██████████████████████████████████████████▊          | 1474/1824 [15:09<03:42,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0723:  81%|██████████████████████████████████████████▊          | 1475/1824 [15:10<03:40,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8730:  81%|██████████████████████████████████████████▉          | 1476/1824 [15:11<03:38,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  81%|██████████████████████████████████████████▉          | 1477/1824 [15:11<03:36,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8691:  81%|██████████████████████████████████████████▉          | 1478/1824 [15:12<03:34,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  81%|██████████████████████████████████████████▉          | 1479/1824 [15:13<03:33,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7910:  81%|███████████████████████████████████████████          | 1480/1824 [15:13<03:38,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.6680:  81%|███████████████████████████████████████████          | 1481/1824 [15:14<03:40,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8848:  81%|███████████████████████████████████████████          | 1482/1824 [15:15<03:40,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0547:  81%|███████████████████████████████████████████          | 1483/1824 [15:15<03:40,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  81%|███████████████████████████████████████████          | 1484/1824 [15:16<03:40,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.7188:  81%|███████████████████████████████████████████▏         | 1485/1824 [15:17<03:43,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  81%|███████████████████████████████████████████▏         | 1486/1824 [15:17<03:46,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.0039:  82%|███████████████████████████████████████████▏         | 1487/1824 [15:18<03:44,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.8789:  82%|███████████████████████████████████████████▏         | 1488/1824 [15:19<03:41,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  82%|███████████████████████████████████████████▎         | 1489/1824 [15:19<03:42,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  82%|███████████████████████████████████████████▎         | 1490/1824 [15:20<03:45,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 2.9160:  82%|███████████████████████████████████████████▎         | 1491/1824 [15:21<03:42,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.1328:  82%|███████████████████████████████████████████▎         | 1492/1824 [15:21<03:34,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9570:  82%|███████████████████████████████████████████▍         | 1493/1824 [15:22<03:31,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8203:  82%|███████████████████████████████████████████▍         | 1494/1824 [15:22<03:33,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  82%|███████████████████████████████████████████▍         | 1495/1824 [15:23<03:25,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  82%|███████████████████████████████████████████▍         | 1496/1824 [15:24<03:27,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  82%|███████████████████████████████████████████▍         | 1497/1824 [15:24<03:28,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.3047:  82%|███████████████████████████████████████████▌         | 1498/1824 [15:25<03:29,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8711:  82%|███████████████████████████████████████████▌         | 1499/1824 [15:26<03:31,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8965:  82%|███████████████████████████████████████████▌         | 1500/1824 [15:26<03:30,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.6719:  82%|███████████████████████████████████████████▌         | 1501/1824 [15:27<03:29,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.6289:  82%|███████████████████████████████████████████▋         | 1502/1824 [15:28<03:32,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.0410:  82%|███████████████████████████████████████████▋         | 1503/1824 [15:28<03:34,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.0527:  82%|███████████████████████████████████████████▋         | 1504/1824 [15:29<03:36,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:  83%|███████████████████████████████████████████▋         | 1505/1824 [15:30<03:32,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.8711:  83%|███████████████████████████████████████████▊         | 1506/1824 [15:30<03:31,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.6836:  83%|███████████████████████████████████████████▊         | 1507/1824 [15:31<03:29,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.0664:  83%|███████████████████████████████████████████▊         | 1508/1824 [15:32<03:25,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9434:  83%|███████████████████████████████████████████▊         | 1509/1824 [15:32<03:30,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  83%|███████████████████████████████████████████▉         | 1510/1824 [15:33<03:29,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.2891:  83%|███████████████████████████████████████████▉         | 1511/1824 [15:34<03:26,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9316:  83%|███████████████████████████████████████████▉         | 1512/1824 [15:34<03:24,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:  83%|███████████████████████████████████████████▉         | 1513/1824 [15:35<03:22,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  83%|███████████████████████████████████████████▉         | 1514/1824 [15:36<03:17,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  83%|████████████████████████████████████████████         | 1515/1824 [15:36<03:21,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.0195:  83%|████████████████████████████████████████████         | 1516/1824 [15:37<03:22,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.7891:  83%|████████████████████████████████████████████         | 1517/1824 [15:37<03:18,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9336:  83%|████████████████████████████████████████████         | 1518/1824 [15:38<03:17,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1211:  83%|████████████████████████████████████████████▏        | 1519/1824 [15:39<03:18,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.6406:  83%|████████████████████████████████████████████▏        | 1520/1824 [15:39<03:17,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0488:  83%|████████████████████████████████████████████▏        | 1521/1824 [15:40<03:11,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.6445:  83%|████████████████████████████████████████████▏        | 1522/1824 [15:41<03:09,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8770:  83%|████████████████████████████████████████████▎        | 1523/1824 [15:41<03:10,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  84%|████████████████████████████████████████████▎        | 1524/1824 [15:42<03:11,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0039:  84%|████████████████████████████████████████████▎        | 1525/1824 [15:43<03:13,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8555:  84%|████████████████████████████████████████████▎        | 1526/1824 [15:43<03:13,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  84%|████████████████████████████████████████████▎        | 1527/1824 [15:44<03:13,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.7227:  84%|████████████████████████████████████████████▍        | 1528/1824 [15:45<03:13,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1621:  84%|████████████████████████████████████████████▍        | 1529/1824 [15:45<03:18,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.0664:  84%|████████████████████████████████████████████▍        | 1530/1824 [15:46<03:17,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 2.6602:  84%|████████████████████████████████████████████▍        | 1531/1824 [15:47<03:10,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  84%|████████████████████████████████████████████▌        | 1532/1824 [15:47<03:09,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0293:  84%|████████████████████████████████████████████▌        | 1533/1824 [15:48<03:09,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9980:  84%|████████████████████████████████████████████▌        | 1534/1824 [15:49<03:09,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1797:  84%|████████████████████████████████████████████▌        | 1535/1824 [15:49<03:08,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9395:  84%|████████████████████████████████████████████▋        | 1536/1824 [15:50<03:08,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.9043:  84%|████████████████████████████████████████████▋        | 1537/1824 [15:50<03:05,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  84%|████████████████████████████████████████████▋        | 1538/1824 [15:51<03:01,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.0156:  84%|████████████████████████████████████████████▋        | 1539/1824 [15:52<03:00,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1543:  84%|████████████████████████████████████████████▋        | 1540/1824 [15:52<02:58,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.2500:  84%|████████████████████████████████████████████▊        | 1541/1824 [15:53<03:01,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0762:  85%|████████████████████████████████████████████▊        | 1542/1824 [15:54<03:04,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.2012:  85%|████████████████████████████████████████████▊        | 1543/1824 [15:54<03:04,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  85%|████████████████████████████████████████████▊        | 1544/1824 [15:55<03:02,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8027:  85%|████████████████████████████████████████████▉        | 1545/1824 [15:56<03:05,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.7637:  85%|████████████████████████████████████████████▉        | 1546/1824 [15:56<03:02,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  85%|████████████████████████████████████████████▉        | 1547/1824 [15:57<03:01,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  85%|████████████████████████████████████████████▉        | 1548/1824 [15:58<02:58,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0195:  85%|█████████████████████████████████████████████        | 1549/1824 [15:58<02:54,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9746:  85%|█████████████████████████████████████████████        | 1550/1824 [15:59<02:55,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.2383:  85%|█████████████████████████████████████████████        | 1551/1824 [16:00<02:57,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.4414:  85%|█████████████████████████████████████████████        | 1552/1824 [16:00<02:53,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0039:  85%|█████████████████████████████████████████████▏       | 1553/1824 [16:01<02:52,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  85%|█████████████████████████████████████████████▏       | 1554/1824 [16:01<02:50,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.2734:  85%|█████████████████████████████████████████████▏       | 1555/1824 [16:02<02:53,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0059:  85%|█████████████████████████████████████████████▏       | 1556/1824 [16:03<02:50,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.9688:  85%|█████████████████████████████████████████████▏       | 1557/1824 [16:03<02:46,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8789:  85%|█████████████████████████████████████████████▎       | 1558/1824 [16:04<02:44,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  85%|█████████████████████████████████████████████▎       | 1559/1824 [16:05<02:47,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.6484:  86%|█████████████████████████████████████████████▎       | 1560/1824 [16:05<02:50,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.1660:  86%|█████████████████████████████████████████████▎       | 1561/1824 [16:06<02:47,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8652:  86%|█████████████████████████████████████████████▍       | 1562/1824 [16:06<02:47,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  86%|█████████████████████████████████████████████▍       | 1563/1824 [16:07<02:46,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8809:  86%|█████████████████████████████████████████████▍       | 1564/1824 [16:08<02:47,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.7930:  86%|█████████████████████████████████████████████▍       | 1565/1824 [16:08<02:51,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.5703:  86%|█████████████████████████████████████████████▌       | 1566/1824 [16:09<02:50,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.7617:  86%|█████████████████████████████████████████████▌       | 1567/1824 [16:10<02:51,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.6719:  86%|█████████████████████████████████████████████▌       | 1568/1824 [16:10<02:46,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.7773:  86%|█████████████████████████████████████████████▌       | 1569/1824 [16:11<02:43,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  86%|█████████████████████████████████████████████▌       | 1570/1824 [16:12<02:42,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8047:  86%|█████████████████████████████████████████████▋       | 1571/1824 [16:12<02:38,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.2852:  86%|█████████████████████████████████████████████▋       | 1572/1824 [16:13<02:37,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9863:  86%|█████████████████████████████████████████████▋       | 1573/1824 [16:14<02:41,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9180:  86%|█████████████████████████████████████████████▋       | 1574/1824 [16:14<02:41,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.7852:  86%|█████████████████████████████████████████████▊       | 1575/1824 [16:15<02:37,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  86%|█████████████████████████████████████████████▊       | 1576/1824 [16:15<02:36,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.7188:  86%|█████████████████████████████████████████████▊       | 1577/1824 [16:16<02:33,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8086:  87%|█████████████████████████████████████████████▊       | 1578/1824 [16:17<02:38,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8574:  87%|█████████████████████████████████████████████▉       | 1579/1824 [16:17<02:42,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  87%|█████████████████████████████████████████████▉       | 1580/1824 [16:18<02:40,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  87%|█████████████████████████████████████████████▉       | 1581/1824 [16:19<02:37,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8047:  87%|█████████████████████████████████████████████▉       | 1582/1824 [16:19<02:40,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  87%|█████████████████████████████████████████████▉       | 1583/1824 [16:20<02:41,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.4941:  87%|██████████████████████████████████████████████       | 1584/1824 [16:21<03:17,  1.22it/s]

cuda:0


Epoch 0/4, Loss: 3.0625:  87%|██████████████████████████████████████████████       | 1585/1824 [16:22<03:01,  1.32it/s]

cuda:0


Epoch 0/4, Loss: 3.1602:  87%|██████████████████████████████████████████████       | 1586/1824 [16:23<02:52,  1.38it/s]

cuda:0


Epoch 0/4, Loss: 3.0898:  87%|██████████████████████████████████████████████       | 1587/1824 [16:23<02:47,  1.42it/s]

cuda:0


Epoch 0/4, Loss: 2.9766:  87%|██████████████████████████████████████████████▏      | 1588/1824 [16:24<02:41,  1.46it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  87%|██████████████████████████████████████████████▏      | 1589/1824 [16:25<02:38,  1.48it/s]

cuda:0


Epoch 0/4, Loss: 2.9648:  87%|██████████████████████████████████████████████▏      | 1590/1824 [16:25<02:32,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.3887:  87%|██████████████████████████████████████████████▏      | 1591/1824 [16:26<02:28,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  87%|██████████████████████████████████████████████▎      | 1592/1824 [16:26<02:31,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1406:  87%|██████████████████████████████████████████████▎      | 1593/1824 [16:27<02:30,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2051:  87%|██████████████████████████████████████████████▎      | 1594/1824 [16:28<02:27,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.2441:  87%|██████████████████████████████████████████████▎      | 1595/1824 [16:28<02:28,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.2090:  88%|██████████████████████████████████████████████▍      | 1596/1824 [16:29<02:30,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.3320:  88%|██████████████████████████████████████████████▍      | 1597/1824 [16:30<02:27,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.1465:  88%|██████████████████████████████████████████████▍      | 1598/1824 [16:30<02:27,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1406:  88%|██████████████████████████████████████████████▍      | 1599/1824 [16:31<02:28,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.1387:  88%|██████████████████████████████████████████████▍      | 1600/1824 [16:32<02:26,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.6914:  88%|██████████████████████████████████████████████▌      | 1601/1824 [16:32<02:28,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.1484:  88%|██████████████████████████████████████████████▌      | 1602/1824 [16:33<02:25,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1172:  88%|██████████████████████████████████████████████▌      | 1603/1824 [16:34<02:25,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9746:  88%|██████████████████████████████████████████████▌      | 1604/1824 [16:34<02:23,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.3516:  88%|██████████████████████████████████████████████▋      | 1605/1824 [16:35<02:22,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.7148:  88%|██████████████████████████████████████████████▋      | 1606/1824 [16:36<02:19,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.2168:  88%|██████████████████████████████████████████████▋      | 1607/1824 [16:36<02:17,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  88%|██████████████████████████████████████████████▋      | 1608/1824 [16:37<02:15,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  88%|██████████████████████████████████████████████▊      | 1609/1824 [16:37<02:15,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  88%|██████████████████████████████████████████████▊      | 1610/1824 [16:38<02:17,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.0957:  88%|██████████████████████████████████████████████▊      | 1611/1824 [16:39<02:17,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9375:  88%|██████████████████████████████████████████████▊      | 1612/1824 [16:39<02:15,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.3125:  88%|██████████████████████████████████████████████▊      | 1613/1824 [16:40<02:12,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.0020:  88%|██████████████████████████████████████████████▉      | 1614/1824 [16:41<02:16,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.7910:  89%|██████████████████████████████████████████████▉      | 1615/1824 [16:41<02:14,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.3398:  89%|██████████████████████████████████████████████▉      | 1616/1824 [16:42<02:17,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.0820:  89%|██████████████████████████████████████████████▉      | 1617/1824 [16:43<02:17,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 3.0430:  89%|███████████████████████████████████████████████      | 1618/1824 [16:43<02:15,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  89%|███████████████████████████████████████████████      | 1619/1824 [16:44<02:13,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.3789:  89%|███████████████████████████████████████████████      | 1620/1824 [16:45<02:10,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9180:  89%|███████████████████████████████████████████████      | 1621/1824 [16:45<02:13,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9336:  89%|███████████████████████████████████████████████▏     | 1622/1824 [16:46<02:10,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8438:  89%|███████████████████████████████████████████████▏     | 1623/1824 [16:46<02:08,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:  89%|███████████████████████████████████████████████▏     | 1624/1824 [16:47<02:08,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.9141:  89%|███████████████████████████████████████████████▏     | 1625/1824 [16:48<02:08,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 3.3027:  89%|███████████████████████████████████████████████▏     | 1626/1824 [16:48<02:05,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.3633:  89%|███████████████████████████████████████████████▎     | 1627/1824 [16:49<02:03,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.2578:  89%|███████████████████████████████████████████████▎     | 1628/1824 [16:50<02:04,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1660:  89%|███████████████████████████████████████████████▎     | 1629/1824 [16:50<02:03,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  89%|███████████████████████████████████████████████▎     | 1630/1824 [16:51<02:01,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.6758:  89%|███████████████████████████████████████████████▍     | 1631/1824 [16:51<02:00,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2305:  89%|███████████████████████████████████████████████▍     | 1632/1824 [16:52<01:59,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:  90%|███████████████████████████████████████████████▍     | 1633/1824 [16:53<01:58,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  90%|███████████████████████████████████████████████▍     | 1634/1824 [16:53<01:57,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  90%|███████████████████████████████████████████████▌     | 1635/1824 [16:54<01:56,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.1953:  90%|███████████████████████████████████████████████▌     | 1636/1824 [16:55<01:59,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  90%|███████████████████████████████████████████████▌     | 1637/1824 [16:55<01:59,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.7070:  90%|███████████████████████████████████████████████▌     | 1638/1824 [16:56<01:59,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8203:  90%|███████████████████████████████████████████████▌     | 1639/1824 [16:57<02:03,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 2.7305:  90%|███████████████████████████████████████████████▋     | 1640/1824 [16:57<02:02,  1.50it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  90%|███████████████████████████████████████████████▋     | 1641/1824 [16:58<01:59,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1914:  90%|███████████████████████████████████████████████▋     | 1642/1824 [16:59<02:00,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  90%|███████████████████████████████████████████████▋     | 1643/1824 [16:59<01:58,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.6289:  90%|███████████████████████████████████████████████▊     | 1644/1824 [17:00<01:56,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.9707:  90%|███████████████████████████████████████████████▊     | 1645/1824 [17:01<01:53,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  90%|███████████████████████████████████████████████▊     | 1646/1824 [17:01<01:52,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8867:  90%|███████████████████████████████████████████████▊     | 1647/1824 [17:02<01:50,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9238:  90%|███████████████████████████████████████████████▉     | 1648/1824 [17:02<01:49,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.0371:  90%|███████████████████████████████████████████████▉     | 1649/1824 [17:03<01:47,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2480:  90%|███████████████████████████████████████████████▉     | 1650/1824 [17:04<01:46,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0605:  91%|███████████████████████████████████████████████▉     | 1651/1824 [17:04<01:45,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9141:  91%|████████████████████████████████████████████████     | 1652/1824 [17:05<01:46,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  91%|████████████████████████████████████████████████     | 1653/1824 [17:05<01:48,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8809:  91%|████████████████████████████████████████████████     | 1654/1824 [17:06<01:49,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.8809:  91%|████████████████████████████████████████████████     | 1655/1824 [17:07<01:49,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 2.8789:  91%|████████████████████████████████████████████████     | 1656/1824 [17:07<01:49,  1.54it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  91%|████████████████████████████████████████████████▏    | 1657/1824 [17:08<01:49,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.1250:  91%|████████████████████████████████████████████████▏    | 1658/1824 [17:09<01:48,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  91%|████████████████████████████████████████████████▏    | 1659/1824 [17:09<01:48,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.7695:  91%|████████████████████████████████████████████████▏    | 1660/1824 [17:10<01:45,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.7480:  91%|████████████████████████████████████████████████▎    | 1661/1824 [17:11<01:44,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.6934:  91%|████████████████████████████████████████████████▎    | 1662/1824 [17:11<01:44,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.7734:  91%|████████████████████████████████████████████████▎    | 1663/1824 [17:12<01:43,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 3.1035:  91%|████████████████████████████████████████████████▎    | 1664/1824 [17:13<01:41,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.9492:  91%|████████████████████████████████████████████████▍    | 1665/1824 [17:13<01:39,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  91%|████████████████████████████████████████████████▍    | 1666/1824 [17:14<01:38,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.1680:  91%|████████████████████████████████████████████████▍    | 1667/1824 [17:14<01:38,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  91%|████████████████████████████████████████████████▍    | 1668/1824 [17:15<01:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  92%|████████████████████████████████████████████████▍    | 1669/1824 [17:16<01:36,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  92%|████████████████████████████████████████████████▌    | 1670/1824 [17:16<01:39,  1.55it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  92%|████████████████████████████████████████████████▌    | 1671/1824 [17:17<01:41,  1.51it/s]

cuda:0


Epoch 0/4, Loss: 2.6035:  92%|████████████████████████████████████████████████▌    | 1672/1824 [17:18<01:39,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8438:  92%|████████████████████████████████████████████████▌    | 1673/1824 [17:18<01:39,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 3.1133:  92%|████████████████████████████████████████████████▋    | 1674/1824 [17:19<01:38,  1.52it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  92%|████████████████████████████████████████████████▋    | 1675/1824 [17:20<01:37,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 2.8711:  92%|████████████████████████████████████████████████▋    | 1676/1824 [17:20<01:39,  1.49it/s]

cuda:0


Epoch 0/4, Loss: 3.3672:  92%|████████████████████████████████████████████████▋    | 1677/1824 [17:21<01:35,  1.53it/s]

cuda:0


Epoch 0/4, Loss: 3.1484:  92%|████████████████████████████████████████████████▊    | 1678/1824 [17:22<01:33,  1.56it/s]

cuda:0


Epoch 0/4, Loss: 2.9902:  92%|████████████████████████████████████████████████▊    | 1679/1824 [17:22<01:31,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8125:  92%|████████████████████████████████████████████████▊    | 1680/1824 [17:23<01:29,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.7637:  92%|████████████████████████████████████████████████▊    | 1681/1824 [17:23<01:28,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9277:  92%|████████████████████████████████████████████████▊    | 1682/1824 [17:24<01:27,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  92%|████████████████████████████████████████████████▉    | 1683/1824 [17:25<01:25,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.2617:  92%|████████████████████████████████████████████████▉    | 1684/1824 [17:25<01:26,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  92%|████████████████████████████████████████████████▉    | 1685/1824 [17:26<01:24,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9102:  92%|████████████████████████████████████████████████▉    | 1686/1824 [17:26<01:23,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1836:  92%|█████████████████████████████████████████████████    | 1687/1824 [17:27<01:22,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  93%|█████████████████████████████████████████████████    | 1688/1824 [17:28<01:22,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0508:  93%|█████████████████████████████████████████████████    | 1689/1824 [17:28<01:20,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0156:  93%|█████████████████████████████████████████████████    | 1690/1824 [17:29<01:20,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  93%|█████████████████████████████████████████████████▏   | 1691/1824 [17:29<01:20,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.3535:  93%|█████████████████████████████████████████████████▏   | 1692/1824 [17:30<01:18,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  93%|█████████████████████████████████████████████████▏   | 1693/1824 [17:31<01:19,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  93%|█████████████████████████████████████████████████▏   | 1694/1824 [17:31<01:17,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.1445:  93%|█████████████████████████████████████████████████▎   | 1695/1824 [17:32<01:17,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.8750:  93%|█████████████████████████████████████████████████▎   | 1696/1824 [17:32<01:16,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  93%|█████████████████████████████████████████████████▎   | 1697/1824 [17:33<01:14,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 2.9980:  93%|█████████████████████████████████████████████████▎   | 1698/1824 [17:34<01:13,  1.71it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  93%|█████████████████████████████████████████████████▎   | 1699/1824 [17:34<01:15,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1328:  93%|█████████████████████████████████████████████████▍   | 1700/1824 [17:35<01:14,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.2656:  93%|█████████████████████████████████████████████████▍   | 1701/1824 [17:35<01:13,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.6055:  93%|█████████████████████████████████████████████████▍   | 1702/1824 [17:36<01:14,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.3086:  93%|█████████████████████████████████████████████████▍   | 1703/1824 [17:37<01:13,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0273:  93%|█████████████████████████████████████████████████▌   | 1704/1824 [17:37<01:13,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0469:  93%|█████████████████████████████████████████████████▌   | 1705/1824 [17:38<01:12,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  94%|█████████████████████████████████████████████████▌   | 1706/1824 [17:38<01:11,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.8926:  94%|█████████████████████████████████████████████████▌   | 1707/1824 [17:39<01:10,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.8379:  94%|█████████████████████████████████████████████████▋   | 1708/1824 [17:40<01:10,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0254:  94%|█████████████████████████████████████████████████▋   | 1709/1824 [17:40<01:09,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.6484:  94%|█████████████████████████████████████████████████▋   | 1710/1824 [17:41<01:09,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.6797:  94%|█████████████████████████████████████████████████▋   | 1711/1824 [17:42<01:09,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9668:  94%|█████████████████████████████████████████████████▋   | 1712/1824 [17:42<01:09,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.6758:  94%|█████████████████████████████████████████████████▊   | 1713/1824 [17:43<01:08,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2500:  94%|█████████████████████████████████████████████████▊   | 1714/1824 [17:43<01:07,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.2227:  94%|█████████████████████████████████████████████████▊   | 1715/1824 [17:44<01:06,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.2617:  94%|█████████████████████████████████████████████████▊   | 1716/1824 [17:45<01:05,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0703:  94%|█████████████████████████████████████████████████▉   | 1717/1824 [17:45<01:05,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8633:  94%|█████████████████████████████████████████████████▉   | 1718/1824 [17:46<01:07,  1.57it/s]

cuda:0


Epoch 0/4, Loss: 3.2559:  94%|█████████████████████████████████████████████████▉   | 1719/1824 [17:47<01:05,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.8203:  94%|█████████████████████████████████████████████████▉   | 1720/1824 [17:47<01:04,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.6641:  94%|██████████████████████████████████████████████████   | 1721/1824 [17:48<01:03,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8926:  94%|██████████████████████████████████████████████████   | 1722/1824 [17:48<01:02,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.6758:  94%|██████████████████████████████████████████████████   | 1723/1824 [17:49<01:01,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  95%|██████████████████████████████████████████████████   | 1724/1824 [17:50<01:01,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7637:  95%|██████████████████████████████████████████████████   | 1725/1824 [17:50<01:00,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1484:  95%|██████████████████████████████████████████████████▏  | 1726/1824 [17:51<01:00,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.1816:  95%|██████████████████████████████████████████████████▏  | 1727/1824 [17:51<00:59,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0566:  95%|██████████████████████████████████████████████████▏  | 1728/1824 [17:52<00:59,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  95%|██████████████████████████████████████████████████▏  | 1729/1824 [17:53<00:58,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.7578:  95%|██████████████████████████████████████████████████▎  | 1730/1824 [17:53<00:58,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9023:  95%|██████████████████████████████████████████████████▎  | 1731/1824 [17:54<00:58,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9395:  95%|██████████████████████████████████████████████████▎  | 1732/1824 [17:55<00:56,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0430:  95%|██████████████████████████████████████████████████▎  | 1733/1824 [17:55<00:55,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0117:  95%|██████████████████████████████████████████████████▍  | 1734/1824 [17:56<00:55,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2090:  95%|██████████████████████████████████████████████████▍  | 1735/1824 [17:56<00:53,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.2773:  95%|██████████████████████████████████████████████████▍  | 1736/1824 [17:57<00:54,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1816:  95%|██████████████████████████████████████████████████▍  | 1737/1824 [17:58<00:53,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1523:  95%|██████████████████████████████████████████████████▌  | 1738/1824 [17:58<00:51,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0859:  95%|██████████████████████████████████████████████████▌  | 1739/1824 [17:59<00:50,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  95%|██████████████████████████████████████████████████▌  | 1740/1824 [17:59<00:51,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8359:  95%|██████████████████████████████████████████████████▌  | 1741/1824 [18:00<00:50,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7852:  96%|██████████████████████████████████████████████████▌  | 1742/1824 [18:01<00:50,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.3086:  96%|██████████████████████████████████████████████████▋  | 1743/1824 [18:01<00:49,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.1680:  96%|██████████████████████████████████████████████████▋  | 1744/1824 [18:02<00:49,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.4141:  96%|██████████████████████████████████████████████████▋  | 1745/1824 [18:02<00:47,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0352:  96%|██████████████████████████████████████████████████▋  | 1746/1824 [18:03<00:46,  1.68it/s]

cuda:0


Epoch 0/4, Loss: 3.1055:  96%|██████████████████████████████████████████████████▊  | 1747/1824 [18:04<00:46,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.1289:  96%|██████████████████████████████████████████████████▊  | 1748/1824 [18:04<00:45,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0742:  96%|██████████████████████████████████████████████████▊  | 1749/1824 [18:05<00:44,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.5781:  96%|██████████████████████████████████████████████████▊  | 1750/1824 [18:05<00:45,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.2285:  96%|██████████████████████████████████████████████████▉  | 1751/1824 [18:06<00:44,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.8262:  96%|██████████████████████████████████████████████████▉  | 1752/1824 [18:07<00:43,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.0391:  96%|██████████████████████████████████████████████████▉  | 1753/1824 [18:07<00:42,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7656:  96%|██████████████████████████████████████████████████▉  | 1754/1824 [18:08<00:41,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.8828:  96%|██████████████████████████████████████████████████▉  | 1755/1824 [18:08<00:41,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.8984:  96%|███████████████████████████████████████████████████  | 1756/1824 [18:09<00:41,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9062:  96%|███████████████████████████████████████████████████  | 1757/1824 [18:10<00:41,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.7988:  96%|███████████████████████████████████████████████████  | 1758/1824 [18:10<00:40,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9531:  96%|███████████████████████████████████████████████████  | 1759/1824 [18:11<00:39,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0840:  96%|███████████████████████████████████████████████████▏ | 1760/1824 [18:12<00:39,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  97%|███████████████████████████████████████████████████▏ | 1761/1824 [18:12<00:38,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0762:  97%|███████████████████████████████████████████████████▏ | 1762/1824 [18:13<00:38,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.5527:  97%|███████████████████████████████████████████████████▏ | 1763/1824 [18:13<00:37,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.7090:  97%|███████████████████████████████████████████████████▎ | 1764/1824 [18:14<00:37,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.6602:  97%|███████████████████████████████████████████████████▎ | 1765/1824 [18:15<00:36,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.6445:  97%|███████████████████████████████████████████████████▎ | 1766/1824 [18:15<00:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8418:  97%|███████████████████████████████████████████████████▎ | 1767/1824 [18:16<00:35,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9219:  97%|███████████████████████████████████████████████████▎ | 1768/1824 [18:16<00:34,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1484:  97%|███████████████████████████████████████████████████▍ | 1769/1824 [18:17<00:33,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.2520:  97%|███████████████████████████████████████████████████▍ | 1770/1824 [18:18<00:33,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  97%|███████████████████████████████████████████████████▍ | 1771/1824 [18:18<00:32,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9453:  97%|███████████████████████████████████████████████████▍ | 1772/1824 [18:19<00:32,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 3.2480:  97%|███████████████████████████████████████████████████▌ | 1773/1824 [18:20<00:31,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 3.0078:  97%|███████████████████████████████████████████████████▌ | 1774/1824 [18:20<00:30,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.0391:  97%|███████████████████████████████████████████████████▌ | 1775/1824 [18:21<00:29,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.9258:  97%|███████████████████████████████████████████████████▌ | 1776/1824 [18:21<00:28,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.1875:  97%|███████████████████████████████████████████████████▋ | 1777/1824 [18:22<00:28,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.9902:  97%|███████████████████████████████████████████████████▋ | 1778/1824 [18:23<00:27,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.9414:  98%|███████████████████████████████████████████████████▋ | 1779/1824 [18:23<00:27,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1680:  98%|███████████████████████████████████████████████████▋ | 1780/1824 [18:24<00:26,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.2188:  98%|███████████████████████████████████████████████████▊ | 1781/1824 [18:24<00:25,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  98%|███████████████████████████████████████████████████▊ | 1782/1824 [18:25<00:25,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.8906:  98%|███████████████████████████████████████████████████▊ | 1783/1824 [18:26<00:25,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.6758:  98%|███████████████████████████████████████████████████▊ | 1784/1824 [18:26<00:24,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1562:  98%|███████████████████████████████████████████████████▊ | 1785/1824 [18:27<00:24,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.8945:  98%|███████████████████████████████████████████████████▉ | 1786/1824 [18:28<00:23,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 2.9043:  98%|███████████████████████████████████████████████████▉ | 1787/1824 [18:28<00:23,  1.58it/s]

cuda:0


Epoch 0/4, Loss: 2.8965:  98%|███████████████████████████████████████████████████▉ | 1788/1824 [18:29<00:22,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 3.0723:  98%|███████████████████████████████████████████████████▉ | 1789/1824 [18:29<00:21,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9629:  98%|████████████████████████████████████████████████████ | 1790/1824 [18:30<00:20,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.8926:  98%|████████████████████████████████████████████████████ | 1791/1824 [18:31<00:20,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 2.9805:  98%|████████████████████████████████████████████████████ | 1792/1824 [18:31<00:19,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.7578:  98%|████████████████████████████████████████████████████ | 1793/1824 [18:32<00:18,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0059:  98%|████████████████████████████████████████████████████▏| 1794/1824 [18:32<00:18,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.8125:  98%|████████████████████████████████████████████████████▏| 1795/1824 [18:33<00:17,  1.63it/s]

cuda:0


Epoch 0/4, Loss: 3.1445:  98%|████████████████████████████████████████████████████▏| 1796/1824 [18:34<00:17,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.8496:  99%|████████████████████████████████████████████████████▏| 1797/1824 [18:34<00:16,  1.59it/s]

cuda:0


Epoch 0/4, Loss: 3.1523:  99%|████████████████████████████████████████████████████▏| 1798/1824 [18:35<00:16,  1.60it/s]

cuda:0


Epoch 0/4, Loss: 2.9297:  99%|████████████████████████████████████████████████████▎| 1799/1824 [18:36<00:15,  1.61it/s]

cuda:0


Epoch 0/4, Loss: 2.9922:  99%|████████████████████████████████████████████████████▎| 1800/1824 [18:36<00:14,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9277:  99%|████████████████████████████████████████████████████▎| 1801/1824 [18:37<00:13,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.0234:  99%|████████████████████████████████████████████████████▎| 1802/1824 [18:37<00:13,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 2.8867:  99%|████████████████████████████████████████████████████▍| 1803/1824 [18:38<00:12,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.8477:  99%|████████████████████████████████████████████████████▍| 1804/1824 [18:38<00:12,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.8320:  99%|████████████████████████████████████████████████████▍| 1805/1824 [18:39<00:11,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.9609:  99%|████████████████████████████████████████████████████▍| 1806/1824 [18:40<00:10,  1.70it/s]

cuda:0


Epoch 0/4, Loss: 3.1270:  99%|████████████████████████████████████████████████████▌| 1807/1824 [18:40<00:10,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 3.0586:  99%|████████████████████████████████████████████████████▌| 1808/1824 [18:41<00:09,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.7852:  99%|████████████████████████████████████████████████████▌| 1809/1824 [18:41<00:09,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.1758:  99%|████████████████████████████████████████████████████▌| 1810/1824 [18:42<00:08,  1.69it/s]

cuda:0


Epoch 0/4, Loss: 3.0938:  99%|████████████████████████████████████████████████████▌| 1811/1824 [18:43<00:07,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 3.0781:  99%|████████████████████████████████████████████████████▋| 1812/1824 [18:43<00:07,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0000:  99%|████████████████████████████████████████████████████▋| 1813/1824 [18:44<00:06,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 2.9844:  99%|████████████████████████████████████████████████████▋| 1814/1824 [18:45<00:06,  1.62it/s]

cuda:0


Epoch 0/4, Loss: 2.9473: 100%|████████████████████████████████████████████████████▋| 1815/1824 [18:45<00:05,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.7422: 100%|████████████████████████████████████████████████████▊| 1816/1824 [18:46<00:04,  1.65it/s]

cuda:0


Epoch 0/4, Loss: 2.6855: 100%|████████████████████████████████████████████████████▊| 1817/1824 [18:46<00:04,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 2.7910: 100%|████████████████████████████████████████████████████▊| 1818/1824 [18:47<00:03,  1.64it/s]

cuda:0


Epoch 0/4, Loss: 3.0156: 100%|████████████████████████████████████████████████████▊| 1819/1824 [18:48<00:03,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 2.7539: 100%|████████████████████████████████████████████████████▉| 1820/1824 [18:48<00:02,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 3.1562: 100%|████████████████████████████████████████████████████▉| 1821/1824 [18:49<00:01,  1.67it/s]

cuda:0


Epoch 0/4, Loss: 3.4746: 100%|████████████████████████████████████████████████████▉| 1822/1824 [18:49<00:01,  1.66it/s]

cuda:0


Epoch 0/4, Loss: 1.8672: 100%|█████████████████████████████████████████████████████| 1824/1824 [18:50<00:00,  1.61it/s]


cuda:0


  0%|                                                                                         | 0/1824 [00:00<?, ?it/s]

cuda:0


Epoch 1/4, Loss: 3.2793:   0%|                                                        | 1/1824 [00:00<18:05,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1660:   0%|                                                        | 2/1824 [00:01<17:21,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:   0%|                                                        | 3/1824 [00:01<17:34,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.7051:   0%|                                                        | 4/1824 [00:02<18:02,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.2520:   0%|▏                                                       | 5/1824 [00:02<18:02,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0840:   0%|▏                                                       | 6/1824 [00:03<18:02,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7832:   0%|▏                                                       | 7/1824 [00:04<18:25,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.2461:   0%|▏                                                       | 8/1824 [00:04<18:24,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1523:   0%|▎                                                       | 9/1824 [00:05<18:20,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9922:   1%|▎                                                      | 10/1824 [00:06<18:29,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:   1%|▎                                                      | 11/1824 [00:06<18:26,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:   1%|▎                                                      | 12/1824 [00:07<18:57,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.6914:   1%|▍                                                      | 13/1824 [00:07<18:31,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0781:   1%|▍                                                      | 14/1824 [00:08<18:24,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1309:   1%|▍                                                      | 15/1824 [00:09<18:50,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9922:   1%|▍                                                      | 16/1824 [00:09<18:35,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9785:   1%|▌                                                      | 17/1824 [00:10<18:15,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:   1%|▌                                                      | 18/1824 [00:10<18:16,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:   1%|▌                                                      | 19/1824 [00:11<17:59,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8613:   1%|▌                                                      | 20/1824 [00:12<18:27,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.6348:   1%|▋                                                      | 21/1824 [00:12<18:17,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:   1%|▋                                                      | 22/1824 [00:13<18:06,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0586:   1%|▋                                                      | 23/1824 [00:13<18:10,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:   1%|▋                                                      | 24/1824 [00:14<18:14,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.3906:   1%|▊                                                      | 25/1824 [00:15<18:28,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9824:   1%|▊                                                      | 26/1824 [00:15<18:30,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.3164:   1%|▊                                                      | 27/1824 [00:16<18:44,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.2051:   2%|▊                                                      | 28/1824 [00:17<18:19,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7188:   2%|▊                                                      | 29/1824 [00:17<18:16,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7188:   2%|▉                                                      | 30/1824 [00:18<18:03,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:   2%|▉                                                      | 31/1824 [00:18<18:18,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7773:   2%|▉                                                      | 32/1824 [00:19<18:17,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9121:   2%|▉                                                      | 33/1824 [00:20<18:06,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.2109:   2%|█                                                      | 34/1824 [00:20<18:20,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.6348:   2%|█                                                      | 35/1824 [00:21<18:34,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9102:   2%|█                                                      | 36/1824 [00:21<18:32,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:   2%|█                                                      | 37/1824 [00:22<18:18,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:   2%|█▏                                                     | 38/1824 [00:23<18:22,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.3164:   2%|█▏                                                     | 39/1824 [00:23<18:14,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:   2%|█▏                                                     | 40/1824 [00:24<17:49,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:   2%|█▏                                                     | 41/1824 [00:24<17:41,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1406:   2%|█▎                                                     | 42/1824 [00:25<17:15,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.2832:   2%|█▎                                                     | 43/1824 [00:26<17:39,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8594:   2%|█▎                                                     | 44/1824 [00:26<18:04,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:   2%|█▎                                                     | 45/1824 [00:27<17:51,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:   3%|█▍                                                     | 46/1824 [00:27<17:44,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9355:   3%|█▍                                                     | 47/1824 [00:28<17:49,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:   3%|█▍                                                     | 48/1824 [00:29<18:01,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6953:   3%|█▍                                                     | 49/1824 [00:29<18:08,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0605:   3%|█▌                                                     | 50/1824 [00:30<18:05,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0781:   3%|█▌                                                     | 51/1824 [00:31<18:00,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:   3%|█▌                                                     | 52/1824 [00:31<17:57,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0430:   3%|█▌                                                     | 53/1824 [00:32<18:04,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7148:   3%|█▋                                                     | 54/1824 [00:32<17:47,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:   3%|█▋                                                     | 55/1824 [00:33<18:17,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7090:   3%|█▋                                                     | 56/1824 [00:34<18:06,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:   3%|█▋                                                     | 57/1824 [00:34<17:53,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8223:   3%|█▋                                                     | 58/1824 [00:35<17:45,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8379:   3%|█▊                                                     | 59/1824 [00:35<18:11,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:   3%|█▊                                                     | 60/1824 [00:36<18:08,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:   3%|█▊                                                     | 61/1824 [00:37<18:02,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:   3%|█▊                                                     | 62/1824 [00:37<17:38,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:   3%|█▉                                                     | 63/1824 [00:38<17:55,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:   4%|█▉                                                     | 64/1824 [00:38<18:11,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0508:   4%|█▉                                                     | 65/1824 [00:39<18:00,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7324:   4%|█▉                                                     | 66/1824 [00:40<18:05,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:   4%|██                                                     | 67/1824 [00:40<17:56,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:   4%|██                                                     | 68/1824 [00:41<18:08,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8145:   4%|██                                                     | 69/1824 [00:42<17:57,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:   4%|██                                                     | 70/1824 [00:42<17:37,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2090:   4%|██▏                                                    | 71/1824 [00:43<17:25,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8008:   4%|██▏                                                    | 72/1824 [00:43<17:29,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7773:   4%|██▏                                                    | 73/1824 [00:44<17:41,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:   4%|██▏                                                    | 74/1824 [00:45<17:34,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2246:   4%|██▎                                                    | 75/1824 [00:45<17:34,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8789:   4%|██▎                                                    | 76/1824 [00:46<17:33,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7031:   4%|██▎                                                    | 77/1824 [00:46<17:44,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:   4%|██▎                                                    | 78/1824 [00:47<17:53,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8770:   4%|██▍                                                    | 79/1824 [00:48<17:54,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.2891:   4%|██▍                                                    | 80/1824 [00:48<18:00,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:   4%|██▍                                                    | 81/1824 [00:49<17:31,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7559:   4%|██▍                                                    | 82/1824 [00:49<17:51,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:   5%|██▌                                                    | 83/1824 [00:50<17:35,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7266:   5%|██▌                                                    | 84/1824 [00:51<17:09,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:   5%|██▌                                                    | 85/1824 [00:51<17:07,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6914:   5%|██▌                                                    | 86/1824 [00:52<17:19,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9980:   5%|██▌                                                    | 87/1824 [00:52<17:32,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5820:   5%|██▋                                                    | 88/1824 [00:53<17:52,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.6875:   5%|██▋                                                    | 89/1824 [00:54<17:46,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0195:   5%|██▋                                                    | 90/1824 [00:54<17:37,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9004:   5%|██▋                                                    | 91/1824 [00:55<17:38,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7715:   5%|██▊                                                    | 92/1824 [00:56<18:36,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 3.1367:   5%|██▊                                                    | 93/1824 [00:56<18:09,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:   5%|██▊                                                    | 94/1824 [00:57<18:13,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:   5%|██▊                                                    | 95/1824 [00:57<17:55,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:   5%|██▉                                                    | 96/1824 [00:58<17:46,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8613:   5%|██▉                                                    | 97/1824 [00:59<17:15,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:   5%|██▉                                                    | 98/1824 [00:59<17:19,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:   5%|██▉                                                    | 99/1824 [01:00<17:15,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0195:   5%|██▉                                                   | 100/1824 [01:00<17:27,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0254:   6%|██▉                                                   | 101/1824 [01:01<17:29,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7617:   6%|███                                                   | 102/1824 [01:02<17:26,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6836:   6%|███                                                   | 103/1824 [01:02<17:23,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7012:   6%|███                                                   | 104/1824 [01:03<17:25,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0312:   6%|███                                                   | 105/1824 [01:04<17:45,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9902:   6%|███▏                                                  | 106/1824 [01:04<17:44,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:   6%|███▏                                                  | 107/1824 [01:05<17:38,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9180:   6%|███▏                                                  | 108/1824 [01:05<17:32,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:   6%|███▏                                                  | 109/1824 [01:06<17:26,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.2227:   6%|███▎                                                  | 110/1824 [01:07<17:24,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1777:   6%|███▎                                                  | 111/1824 [01:07<17:19,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:   6%|███▎                                                  | 112/1824 [01:08<17:23,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1055:   6%|███▎                                                  | 113/1824 [01:08<17:29,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:   6%|███▍                                                  | 114/1824 [01:09<17:25,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:   6%|███▍                                                  | 115/1824 [01:10<17:27,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:   6%|███▍                                                  | 116/1824 [01:10<17:18,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5508:   6%|███▍                                                  | 117/1824 [01:11<17:24,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.6211:   6%|███▍                                                  | 118/1824 [01:11<17:24,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:   7%|███▌                                                  | 119/1824 [01:12<17:17,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7734:   7%|███▌                                                  | 120/1824 [01:13<17:06,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:   7%|███▌                                                  | 121/1824 [01:13<17:16,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7207:   7%|███▌                                                  | 122/1824 [01:14<17:10,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9473:   7%|███▋                                                  | 123/1824 [01:15<17:38,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:   7%|███▋                                                  | 124/1824 [01:15<17:34,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8008:   7%|███▋                                                  | 125/1824 [01:16<17:45,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.3633:   7%|███▋                                                  | 126/1824 [01:16<17:39,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9688:   7%|███▊                                                  | 127/1824 [01:17<17:23,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:   7%|███▊                                                  | 128/1824 [01:18<17:41,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.1055:   7%|███▊                                                  | 129/1824 [01:18<17:20,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:   7%|███▊                                                  | 130/1824 [01:19<17:15,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7109:   7%|███▉                                                  | 131/1824 [01:19<17:16,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:   7%|███▉                                                  | 132/1824 [01:20<16:58,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:   7%|███▉                                                  | 133/1824 [01:21<17:14,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1133:   7%|███▉                                                  | 134/1824 [01:21<17:08,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.5430:   7%|███▉                                                  | 135/1824 [01:22<17:15,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:   7%|████                                                  | 136/1824 [01:23<17:19,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:   8%|████                                                  | 137/1824 [01:23<16:56,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1406:   8%|████                                                  | 138/1824 [01:24<17:05,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8711:   8%|████                                                  | 139/1824 [01:24<17:19,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.2773:   8%|████▏                                                 | 140/1824 [01:25<17:12,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:   8%|████▏                                                 | 141/1824 [01:26<17:18,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.6797:   8%|████▏                                                 | 142/1824 [01:26<17:30,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.7637:   8%|████▏                                                 | 143/1824 [01:27<17:39,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.1641:   8%|████▎                                                 | 144/1824 [01:27<17:27,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.2129:   8%|████▎                                                 | 145/1824 [01:28<17:01,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:   8%|████▎                                                 | 146/1824 [01:29<17:00,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:   8%|████▎                                                 | 147/1824 [01:29<17:10,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:   8%|████▍                                                 | 148/1824 [01:30<17:07,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:   8%|████▍                                                 | 149/1824 [01:31<17:11,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7422:   8%|████▍                                                 | 150/1824 [01:31<17:09,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:   8%|████▍                                                 | 151/1824 [01:32<17:11,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.6270:   8%|████▌                                                 | 152/1824 [01:32<17:03,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:   8%|████▌                                                 | 153/1824 [01:33<16:50,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:   8%|████▌                                                 | 154/1824 [01:34<16:58,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7852:   8%|████▌                                                 | 155/1824 [01:34<16:59,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:   9%|████▌                                                 | 156/1824 [01:35<16:51,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1523:   9%|████▋                                                 | 157/1824 [01:35<16:42,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:   9%|████▋                                                 | 158/1824 [01:36<16:38,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:   9%|████▋                                                 | 159/1824 [01:37<17:30,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.8730:   9%|████▋                                                 | 160/1824 [01:37<17:19,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:   9%|████▊                                                 | 161/1824 [01:38<17:09,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7031:   9%|████▊                                                 | 162/1824 [01:38<17:15,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:   9%|████▊                                                 | 163/1824 [01:39<17:16,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8652:   9%|████▊                                                 | 164/1824 [01:40<17:18,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8926:   9%|████▉                                                 | 165/1824 [01:40<17:11,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:   9%|████▉                                                 | 166/1824 [01:41<17:02,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9902:   9%|████▉                                                 | 167/1824 [01:42<17:16,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:   9%|████▉                                                 | 168/1824 [01:42<17:04,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:   9%|█████                                                 | 169/1824 [01:43<17:04,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:   9%|█████                                                 | 170/1824 [01:43<16:49,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8496:   9%|█████                                                 | 171/1824 [01:44<16:52,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.5938:   9%|█████                                                 | 172/1824 [01:45<16:52,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:   9%|█████                                                 | 173/1824 [01:45<16:35,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6152:  10%|█████▏                                                | 174/1824 [01:46<16:47,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9688:  10%|█████▏                                                | 175/1824 [01:46<16:42,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.3164:  10%|█████▏                                                | 176/1824 [01:47<16:35,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6641:  10%|█████▏                                                | 177/1824 [01:48<16:57,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.2148:  10%|█████▎                                                | 178/1824 [01:48<16:44,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  10%|█████▎                                                | 179/1824 [01:49<16:25,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7754:  10%|█████▎                                                | 180/1824 [01:50<16:41,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7188:  10%|█████▎                                                | 181/1824 [01:50<16:36,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5586:  10%|█████▍                                                | 182/1824 [01:51<16:31,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  10%|█████▍                                                | 183/1824 [01:51<16:39,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  10%|█████▍                                                | 184/1824 [01:52<16:38,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8496:  10%|█████▍                                                | 185/1824 [01:53<16:35,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  10%|█████▌                                                | 186/1824 [01:53<16:38,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8730:  10%|█████▌                                                | 187/1824 [01:54<16:51,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7324:  10%|█████▌                                                | 188/1824 [01:54<16:51,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8105:  10%|█████▌                                                | 189/1824 [01:55<16:59,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  10%|█████▋                                                | 190/1824 [01:56<16:43,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  10%|█████▋                                                | 191/1824 [01:56<16:39,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  11%|█████▋                                                | 192/1824 [01:57<16:30,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9746:  11%|█████▋                                                | 193/1824 [01:57<16:30,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0918:  11%|█████▋                                                | 194/1824 [01:58<16:02,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:  11%|█████▊                                                | 195/1824 [01:59<15:48,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  11%|█████▊                                                | 196/1824 [01:59<15:50,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7754:  11%|█████▊                                                | 197/1824 [02:00<16:09,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.2637:  11%|█████▊                                                | 198/1824 [02:00<15:59,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7188:  11%|█████▉                                                | 199/1824 [02:01<16:20,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  11%|█████▉                                                | 200/1824 [02:02<16:28,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  11%|█████▉                                                | 201/1824 [02:02<16:28,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:  11%|█████▉                                                | 202/1824 [02:03<16:54,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.6250:  11%|██████                                                | 203/1824 [02:03<16:45,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  11%|██████                                                | 204/1824 [02:04<16:47,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.1484:  11%|██████                                                | 205/1824 [02:05<16:44,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  11%|██████                                                | 206/1824 [02:05<16:44,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  11%|██████▏                                               | 207/1824 [02:06<16:51,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  11%|██████▏                                               | 208/1824 [02:07<16:27,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  11%|██████▏                                               | 209/1824 [02:07<16:29,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  12%|██████▏                                               | 210/1824 [02:08<16:24,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9746:  12%|██████▏                                               | 211/1824 [02:08<16:14,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1914:  12%|██████▎                                               | 212/1824 [02:09<16:34,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1445:  12%|██████▎                                               | 213/1824 [02:10<16:37,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:  12%|██████▎                                               | 214/1824 [02:10<16:19,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.5879:  12%|██████▎                                               | 215/1824 [02:11<16:16,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:  12%|██████▍                                               | 216/1824 [02:11<16:18,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.2188:  12%|██████▍                                               | 217/1824 [02:12<16:11,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:  12%|██████▍                                               | 218/1824 [02:13<16:03,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2285:  12%|██████▍                                               | 219/1824 [02:13<16:01,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1250:  12%|██████▌                                               | 220/1824 [02:14<16:26,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  12%|██████▌                                               | 221/1824 [02:14<16:19,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7930:  12%|██████▌                                               | 222/1824 [02:15<16:35,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7520:  12%|██████▌                                               | 223/1824 [02:16<16:29,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  12%|██████▋                                               | 224/1824 [02:16<16:14,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  12%|██████▋                                               | 225/1824 [02:17<16:00,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9629:  12%|██████▋                                               | 226/1824 [02:17<15:30,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  12%|██████▋                                               | 227/1824 [02:18<15:56,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  12%|██████▊                                               | 228/1824 [02:19<15:49,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  13%|██████▊                                               | 229/1824 [02:19<15:54,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.3047:  13%|██████▊                                               | 230/1824 [02:20<15:55,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2402:  13%|██████▊                                               | 231/1824 [02:20<15:53,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  13%|██████▊                                               | 232/1824 [02:21<15:49,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9863:  13%|██████▉                                               | 233/1824 [02:22<15:37,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  13%|██████▉                                               | 234/1824 [02:22<15:37,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  13%|██████▉                                               | 235/1824 [02:23<15:55,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  13%|██████▉                                               | 236/1824 [02:23<15:51,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2363:  13%|███████                                               | 237/1824 [02:24<15:56,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7930:  13%|███████                                               | 238/1824 [02:25<16:00,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:  13%|███████                                               | 239/1824 [02:25<16:07,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  13%|███████                                               | 240/1824 [02:26<16:25,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.6992:  13%|███████▏                                              | 241/1824 [02:27<16:35,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  13%|███████▏                                              | 242/1824 [02:27<16:27,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.0410:  13%|███████▏                                              | 243/1824 [02:28<16:36,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  13%|███████▏                                              | 244/1824 [02:28<16:32,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.8613:  13%|███████▎                                              | 245/1824 [02:29<16:41,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.0781:  13%|███████▎                                              | 246/1824 [02:30<16:16,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0684:  14%|███████▎                                              | 247/1824 [02:30<16:13,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.6758:  14%|███████▎                                              | 248/1824 [02:31<16:11,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8652:  14%|███████▎                                              | 249/1824 [02:32<16:03,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7129:  14%|███████▍                                              | 250/1824 [02:32<15:50,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  14%|███████▍                                              | 251/1824 [02:33<15:56,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  14%|███████▍                                              | 252/1824 [02:33<15:39,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  14%|███████▍                                              | 253/1824 [02:34<15:32,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7344:  14%|███████▌                                              | 254/1824 [02:34<15:21,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.5020:  14%|███████▌                                              | 255/1824 [02:35<15:33,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  14%|███████▌                                              | 256/1824 [02:36<15:55,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  14%|███████▌                                              | 257/1824 [02:36<15:42,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6602:  14%|███████▋                                              | 258/1824 [02:37<15:34,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  14%|███████▋                                              | 259/1824 [02:37<15:20,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0488:  14%|███████▋                                              | 260/1824 [02:38<15:42,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  14%|███████▋                                              | 261/1824 [02:39<15:35,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8770:  14%|███████▊                                              | 262/1824 [02:39<15:35,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0664:  14%|███████▊                                              | 263/1824 [02:40<15:26,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  14%|███████▊                                              | 264/1824 [02:40<15:30,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.2227:  15%|███████▊                                              | 265/1824 [02:41<14:59,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:  15%|███████▉                                              | 266/1824 [02:42<15:12,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0664:  15%|███████▉                                              | 267/1824 [02:42<15:21,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  15%|███████▉                                              | 268/1824 [02:43<15:22,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1250:  15%|███████▉                                              | 269/1824 [02:43<15:14,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8223:  15%|███████▉                                              | 270/1824 [02:44<15:11,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  15%|████████                                              | 271/1824 [02:45<15:24,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  15%|████████                                              | 272/1824 [02:45<15:38,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  15%|████████                                              | 273/1824 [02:46<15:36,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  15%|████████                                              | 274/1824 [02:46<15:36,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7227:  15%|████████▏                                             | 275/1824 [02:47<15:44,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.3379:  15%|████████▏                                             | 276/1824 [02:48<15:31,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  15%|████████▏                                             | 277/1824 [02:48<15:31,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  15%|████████▏                                             | 278/1824 [02:49<15:46,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:  15%|████████▎                                             | 279/1824 [02:49<15:25,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1562:  15%|████████▎                                             | 280/1824 [02:50<15:17,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1797:  15%|████████▎                                             | 281/1824 [02:51<15:24,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2051:  15%|████████▎                                             | 282/1824 [02:51<15:13,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0332:  16%|████████▍                                             | 283/1824 [02:52<15:24,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1055:  16%|████████▍                                             | 284/1824 [02:52<15:28,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6445:  16%|████████▍                                             | 285/1824 [02:53<15:23,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6602:  16%|████████▍                                             | 286/1824 [02:54<15:40,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  16%|████████▍                                             | 287/1824 [02:54<16:04,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.2598:  16%|████████▌                                             | 288/1824 [02:55<15:59,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  16%|████████▌                                             | 289/1824 [02:56<16:25,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  16%|████████▌                                             | 290/1824 [02:56<16:10,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  16%|████████▌                                             | 291/1824 [02:57<16:03,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  16%|████████▋                                             | 292/1824 [02:57<15:50,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9395:  16%|████████▋                                             | 293/1824 [02:58<15:34,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  16%|████████▋                                             | 294/1824 [02:59<15:54,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  16%|████████▋                                             | 295/1824 [02:59<15:55,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  16%|████████▊                                             | 296/1824 [03:00<15:49,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0664:  16%|████████▊                                             | 297/1824 [03:01<15:30,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  16%|████████▊                                             | 298/1824 [03:01<15:20,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0488:  16%|████████▊                                             | 299/1824 [03:02<15:10,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  16%|████████▉                                             | 300/1824 [03:02<14:54,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1055:  17%|████████▉                                             | 301/1824 [03:03<15:09,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8418:  17%|████████▉                                             | 302/1824 [03:03<14:46,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  17%|████████▉                                             | 303/1824 [03:04<15:05,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9180:  17%|█████████                                             | 304/1824 [03:05<14:55,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0195:  17%|█████████                                             | 305/1824 [03:05<15:08,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8848:  17%|█████████                                             | 306/1824 [03:06<15:23,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6816:  17%|█████████                                             | 307/1824 [03:06<15:10,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  17%|█████████                                             | 308/1824 [03:07<14:44,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7734:  17%|█████████▏                                            | 309/1824 [03:08<14:53,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  17%|█████████▏                                            | 310/1824 [03:08<15:12,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9629:  17%|█████████▏                                            | 311/1824 [03:09<15:19,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.2031:  17%|█████████▏                                            | 312/1824 [03:09<15:07,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:  17%|█████████▎                                            | 313/1824 [03:10<15:08,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0371:  17%|█████████▎                                            | 314/1824 [03:11<15:18,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  17%|█████████▎                                            | 315/1824 [03:11<15:25,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9746:  17%|█████████▎                                            | 316/1824 [03:12<15:26,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.4922:  17%|█████████▍                                            | 317/1824 [03:13<15:35,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8672:  17%|█████████▍                                            | 318/1824 [03:13<15:20,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1094:  17%|█████████▍                                            | 319/1824 [03:14<15:00,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  18%|█████████▍                                            | 320/1824 [03:14<14:57,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  18%|█████████▌                                            | 321/1824 [03:15<15:02,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  18%|█████████▌                                            | 322/1824 [03:16<15:06,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2461:  18%|█████████▌                                            | 323/1824 [03:16<15:22,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  18%|█████████▌                                            | 324/1824 [03:17<15:03,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  18%|█████████▌                                            | 325/1824 [03:17<15:02,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8457:  18%|█████████▋                                            | 326/1824 [03:18<15:20,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  18%|█████████▋                                            | 327/1824 [03:19<15:25,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0586:  18%|█████████▋                                            | 328/1824 [03:19<15:24,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  18%|█████████▋                                            | 329/1824 [03:20<15:30,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  18%|█████████▊                                            | 330/1824 [03:20<15:19,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  18%|█████████▊                                            | 331/1824 [03:21<15:07,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  18%|█████████▊                                            | 332/1824 [03:22<14:55,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  18%|█████████▊                                            | 333/1824 [03:22<14:57,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1426:  18%|█████████▉                                            | 334/1824 [03:23<14:30,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0410:  18%|█████████▉                                            | 335/1824 [03:23<14:34,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8691:  18%|█████████▉                                            | 336/1824 [03:24<14:37,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  18%|█████████▉                                            | 337/1824 [03:25<14:56,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1875:  19%|██████████                                            | 338/1824 [03:25<14:51,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  19%|██████████                                            | 339/1824 [03:26<15:14,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  19%|██████████                                            | 340/1824 [03:26<15:18,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0254:  19%|██████████                                            | 341/1824 [03:27<15:04,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9922:  19%|██████████▏                                           | 342/1824 [03:28<15:19,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9434:  19%|██████████▏                                           | 343/1824 [03:28<15:43,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 3.0430:  19%|██████████▏                                           | 344/1824 [03:29<15:38,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.2656:  19%|██████████▏                                           | 345/1824 [03:30<15:25,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  19%|██████████▏                                           | 346/1824 [03:30<14:59,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  19%|██████████▎                                           | 347/1824 [03:31<14:45,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  19%|██████████▎                                           | 348/1824 [03:31<14:38,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  19%|██████████▎                                           | 349/1824 [03:32<14:31,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  19%|██████████▎                                           | 350/1824 [03:33<14:43,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7676:  19%|██████████▍                                           | 351/1824 [03:33<14:51,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  19%|██████████▍                                           | 352/1824 [03:34<15:03,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8008:  19%|██████████▍                                           | 353/1824 [03:34<15:17,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  19%|██████████▍                                           | 354/1824 [03:35<15:15,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  19%|██████████▌                                           | 355/1824 [03:36<14:59,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1719:  20%|██████████▌                                           | 356/1824 [03:36<14:53,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9277:  20%|██████████▌                                           | 357/1824 [03:37<14:51,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7793:  20%|██████████▌                                           | 358/1824 [03:37<14:46,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5801:  20%|██████████▋                                           | 359/1824 [03:38<14:46,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6328:  20%|██████████▋                                           | 360/1824 [03:39<14:55,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.2812:  20%|██████████▋                                           | 361/1824 [03:39<15:04,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7773:  20%|██████████▋                                           | 362/1824 [03:40<15:02,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  20%|██████████▋                                           | 363/1824 [03:41<15:06,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  20%|██████████▊                                           | 364/1824 [03:41<14:56,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  20%|██████████▊                                           | 365/1824 [03:42<15:20,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.2852:  20%|██████████▊                                           | 366/1824 [03:42<14:58,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  20%|██████████▊                                           | 367/1824 [03:43<14:46,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  20%|██████████▉                                           | 368/1824 [03:44<14:52,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  20%|██████████▉                                           | 369/1824 [03:44<14:58,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7695:  20%|██████████▉                                           | 370/1824 [03:45<15:07,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  20%|██████████▉                                           | 371/1824 [03:46<15:05,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8730:  20%|███████████                                           | 372/1824 [03:46<14:59,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  20%|███████████                                           | 373/1824 [03:47<14:53,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7090:  21%|███████████                                           | 374/1824 [03:47<14:47,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9941:  21%|███████████                                           | 375/1824 [03:48<14:40,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9629:  21%|███████████▏                                          | 376/1824 [03:49<14:31,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1250:  21%|███████████▏                                          | 377/1824 [03:49<14:27,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6055:  21%|███████████▏                                          | 378/1824 [03:50<14:37,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  21%|███████████▏                                          | 379/1824 [03:50<14:35,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0508:  21%|███████████▎                                          | 380/1824 [03:51<14:25,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  21%|███████████▎                                          | 381/1824 [03:52<14:17,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  21%|███████████▎                                          | 382/1824 [03:52<13:52,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  21%|███████████▎                                          | 383/1824 [03:53<14:03,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6992:  21%|███████████▎                                          | 384/1824 [03:53<14:14,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1133:  21%|███████████▍                                          | 385/1824 [03:54<14:17,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1719:  21%|███████████▍                                          | 386/1824 [03:55<14:38,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  21%|███████████▍                                          | 387/1824 [03:55<14:29,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.2559:  21%|███████████▍                                          | 388/1824 [03:56<14:23,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  21%|███████████▌                                          | 389/1824 [03:56<14:34,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  21%|███████████▌                                          | 390/1824 [03:57<14:22,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  21%|███████████▌                                          | 391/1824 [03:57<14:12,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7441:  21%|███████████▌                                          | 392/1824 [03:58<14:24,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0332:  22%|███████████▋                                          | 393/1824 [03:59<14:30,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.2109:  22%|███████████▋                                          | 394/1824 [03:59<14:32,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:  22%|███████████▋                                          | 395/1824 [04:00<14:28,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  22%|███████████▋                                          | 396/1824 [04:01<14:25,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  22%|███████████▊                                          | 397/1824 [04:01<14:35,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:  22%|███████████▊                                          | 398/1824 [04:02<14:32,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.6328:  22%|███████████▊                                          | 399/1824 [04:02<14:00,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1484:  22%|███████████▊                                          | 400/1824 [04:03<13:54,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1328:  22%|███████████▊                                          | 401/1824 [04:03<13:53,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0293:  22%|███████████▉                                          | 402/1824 [04:04<14:00,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  22%|███████████▉                                          | 403/1824 [04:05<14:12,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  22%|███████████▉                                          | 404/1824 [04:05<14:15,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:  22%|███████████▉                                          | 405/1824 [04:06<14:15,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  22%|████████████                                          | 406/1824 [04:06<14:04,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  22%|████████████                                          | 407/1824 [04:07<14:20,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  22%|████████████                                          | 408/1824 [04:08<14:26,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  22%|████████████                                          | 409/1824 [04:08<14:14,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  22%|████████████▏                                         | 410/1824 [04:09<14:10,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8125:  23%|████████████▏                                         | 411/1824 [04:10<14:10,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9277:  23%|████████████▏                                         | 412/1824 [04:10<13:38,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.4785:  23%|████████████▏                                         | 413/1824 [04:11<13:44,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0410:  23%|████████████▎                                         | 414/1824 [04:11<13:55,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  23%|████████████▎                                         | 415/1824 [04:12<13:58,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  23%|████████████▎                                         | 416/1824 [04:13<14:14,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  23%|████████████▎                                         | 417/1824 [04:13<14:09,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6328:  23%|████████████▍                                         | 418/1824 [04:14<14:01,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  23%|████████████▍                                         | 419/1824 [04:14<14:02,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8711:  23%|████████████▍                                         | 420/1824 [04:15<14:10,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1621:  23%|████████████▍                                         | 421/1824 [04:16<14:12,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1836:  23%|████████████▍                                         | 422/1824 [04:16<14:04,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1758:  23%|████████████▌                                         | 423/1824 [04:17<14:28,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  23%|████████████▌                                         | 424/1824 [04:17<14:33,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  23%|████████████▌                                         | 425/1824 [04:18<14:36,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  23%|████████████▌                                         | 426/1824 [04:19<14:23,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8457:  23%|████████████▋                                         | 427/1824 [04:19<14:28,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.6602:  23%|████████████▋                                         | 428/1824 [04:20<14:32,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  24%|████████████▋                                         | 429/1824 [04:21<14:22,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  24%|████████████▋                                         | 430/1824 [04:21<14:11,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8965:  24%|████████████▊                                         | 431/1824 [04:22<14:10,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  24%|████████████▊                                         | 432/1824 [04:22<14:06,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8008:  24%|████████████▊                                         | 433/1824 [04:23<14:16,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0762:  24%|████████████▊                                         | 434/1824 [04:24<14:03,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7148:  24%|████████████▉                                         | 435/1824 [04:24<14:06,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  24%|████████████▉                                         | 436/1824 [04:25<14:00,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0195:  24%|████████████▉                                         | 437/1824 [04:25<14:01,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  24%|████████████▉                                         | 438/1824 [04:26<14:17,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8613:  24%|████████████▉                                         | 439/1824 [04:27<14:29,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  24%|█████████████                                         | 440/1824 [04:27<14:28,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  24%|█████████████                                         | 441/1824 [04:28<14:28,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.2305:  24%|█████████████                                         | 442/1824 [04:29<14:14,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  24%|█████████████                                         | 443/1824 [04:29<14:01,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9160:  24%|█████████████▏                                        | 444/1824 [04:30<14:14,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.6133:  24%|█████████████▏                                        | 445/1824 [04:30<14:18,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0430:  24%|█████████████▏                                        | 446/1824 [04:31<14:12,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  25%|█████████████▏                                        | 447/1824 [04:32<14:03,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7871:  25%|█████████████▎                                        | 448/1824 [04:32<14:01,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:  25%|█████████████▎                                        | 449/1824 [04:33<13:58,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.5840:  25%|█████████████▎                                        | 450/1824 [04:33<13:57,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.4180:  25%|█████████████▎                                        | 451/1824 [04:34<14:05,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  25%|█████████████▍                                        | 452/1824 [04:35<13:59,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  25%|█████████████▍                                        | 453/1824 [04:35<13:49,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  25%|█████████████▍                                        | 454/1824 [04:36<13:38,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  25%|█████████████▍                                        | 455/1824 [04:36<13:45,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:  25%|█████████████▌                                        | 456/1824 [04:37<13:47,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1719:  25%|█████████████▌                                        | 457/1824 [04:38<13:36,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1836:  25%|█████████████▌                                        | 458/1824 [04:38<13:50,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  25%|█████████████▌                                        | 459/1824 [04:39<13:22,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  25%|█████████████▌                                        | 460/1824 [04:39<13:17,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9004:  25%|█████████████▋                                        | 461/1824 [04:40<13:33,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.2266:  25%|█████████████▋                                        | 462/1824 [04:41<13:35,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2422:  25%|█████████████▋                                        | 463/1824 [04:41<13:33,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  25%|█████████████▋                                        | 464/1824 [04:42<13:32,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1758:  25%|█████████████▊                                        | 465/1824 [04:42<13:37,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1758:  26%|█████████████▊                                        | 466/1824 [04:43<13:24,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.2617:  26%|█████████████▊                                        | 467/1824 [04:44<13:32,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9668:  26%|█████████████▊                                        | 468/1824 [04:44<13:34,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6406:  26%|█████████████▉                                        | 469/1824 [04:45<13:39,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1484:  26%|█████████████▉                                        | 470/1824 [04:45<13:33,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  26%|█████████████▉                                        | 471/1824 [04:46<13:42,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  26%|█████████████▉                                        | 472/1824 [04:47<13:32,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6953:  26%|██████████████                                        | 473/1824 [04:47<13:15,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1562:  26%|██████████████                                        | 474/1824 [04:48<13:08,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:  26%|██████████████                                        | 475/1824 [04:48<13:10,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  26%|██████████████                                        | 476/1824 [04:49<13:20,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  26%|██████████████                                        | 477/1824 [04:50<13:21,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7402:  26%|██████████████▏                                       | 478/1824 [04:50<13:23,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8711:  26%|██████████████▏                                       | 479/1824 [04:51<13:30,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  26%|██████████████▏                                       | 480/1824 [04:51<13:30,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9297:  26%|██████████████▏                                       | 481/1824 [04:52<13:47,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.5547:  26%|██████████████▎                                       | 482/1824 [04:53<13:59,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  26%|██████████████▎                                       | 483/1824 [04:53<13:44,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:  27%|██████████████▎                                       | 484/1824 [04:54<13:46,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.2148:  27%|██████████████▎                                       | 485/1824 [04:54<13:47,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  27%|██████████████▍                                       | 486/1824 [04:55<14:05,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:  27%|██████████████▍                                       | 487/1824 [04:56<14:16,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  27%|██████████████▍                                       | 488/1824 [04:56<13:47,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7109:  27%|██████████████▍                                       | 489/1824 [04:57<13:35,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.4375:  27%|██████████████▌                                       | 490/1824 [04:58<13:26,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  27%|██████████████▌                                       | 491/1824 [04:59<16:13,  1.37it/s]

cuda:0


Epoch 1/4, Loss: 3.2129:  27%|██████████████▌                                       | 492/1824 [05:00<18:57,  1.17it/s]

cuda:0


Epoch 1/4, Loss: 2.7617:  27%|██████████████▌                                       | 493/1824 [05:00<17:53,  1.24it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  27%|██████████████▌                                       | 494/1824 [05:01<17:00,  1.30it/s]

cuda:0


Epoch 1/4, Loss: 2.4531:  27%|██████████████▋                                       | 495/1824 [05:02<15:49,  1.40it/s]

cuda:0


Epoch 1/4, Loss: 2.8809:  27%|██████████████▋                                       | 496/1824 [05:02<15:11,  1.46it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:  27%|██████████████▋                                       | 497/1824 [05:03<14:36,  1.51it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  27%|██████████████▋                                       | 498/1824 [05:03<14:00,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:  27%|██████████████▊                                       | 499/1824 [05:04<13:44,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0234:  27%|██████████████▊                                       | 500/1824 [05:05<13:36,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7734:  27%|██████████████▊                                       | 501/1824 [05:05<13:18,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1250:  28%|██████████████▊                                       | 502/1824 [05:06<13:19,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9297:  28%|██████████████▉                                       | 503/1824 [05:06<13:00,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0195:  28%|██████████████▉                                       | 504/1824 [05:07<13:02,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8730:  28%|██████████████▉                                       | 505/1824 [05:08<13:18,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9180:  28%|██████████████▉                                       | 506/1824 [05:08<13:15,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0254:  28%|███████████████                                       | 507/1824 [05:09<13:10,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  28%|███████████████                                       | 508/1824 [05:09<13:31,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8145:  28%|███████████████                                       | 509/1824 [05:10<13:19,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  28%|███████████████                                       | 510/1824 [05:11<13:19,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0977:  28%|███████████████▏                                      | 511/1824 [05:11<13:16,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  28%|███████████████▏                                      | 512/1824 [05:12<13:09,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.4961:  28%|███████████████▏                                      | 513/1824 [05:12<13:10,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  28%|███████████████▏                                      | 514/1824 [05:13<13:10,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9277:  28%|███████████████▏                                      | 515/1824 [05:14<12:56,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  28%|███████████████▎                                      | 516/1824 [05:14<12:27,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  28%|███████████████▎                                      | 517/1824 [05:15<12:41,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0840:  28%|███████████████▎                                      | 518/1824 [05:15<12:32,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  28%|███████████████▎                                      | 519/1824 [05:16<13:00,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  29%|███████████████▍                                      | 520/1824 [05:17<12:54,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6797:  29%|███████████████▍                                      | 521/1824 [05:17<12:51,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8594:  29%|███████████████▍                                      | 522/1824 [05:18<13:02,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1777:  29%|███████████████▍                                      | 523/1824 [05:18<13:11,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  29%|███████████████▌                                      | 524/1824 [05:19<12:59,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  29%|███████████████▌                                      | 525/1824 [05:20<12:35,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  29%|███████████████▌                                      | 526/1824 [05:20<12:25,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  29%|███████████████▌                                      | 527/1824 [05:21<12:33,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0410:  29%|███████████████▋                                      | 528/1824 [05:21<12:31,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  29%|███████████████▋                                      | 529/1824 [05:22<12:43,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.5977:  29%|███████████████▋                                      | 530/1824 [05:23<12:57,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  29%|███████████████▋                                      | 531/1824 [05:23<12:53,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  29%|███████████████▊                                      | 532/1824 [05:24<13:01,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7266:  29%|███████████████▊                                      | 533/1824 [05:24<13:10,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0664:  29%|███████████████▊                                      | 534/1824 [05:25<13:15,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.6270:  29%|███████████████▊                                      | 535/1824 [05:26<13:19,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.1289:  29%|███████████████▊                                      | 536/1824 [05:26<13:22,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.1133:  29%|███████████████▉                                      | 537/1824 [05:27<13:16,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7188:  29%|███████████████▉                                      | 538/1824 [05:27<13:09,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9707:  30%|███████████████▉                                      | 539/1824 [05:28<13:24,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  30%|███████████████▉                                      | 540/1824 [05:29<13:22,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.0762:  30%|████████████████                                      | 541/1824 [05:29<13:19,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:  30%|████████████████                                      | 542/1824 [05:30<13:07,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.2383:  30%|████████████████                                      | 543/1824 [05:31<12:52,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.5234:  30%|████████████████                                      | 544/1824 [05:31<12:48,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  30%|████████████████▏                                     | 545/1824 [05:32<12:44,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  30%|████████████████▏                                     | 546/1824 [05:32<12:46,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0234:  30%|████████████████▏                                     | 547/1824 [05:33<12:44,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7480:  30%|████████████████▏                                     | 548/1824 [05:33<12:39,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  30%|████████████████▎                                     | 549/1824 [05:34<12:26,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  30%|████████████████▎                                     | 550/1824 [05:35<12:35,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  30%|████████████████▎                                     | 551/1824 [05:35<12:32,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  30%|████████████████▎                                     | 552/1824 [05:36<12:44,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6211:  30%|████████████████▎                                     | 553/1824 [05:36<12:35,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  30%|████████████████▍                                     | 554/1824 [05:37<12:38,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  30%|████████████████▍                                     | 555/1824 [05:38<12:39,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9180:  30%|████████████████▍                                     | 556/1824 [05:38<12:51,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6328:  31%|████████████████▍                                     | 557/1824 [05:39<12:46,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6484:  31%|████████████████▌                                     | 558/1824 [05:39<12:47,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0586:  31%|████████████████▌                                     | 559/1824 [05:40<12:36,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  31%|████████████████▌                                     | 560/1824 [05:41<12:26,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:  31%|████████████████▌                                     | 561/1824 [05:41<12:13,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  31%|████████████████▋                                     | 562/1824 [05:42<12:10,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8965:  31%|████████████████▋                                     | 563/1824 [05:42<12:17,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7344:  31%|████████████████▋                                     | 564/1824 [05:43<12:45,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  31%|████████████████▋                                     | 565/1824 [05:44<12:46,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  31%|████████████████▊                                     | 566/1824 [05:44<12:29,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7773:  31%|████████████████▊                                     | 567/1824 [05:45<12:29,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1758:  31%|████████████████▊                                     | 568/1824 [05:45<12:24,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.2031:  31%|████████████████▊                                     | 569/1824 [05:46<11:58,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  31%|████████████████▉                                     | 570/1824 [05:47<12:08,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8027:  31%|████████████████▉                                     | 571/1824 [05:47<12:06,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.0137:  31%|████████████████▉                                     | 572/1824 [05:48<12:24,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0508:  31%|████████████████▉                                     | 573/1824 [05:48<12:13,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  31%|████████████████▉                                     | 574/1824 [05:49<12:09,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  32%|█████████████████                                     | 575/1824 [05:49<11:57,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  32%|█████████████████                                     | 576/1824 [05:50<11:52,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  32%|█████████████████                                     | 577/1824 [05:51<12:08,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:  32%|█████████████████                                     | 578/1824 [05:51<12:16,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  32%|█████████████████▏                                    | 579/1824 [05:52<12:18,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.5898:  32%|█████████████████▏                                    | 580/1824 [05:52<12:42,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1270:  32%|█████████████████▏                                    | 581/1824 [05:53<12:40,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  32%|█████████████████▏                                    | 582/1824 [05:54<12:47,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  32%|█████████████████▎                                    | 583/1824 [05:54<12:40,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:  32%|█████████████████▎                                    | 584/1824 [05:55<12:34,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  32%|█████████████████▎                                    | 585/1824 [05:56<12:35,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  32%|█████████████████▎                                    | 586/1824 [05:56<12:39,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  32%|█████████████████▍                                    | 587/1824 [05:57<12:33,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6289:  32%|█████████████████▍                                    | 588/1824 [05:57<12:21,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  32%|█████████████████▍                                    | 589/1824 [05:58<12:10,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  32%|█████████████████▍                                    | 590/1824 [05:58<12:09,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1152:  32%|█████████████████▍                                    | 591/1824 [05:59<12:08,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  32%|█████████████████▌                                    | 592/1824 [06:00<12:37,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  33%|█████████████████▌                                    | 593/1824 [06:00<12:44,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7715:  33%|█████████████████▌                                    | 594/1824 [06:01<12:37,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  33%|█████████████████▌                                    | 595/1824 [06:02<12:45,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8262:  33%|█████████████████▋                                    | 596/1824 [06:02<12:53,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.2324:  33%|█████████████████▋                                    | 597/1824 [06:03<12:46,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.2070:  33%|█████████████████▋                                    | 598/1824 [06:03<12:37,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1270:  33%|█████████████████▋                                    | 599/1824 [06:04<12:41,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  33%|█████████████████▊                                    | 600/1824 [06:05<12:25,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6758:  33%|█████████████████▊                                    | 601/1824 [06:05<12:02,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0527:  33%|█████████████████▊                                    | 602/1824 [06:06<11:47,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.6777:  33%|█████████████████▊                                    | 603/1824 [06:06<11:53,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6621:  33%|█████████████████▉                                    | 604/1824 [06:07<11:58,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  33%|█████████████████▉                                    | 605/1824 [06:08<11:56,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.3398:  33%|█████████████████▉                                    | 606/1824 [06:08<11:42,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.7148:  33%|█████████████████▉                                    | 607/1824 [06:09<11:49,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9004:  33%|██████████████████                                    | 608/1824 [06:09<11:38,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7773:  33%|██████████████████                                    | 609/1824 [06:10<11:46,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  33%|██████████████████                                    | 610/1824 [06:10<11:45,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7734:  33%|██████████████████                                    | 611/1824 [06:11<11:55,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9277:  34%|██████████████████                                    | 612/1824 [06:12<11:50,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  34%|██████████████████▏                                   | 613/1824 [06:12<11:41,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.5898:  34%|██████████████████▏                                   | 614/1824 [06:13<11:32,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.2383:  34%|██████████████████▏                                   | 615/1824 [06:13<11:43,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0195:  34%|██████████████████▏                                   | 616/1824 [06:14<11:54,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9590:  34%|██████████████████▎                                   | 617/1824 [06:15<11:59,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8691:  34%|██████████████████▎                                   | 618/1824 [06:15<12:11,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9473:  34%|██████████████████▎                                   | 619/1824 [06:16<12:09,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0762:  34%|██████████████████▎                                   | 620/1824 [06:16<12:01,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  34%|██████████████████▍                                   | 621/1824 [06:17<11:55,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1953:  34%|██████████████████▍                                   | 622/1824 [06:18<11:57,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0488:  34%|██████████████████▍                                   | 623/1824 [06:18<12:01,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  34%|██████████████████▍                                   | 624/1824 [06:19<12:16,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.2031:  34%|██████████████████▌                                   | 625/1824 [06:19<12:11,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  34%|██████████████████▌                                   | 626/1824 [06:20<11:54,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  34%|██████████████████▌                                   | 627/1824 [06:21<11:35,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  34%|██████████████████▌                                   | 628/1824 [06:21<11:34,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  34%|██████████████████▌                                   | 629/1824 [06:22<11:38,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:  35%|██████████████████▋                                   | 630/1824 [06:22<11:43,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  35%|██████████████████▋                                   | 631/1824 [06:23<11:41,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9844:  35%|██████████████████▋                                   | 632/1824 [06:23<11:34,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8262:  35%|██████████████████▋                                   | 633/1824 [06:24<11:16,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  35%|██████████████████▊                                   | 634/1824 [06:25<11:34,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  35%|██████████████████▊                                   | 635/1824 [06:25<11:48,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1641:  35%|██████████████████▊                                   | 636/1824 [06:26<12:03,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8887:  35%|██████████████████▊                                   | 637/1824 [06:26<11:48,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6152:  35%|██████████████████▉                                   | 638/1824 [06:27<12:02,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8730:  35%|██████████████████▉                                   | 639/1824 [06:28<12:17,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  35%|██████████████████▉                                   | 640/1824 [06:28<12:23,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.3555:  35%|██████████████████▉                                   | 641/1824 [06:29<12:07,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  35%|███████████████████                                   | 642/1824 [06:30<12:26,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.9668:  35%|███████████████████                                   | 643/1824 [06:30<12:18,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9688:  35%|███████████████████                                   | 644/1824 [06:31<12:19,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.0234:  35%|███████████████████                                   | 645/1824 [06:31<11:58,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9922:  35%|███████████████████▏                                  | 646/1824 [06:32<11:37,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  35%|███████████████████▏                                  | 647/1824 [06:33<11:31,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.2031:  36%|███████████████████▏                                  | 648/1824 [06:33<11:36,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  36%|███████████████████▏                                  | 649/1824 [06:34<11:32,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  36%|███████████████████▏                                  | 650/1824 [06:34<11:39,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  36%|███████████████████▎                                  | 651/1824 [06:35<11:37,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  36%|███████████████████▎                                  | 652/1824 [06:36<11:44,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2539:  36%|███████████████████▎                                  | 653/1824 [06:36<11:42,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  36%|███████████████████▎                                  | 654/1824 [06:37<11:47,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  36%|███████████████████▍                                  | 655/1824 [06:37<11:58,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0371:  36%|███████████████████▍                                  | 656/1824 [06:38<12:08,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  36%|███████████████████▍                                  | 657/1824 [06:39<12:10,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  36%|███████████████████▍                                  | 658/1824 [06:39<11:58,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  36%|███████████████████▌                                  | 659/1824 [06:40<12:20,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  36%|███████████████████▌                                  | 660/1824 [06:41<13:16,  1.46it/s]

cuda:0


Epoch 1/4, Loss: 3.1641:  36%|███████████████████▌                                  | 661/1824 [06:41<12:59,  1.49it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  36%|███████████████████▌                                  | 662/1824 [06:42<12:37,  1.53it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  36%|███████████████████▋                                  | 663/1824 [06:43<12:11,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.8262:  36%|███████████████████▋                                  | 664/1824 [06:43<11:51,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  36%|███████████████████▋                                  | 665/1824 [06:44<11:42,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0059:  37%|███████████████████▋                                  | 666/1824 [06:44<11:40,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.2734:  37%|███████████████████▋                                  | 667/1824 [06:45<11:26,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1289:  37%|███████████████████▊                                  | 668/1824 [06:46<11:40,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.3203:  37%|███████████████████▊                                  | 669/1824 [06:46<11:16,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  37%|███████████████████▊                                  | 670/1824 [06:47<11:19,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  37%|███████████████████▊                                  | 671/1824 [06:47<11:14,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8789:  37%|███████████████████▉                                  | 672/1824 [06:48<11:20,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.2539:  37%|███████████████████▉                                  | 673/1824 [06:48<11:14,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9004:  37%|███████████████████▉                                  | 674/1824 [06:49<10:53,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:  37%|███████████████████▉                                  | 675/1824 [06:50<11:08,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  37%|████████████████████                                  | 676/1824 [06:50<11:09,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7852:  37%|████████████████████                                  | 677/1824 [06:51<11:13,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8594:  37%|████████████████████                                  | 678/1824 [06:51<11:24,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  37%|████████████████████                                  | 679/1824 [06:52<11:25,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6582:  37%|████████████████████▏                                 | 680/1824 [06:53<11:27,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  37%|████████████████████▏                                 | 681/1824 [06:53<11:16,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7051:  37%|████████████████████▏                                 | 682/1824 [06:54<11:36,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7090:  37%|████████████████████▏                                 | 683/1824 [06:54<11:25,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0488:  38%|████████████████████▎                                 | 684/1824 [06:55<11:25,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  38%|████████████████████▎                                 | 685/1824 [06:56<11:14,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6523:  38%|████████████████████▎                                 | 686/1824 [06:56<11:23,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  38%|████████████████████▎                                 | 687/1824 [06:57<11:21,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0879:  38%|████████████████████▎                                 | 688/1824 [06:57<11:25,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  38%|████████████████████▍                                 | 689/1824 [06:58<11:20,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7676:  38%|████████████████████▍                                 | 690/1824 [06:59<11:14,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6602:  38%|████████████████████▍                                 | 691/1824 [06:59<11:19,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  38%|████████████████████▍                                 | 692/1824 [07:00<11:18,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  38%|████████████████████▌                                 | 693/1824 [07:00<11:15,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9902:  38%|████████████████████▌                                 | 694/1824 [07:01<11:26,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0664:  38%|████████████████████▌                                 | 695/1824 [07:02<11:20,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8125:  38%|████████████████████▌                                 | 696/1824 [07:02<11:30,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9102:  38%|████████████████████▋                                 | 697/1824 [07:03<11:25,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1152:  38%|████████████████████▋                                 | 698/1824 [07:03<11:17,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2305:  38%|████████████████████▋                                 | 699/1824 [07:04<11:05,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7109:  38%|████████████████████▋                                 | 700/1824 [07:05<11:12,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.5293:  38%|████████████████████▊                                 | 701/1824 [07:05<11:15,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:  38%|████████████████████▊                                 | 702/1824 [07:06<11:18,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  39%|████████████████████▊                                 | 703/1824 [07:06<11:20,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  39%|████████████████████▊                                 | 704/1824 [07:07<11:34,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.2246:  39%|████████████████████▊                                 | 705/1824 [07:08<11:24,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0234:  39%|████████████████████▉                                 | 706/1824 [07:08<11:21,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:  39%|████████████████████▉                                 | 707/1824 [07:09<11:00,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  39%|████████████████████▉                                 | 708/1824 [07:09<11:04,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  39%|████████████████████▉                                 | 709/1824 [07:10<11:02,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0137:  39%|█████████████████████                                 | 710/1824 [07:11<10:57,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:  39%|█████████████████████                                 | 711/1824 [07:11<11:07,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  39%|█████████████████████                                 | 712/1824 [07:12<11:06,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  39%|█████████████████████                                 | 713/1824 [07:12<11:15,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5508:  39%|█████████████████████▏                                | 714/1824 [07:13<10:54,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1719:  39%|█████████████████████▏                                | 715/1824 [07:14<11:15,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6836:  39%|█████████████████████▏                                | 716/1824 [07:14<11:25,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  39%|█████████████████████▏                                | 717/1824 [07:15<11:16,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0449:  39%|█████████████████████▎                                | 718/1824 [07:16<11:14,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9512:  39%|█████████████████████▎                                | 719/1824 [07:16<10:56,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7051:  39%|█████████████████████▎                                | 720/1824 [07:17<11:03,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  40%|█████████████████████▎                                | 721/1824 [07:17<10:48,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7441:  40%|█████████████████████▍                                | 722/1824 [07:18<10:50,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9902:  40%|█████████████████████▍                                | 723/1824 [07:18<10:59,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2383:  40%|█████████████████████▍                                | 724/1824 [07:19<11:04,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  40%|█████████████████████▍                                | 725/1824 [07:20<11:11,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.2344:  40%|█████████████████████▍                                | 726/1824 [07:20<11:08,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7070:  40%|█████████████████████▌                                | 727/1824 [07:21<11:12,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  40%|█████████████████████▌                                | 728/1824 [07:22<11:00,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1055:  40%|█████████████████████▌                                | 729/1824 [07:22<10:44,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8711:  40%|█████████████████████▌                                | 730/1824 [07:23<10:38,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7930:  40%|█████████████████████▋                                | 731/1824 [07:23<10:53,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  40%|█████████████████████▋                                | 732/1824 [07:24<10:49,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  40%|█████████████████████▋                                | 733/1824 [07:25<11:06,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9180:  40%|█████████████████████▋                                | 734/1824 [07:25<10:53,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  40%|█████████████████████▊                                | 735/1824 [07:26<11:02,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  40%|█████████████████████▊                                | 736/1824 [07:26<11:07,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0977:  40%|█████████████████████▊                                | 737/1824 [07:27<10:44,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  40%|█████████████████████▊                                | 738/1824 [07:27<10:43,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  41%|█████████████████████▉                                | 739/1824 [07:28<10:47,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1895:  41%|█████████████████████▉                                | 740/1824 [07:29<10:56,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6875:  41%|█████████████████████▉                                | 741/1824 [07:29<11:04,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  41%|█████████████████████▉                                | 742/1824 [07:30<10:54,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0430:  41%|█████████████████████▉                                | 743/1824 [07:31<10:47,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2500:  41%|██████████████████████                                | 744/1824 [07:31<10:47,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  41%|██████████████████████                                | 745/1824 [07:32<10:50,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2422:  41%|██████████████████████                                | 746/1824 [07:32<10:39,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  41%|██████████████████████                                | 747/1824 [07:33<10:42,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  41%|██████████████████████▏                               | 748/1824 [07:33<10:37,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6875:  41%|██████████████████████▏                               | 749/1824 [07:34<10:21,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.6055:  41%|██████████████████████▏                               | 750/1824 [07:35<10:28,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  41%|██████████████████████▏                               | 751/1824 [07:35<10:37,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7480:  41%|██████████████████████▎                               | 752/1824 [07:36<10:46,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6953:  41%|██████████████████████▎                               | 753/1824 [07:36<10:49,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:  41%|██████████████████████▎                               | 754/1824 [07:37<10:32,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  41%|██████████████████████▎                               | 755/1824 [07:38<10:25,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  41%|██████████████████████▍                               | 756/1824 [07:38<10:30,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0996:  42%|██████████████████████▍                               | 757/1824 [07:39<10:18,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:  42%|██████████████████████▍                               | 758/1824 [07:39<10:09,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.0742:  42%|██████████████████████▍                               | 759/1824 [07:40<10:16,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.2539:  42%|██████████████████████▌                               | 760/1824 [07:40<10:12,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0156:  42%|██████████████████████▌                               | 761/1824 [07:41<10:13,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  42%|██████████████████████▌                               | 762/1824 [07:42<10:22,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9746:  42%|██████████████████████▌                               | 763/1824 [07:42<10:22,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1680:  42%|██████████████████████▌                               | 764/1824 [07:43<10:14,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  42%|██████████████████████▋                               | 765/1824 [07:43<10:28,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  42%|██████████████████████▋                               | 766/1824 [07:44<10:27,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1602:  42%|██████████████████████▋                               | 767/1824 [07:45<10:22,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1191:  42%|██████████████████████▋                               | 768/1824 [07:45<10:20,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  42%|██████████████████████▊                               | 769/1824 [07:46<09:55,  1.77it/s]

cuda:0


Epoch 1/4, Loss: 2.8770:  42%|██████████████████████▊                               | 770/1824 [07:46<09:54,  1.77it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  42%|██████████████████████▊                               | 771/1824 [07:47<10:12,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  42%|██████████████████████▊                               | 772/1824 [07:48<10:22,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7695:  42%|██████████████████████▉                               | 773/1824 [07:48<10:28,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  42%|██████████████████████▉                               | 774/1824 [07:49<10:18,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1816:  42%|██████████████████████▉                               | 775/1824 [07:49<10:26,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  43%|██████████████████████▉                               | 776/1824 [07:50<10:22,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  43%|███████████████████████                               | 777/1824 [07:51<10:24,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  43%|███████████████████████                               | 778/1824 [07:51<10:32,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  43%|███████████████████████                               | 779/1824 [07:52<10:31,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  43%|███████████████████████                               | 780/1824 [07:52<10:24,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  43%|███████████████████████                               | 781/1824 [07:53<10:15,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.4102:  43%|███████████████████████▏                              | 782/1824 [07:53<10:11,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  43%|███████████████████████▏                              | 783/1824 [07:54<10:15,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  43%|███████████████████████▏                              | 784/1824 [07:55<10:15,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9688:  43%|███████████████████████▏                              | 785/1824 [07:55<10:12,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  43%|███████████████████████▎                              | 786/1824 [07:56<10:22,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6719:  43%|███████████████████████▎                              | 787/1824 [07:56<10:24,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  43%|███████████████████████▎                              | 788/1824 [07:57<10:32,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  43%|███████████████████████▎                              | 789/1824 [07:58<10:31,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9590:  43%|███████████████████████▍                              | 790/1824 [07:58<10:18,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8965:  43%|███████████████████████▍                              | 791/1824 [07:59<10:18,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8789:  43%|███████████████████████▍                              | 792/1824 [07:59<10:00,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7617:  43%|███████████████████████▍                              | 793/1824 [08:00<09:51,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7773:  44%|███████████████████████▌                              | 794/1824 [08:01<09:55,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.6328:  44%|███████████████████████▌                              | 795/1824 [08:01<10:06,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  44%|███████████████████████▌                              | 796/1824 [08:02<10:04,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7559:  44%|███████████████████████▌                              | 797/1824 [08:02<10:01,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  44%|███████████████████████▋                              | 798/1824 [08:03<09:53,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.2598:  44%|███████████████████████▋                              | 799/1824 [08:04<09:56,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7324:  44%|███████████████████████▋                              | 800/1824 [08:04<09:55,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8730:  44%|███████████████████████▋                              | 801/1824 [08:05<09:56,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0234:  44%|███████████████████████▋                              | 802/1824 [08:05<09:50,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  44%|███████████████████████▊                              | 803/1824 [08:06<09:50,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  44%|███████████████████████▊                              | 804/1824 [08:06<09:48,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  44%|███████████████████████▊                              | 805/1824 [08:07<09:49,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.1836:  44%|███████████████████████▊                              | 806/1824 [08:08<09:43,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  44%|███████████████████████▉                              | 807/1824 [08:08<09:44,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  44%|███████████████████████▉                              | 808/1824 [08:09<09:36,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  44%|███████████████████████▉                              | 809/1824 [08:09<09:41,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.1484:  44%|███████████████████████▉                              | 810/1824 [08:10<09:40,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.7246:  44%|████████████████████████                              | 811/1824 [08:10<09:42,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0508:  45%|████████████████████████                              | 812/1824 [08:11<09:54,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  45%|████████████████████████                              | 813/1824 [08:12<09:58,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1289:  45%|████████████████████████                              | 814/1824 [08:12<09:51,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:  45%|████████████████████████▏                             | 815/1824 [08:13<10:06,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  45%|████████████████████████▏                             | 816/1824 [08:13<09:46,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7012:  45%|████████████████████████▏                             | 817/1824 [08:14<10:00,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  45%|████████████████████████▏                             | 818/1824 [08:15<09:56,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  45%|████████████████████████▏                             | 819/1824 [08:15<09:45,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0254:  45%|████████████████████████▎                             | 820/1824 [08:16<09:53,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1602:  45%|████████████████████████▎                             | 821/1824 [08:16<09:55,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  45%|████████████████████████▎                             | 822/1824 [08:17<09:55,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  45%|████████████████████████▎                             | 823/1824 [08:18<09:53,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  45%|████████████████████████▍                             | 824/1824 [08:18<10:02,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6719:  45%|████████████████████████▍                             | 825/1824 [08:19<10:09,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  45%|████████████████████████▍                             | 826/1824 [08:19<10:07,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8340:  45%|████████████████████████▍                             | 827/1824 [08:20<10:13,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0742:  45%|████████████████████████▌                             | 828/1824 [08:21<10:16,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9746:  45%|████████████████████████▌                             | 829/1824 [08:21<10:02,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9980:  46%|████████████████████████▌                             | 830/1824 [08:22<10:13,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8652:  46%|████████████████████████▌                             | 831/1824 [08:22<09:44,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.5820:  46%|████████████████████████▋                             | 832/1824 [08:23<09:45,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  46%|████████████████████████▋                             | 833/1824 [08:24<09:48,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  46%|████████████████████████▋                             | 834/1824 [08:24<09:46,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  46%|████████████████████████▋                             | 835/1824 [08:25<09:43,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8496:  46%|████████████████████████▊                             | 836/1824 [08:25<09:35,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7324:  46%|████████████████████████▊                             | 837/1824 [08:26<09:51,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  46%|████████████████████████▊                             | 838/1824 [08:27<09:50,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:  46%|████████████████████████▊                             | 839/1824 [08:27<10:00,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  46%|████████████████████████▊                             | 840/1824 [08:28<09:57,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.3008:  46%|████████████████████████▉                             | 841/1824 [08:28<10:07,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  46%|████████████████████████▉                             | 842/1824 [08:29<10:20,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  46%|████████████████████████▉                             | 843/1824 [08:30<10:16,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  46%|████████████████████████▉                             | 844/1824 [08:30<10:09,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.4766:  46%|█████████████████████████                             | 845/1824 [08:31<10:07,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.6504:  46%|█████████████████████████                             | 846/1824 [08:32<09:56,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  46%|█████████████████████████                             | 847/1824 [08:32<09:54,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  46%|█████████████████████████                             | 848/1824 [08:33<09:51,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:  47%|█████████████████████████▏                            | 849/1824 [08:33<09:58,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1836:  47%|█████████████████████████▏                            | 850/1824 [08:34<09:46,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  47%|█████████████████████████▏                            | 851/1824 [08:35<09:46,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  47%|█████████████████████████▏                            | 852/1824 [08:35<09:24,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.5586:  47%|█████████████████████████▎                            | 853/1824 [08:36<09:27,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6836:  47%|█████████████████████████▎                            | 854/1824 [08:36<09:37,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  47%|█████████████████████████▎                            | 855/1824 [08:37<09:41,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0605:  47%|█████████████████████████▎                            | 856/1824 [08:37<09:30,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0312:  47%|█████████████████████████▎                            | 857/1824 [08:38<09:25,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9355:  47%|█████████████████████████▍                            | 858/1824 [08:39<09:25,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  47%|█████████████████████████▍                            | 859/1824 [08:39<09:10,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.1367:  47%|█████████████████████████▍                            | 860/1824 [08:40<09:07,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  47%|█████████████████████████▍                            | 861/1824 [08:40<09:29,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9844:  47%|█████████████████████████▌                            | 862/1824 [08:41<09:23,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  47%|█████████████████████████▌                            | 863/1824 [08:42<09:24,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  47%|█████████████████████████▌                            | 864/1824 [08:42<09:25,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.3867:  47%|█████████████████████████▌                            | 865/1824 [08:43<09:19,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  47%|█████████████████████████▋                            | 866/1824 [08:43<09:10,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  48%|█████████████████████████▋                            | 867/1824 [08:44<09:17,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  48%|█████████████████████████▋                            | 868/1824 [08:44<09:26,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  48%|█████████████████████████▋                            | 869/1824 [08:45<09:28,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8379:  48%|█████████████████████████▊                            | 870/1824 [08:46<09:21,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  48%|█████████████████████████▊                            | 871/1824 [08:46<09:20,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.5156:  48%|█████████████████████████▊                            | 872/1824 [08:47<09:30,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7188:  48%|█████████████████████████▊                            | 873/1824 [08:47<09:18,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  48%|█████████████████████████▉                            | 874/1824 [08:48<09:23,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.2617:  48%|█████████████████████████▉                            | 875/1824 [08:49<09:17,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9160:  48%|█████████████████████████▉                            | 876/1824 [08:49<09:14,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  48%|█████████████████████████▉                            | 877/1824 [08:50<09:09,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.2266:  48%|█████████████████████████▉                            | 878/1824 [08:50<09:04,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9355:  48%|██████████████████████████                            | 879/1824 [08:51<09:10,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8770:  48%|██████████████████████████                            | 880/1824 [08:51<08:56,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:  48%|██████████████████████████                            | 881/1824 [08:52<09:00,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  48%|██████████████████████████                            | 882/1824 [08:53<09:09,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6934:  48%|██████████████████████████▏                           | 883/1824 [08:53<09:14,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.6562:  48%|██████████████████████████▏                           | 884/1824 [08:54<09:21,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  49%|██████████████████████████▏                           | 885/1824 [08:54<09:26,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7285:  49%|██████████████████████████▏                           | 886/1824 [08:55<09:28,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7227:  49%|██████████████████████████▎                           | 887/1824 [08:56<09:27,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8535:  49%|██████████████████████████▎                           | 888/1824 [08:56<09:23,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1270:  49%|██████████████████████████▎                           | 889/1824 [08:57<09:25,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.2793:  49%|██████████████████████████▎                           | 890/1824 [08:58<09:36,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1133:  49%|██████████████████████████▍                           | 891/1824 [08:58<09:26,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7070:  49%|██████████████████████████▍                           | 892/1824 [08:59<09:23,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0508:  49%|██████████████████████████▍                           | 893/1824 [08:59<09:23,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  49%|██████████████████████████▍                           | 894/1824 [09:00<09:24,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8672:  49%|██████████████████████████▍                           | 895/1824 [09:01<09:26,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:  49%|██████████████████████████▌                           | 896/1824 [09:01<09:23,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  49%|██████████████████████████▌                           | 897/1824 [09:02<09:03,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  49%|██████████████████████████▌                           | 898/1824 [09:02<09:01,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.5195:  49%|██████████████████████████▌                           | 899/1824 [09:03<09:06,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:  49%|██████████████████████████▋                           | 900/1824 [09:04<09:14,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:  49%|██████████████████████████▋                           | 901/1824 [09:04<09:14,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0527:  49%|██████████████████████████▋                           | 902/1824 [09:05<09:03,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  50%|██████████████████████████▋                           | 903/1824 [09:05<09:03,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.2109:  50%|██████████████████████████▊                           | 904/1824 [09:06<08:59,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  50%|██████████████████████████▊                           | 905/1824 [09:06<08:58,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.2070:  50%|██████████████████████████▊                           | 906/1824 [09:07<08:53,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  50%|██████████████████████████▊                           | 907/1824 [09:08<09:01,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  50%|██████████████████████████▉                           | 908/1824 [09:08<09:02,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9102:  50%|██████████████████████████▉                           | 909/1824 [09:09<09:03,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9688:  50%|██████████████████████████▉                           | 910/1824 [09:09<08:56,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0586:  50%|██████████████████████████▉                           | 911/1824 [09:10<08:54,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1602:  50%|███████████████████████████                           | 912/1824 [09:11<08:57,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1836:  50%|███████████████████████████                           | 913/1824 [09:11<08:57,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0410:  50%|███████████████████████████                           | 914/1824 [09:12<09:09,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  50%|███████████████████████████                           | 915/1824 [09:12<09:09,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  50%|███████████████████████████                           | 916/1824 [09:13<09:08,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6953:  50%|███████████████████████████▏                          | 917/1824 [09:14<09:12,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  50%|███████████████████████████▏                          | 918/1824 [09:14<09:02,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  50%|███████████████████████████▏                          | 919/1824 [09:15<09:05,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  50%|███████████████████████████▏                          | 920/1824 [09:15<09:05,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2031:  50%|███████████████████████████▎                          | 921/1824 [09:16<09:04,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0879:  51%|███████████████████████████▎                          | 922/1824 [09:17<08:59,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9844:  51%|███████████████████████████▎                          | 923/1824 [09:17<09:04,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  51%|███████████████████████████▎                          | 924/1824 [09:18<08:55,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  51%|███████████████████████████▍                          | 925/1824 [09:18<08:52,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  51%|███████████████████████████▍                          | 926/1824 [09:19<08:50,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.5195:  51%|███████████████████████████▍                          | 927/1824 [09:20<08:59,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9668:  51%|███████████████████████████▍                          | 928/1824 [09:20<08:57,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.5547:  51%|███████████████████████████▌                          | 929/1824 [09:21<09:11,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  51%|███████████████████████████▌                          | 930/1824 [09:21<09:06,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1152:  51%|███████████████████████████▌                          | 931/1824 [09:22<09:09,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.3926:  51%|███████████████████████████▌                          | 932/1824 [09:23<08:44,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1074:  51%|███████████████████████████▌                          | 933/1824 [09:23<08:45,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  51%|███████████████████████████▋                          | 934/1824 [09:24<08:50,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9590:  51%|███████████████████████████▋                          | 935/1824 [09:24<08:56,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  51%|███████████████████████████▋                          | 936/1824 [09:25<08:46,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.2930:  51%|███████████████████████████▋                          | 937/1824 [09:26<08:49,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0137:  51%|███████████████████████████▊                          | 938/1824 [09:26<09:02,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8691:  51%|███████████████████████████▊                          | 939/1824 [09:27<09:04,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1016:  52%|███████████████████████████▊                          | 940/1824 [09:27<08:57,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7344:  52%|███████████████████████████▊                          | 941/1824 [09:28<08:57,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8066:  52%|███████████████████████████▉                          | 942/1824 [09:29<08:52,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  52%|███████████████████████████▉                          | 943/1824 [09:29<09:02,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1289:  52%|███████████████████████████▉                          | 944/1824 [09:30<08:57,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.3867:  52%|███████████████████████████▉                          | 945/1824 [09:30<08:48,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  52%|████████████████████████████                          | 946/1824 [09:31<08:50,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  52%|████████████████████████████                          | 947/1824 [09:32<08:43,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  52%|████████████████████████████                          | 948/1824 [09:32<08:27,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  52%|████████████████████████████                          | 949/1824 [09:33<08:37,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1309:  52%|████████████████████████████▏                         | 950/1824 [09:33<08:35,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  52%|████████████████████████████▏                         | 951/1824 [09:34<08:28,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.1113:  52%|████████████████████████████▏                         | 952/1824 [09:35<08:27,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7598:  52%|████████████████████████████▏                         | 953/1824 [09:35<08:32,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8711:  52%|████████████████████████████▏                         | 954/1824 [09:36<08:41,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:  52%|████████████████████████████▎                         | 955/1824 [09:36<08:38,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7520:  52%|████████████████████████████▎                         | 956/1824 [09:37<08:41,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  52%|████████████████████████████▎                         | 957/1824 [09:38<08:28,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  53%|████████████████████████████▎                         | 958/1824 [09:38<08:25,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0566:  53%|████████████████████████████▍                         | 959/1824 [09:39<08:27,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  53%|████████████████████████████▍                         | 960/1824 [09:39<08:21,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.1641:  53%|████████████████████████████▍                         | 961/1824 [09:40<08:18,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.7559:  53%|████████████████████████████▍                         | 962/1824 [09:40<08:16,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0488:  53%|████████████████████████████▌                         | 963/1824 [09:41<08:10,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.2168:  53%|████████████████████████████▌                         | 964/1824 [09:42<08:31,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1719:  53%|████████████████████████████▌                         | 965/1824 [09:42<08:32,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9199:  53%|████████████████████████████▌                         | 966/1824 [09:43<08:37,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:  53%|████████████████████████████▋                         | 967/1824 [09:44<08:50,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.6133:  53%|████████████████████████████▋                         | 968/1824 [09:44<08:37,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1250:  53%|████████████████████████████▋                         | 969/1824 [09:45<08:35,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1758:  53%|████████████████████████████▋                         | 970/1824 [09:45<08:30,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6992:  53%|████████████████████████████▋                         | 971/1824 [09:46<08:36,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6836:  53%|████████████████████████████▊                         | 972/1824 [09:47<08:39,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7695:  53%|████████████████████████████▊                         | 973/1824 [09:47<08:32,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  53%|████████████████████████████▊                         | 974/1824 [09:48<08:27,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7266:  53%|████████████████████████████▊                         | 975/1824 [09:48<08:13,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7363:  54%|████████████████████████████▉                         | 976/1824 [09:49<08:09,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  54%|████████████████████████████▉                         | 977/1824 [09:49<08:14,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.3145:  54%|████████████████████████████▉                         | 978/1824 [09:50<08:11,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8027:  54%|████████████████████████████▉                         | 979/1824 [09:51<08:12,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.3320:  54%|█████████████████████████████                         | 980/1824 [09:51<08:23,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1680:  54%|█████████████████████████████                         | 981/1824 [09:52<08:28,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6348:  54%|█████████████████████████████                         | 982/1824 [09:52<08:28,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  54%|█████████████████████████████                         | 983/1824 [09:53<08:21,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  54%|█████████████████████████████▏                        | 984/1824 [09:54<08:21,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6602:  54%|█████████████████████████████▏                        | 985/1824 [09:54<08:06,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  54%|█████████████████████████████▏                        | 986/1824 [09:55<08:18,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0801:  54%|█████████████████████████████▏                        | 987/1824 [09:55<08:23,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7363:  54%|█████████████████████████████▏                        | 988/1824 [09:56<08:29,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  54%|█████████████████████████████▎                        | 989/1824 [09:57<08:23,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6895:  54%|█████████████████████████████▎                        | 990/1824 [09:57<08:18,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  54%|█████████████████████████████▎                        | 991/1824 [09:58<08:11,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0586:  54%|█████████████████████████████▎                        | 992/1824 [09:58<08:28,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0234:  54%|█████████████████████████████▍                        | 993/1824 [09:59<08:24,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6191:  54%|█████████████████████████████▍                        | 994/1824 [10:00<08:30,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9082:  55%|█████████████████████████████▍                        | 995/1824 [10:00<08:21,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9863:  55%|█████████████████████████████▍                        | 996/1824 [10:01<08:20,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  55%|█████████████████████████████▌                        | 997/1824 [10:01<08:15,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  55%|█████████████████████████████▌                        | 998/1824 [10:02<08:13,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6680:  55%|█████████████████████████████▌                        | 999/1824 [10:03<08:11,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  55%|█████████████████████████████                        | 1000/1824 [10:03<08:00,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.3438:  55%|█████████████████████████████                        | 1001/1824 [10:04<07:52,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.6992:  55%|█████████████████████████████                        | 1002/1824 [10:04<07:58,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  55%|█████████████████████████████▏                       | 1003/1824 [10:05<07:58,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:  55%|█████████████████████████████▏                       | 1004/1824 [10:05<07:55,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  55%|█████████████████████████████▏                       | 1005/1824 [10:06<07:57,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  55%|█████████████████████████████▏                       | 1006/1824 [10:07<07:59,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.2383:  55%|█████████████████████████████▎                       | 1007/1824 [10:07<07:52,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.6016:  55%|█████████████████████████████▎                       | 1008/1824 [10:08<07:51,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.2539:  55%|█████████████████████████████▎                       | 1009/1824 [10:08<07:54,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.2188:  55%|█████████████████████████████▎                       | 1010/1824 [10:09<07:52,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0410:  55%|█████████████████████████████▍                       | 1011/1824 [10:09<07:43,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.0430:  55%|█████████████████████████████▍                       | 1012/1824 [10:10<07:47,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.6797:  56%|█████████████████████████████▍                       | 1013/1824 [10:11<07:43,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.6133:  56%|█████████████████████████████▍                       | 1014/1824 [10:11<07:43,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.6914:  56%|█████████████████████████████▍                       | 1015/1824 [10:12<07:48,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.6289:  56%|█████████████████████████████▌                       | 1016/1824 [10:12<07:37,  1.77it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:  56%|█████████████████████████████▌                       | 1017/1824 [10:13<07:41,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.1250:  56%|█████████████████████████████▌                       | 1018/1824 [10:14<07:47,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  56%|█████████████████████████████▌                       | 1019/1824 [10:14<07:49,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  56%|█████████████████████████████▋                       | 1020/1824 [10:15<07:58,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6445:  56%|█████████████████████████████▋                       | 1021/1824 [10:15<07:58,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0156:  56%|█████████████████████████████▋                       | 1022/1824 [10:16<07:51,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7695:  56%|█████████████████████████████▋                       | 1023/1824 [10:16<07:35,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.5625:  56%|█████████████████████████████▊                       | 1024/1824 [10:17<07:38,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  56%|█████████████████████████████▊                       | 1025/1824 [10:18<07:49,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9980:  56%|█████████████████████████████▊                       | 1026/1824 [10:18<07:58,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0508:  56%|█████████████████████████████▊                       | 1027/1824 [10:19<07:45,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9707:  56%|█████████████████████████████▊                       | 1028/1824 [10:19<07:49,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9434:  56%|█████████████████████████████▉                       | 1029/1824 [10:20<07:50,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  56%|█████████████████████████████▉                       | 1030/1824 [10:21<07:35,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.5625:  57%|█████████████████████████████▉                       | 1031/1824 [10:21<07:44,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6914:  57%|█████████████████████████████▉                       | 1032/1824 [10:22<07:42,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:  57%|██████████████████████████████                       | 1033/1824 [10:22<07:47,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6816:  57%|██████████████████████████████                       | 1034/1824 [10:23<07:47,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6445:  57%|██████████████████████████████                       | 1035/1824 [10:24<07:49,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9355:  57%|██████████████████████████████                       | 1036/1824 [10:24<07:48,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.2148:  57%|██████████████████████████████▏                      | 1037/1824 [10:25<07:53,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2305:  57%|██████████████████████████████▏                      | 1038/1824 [10:25<07:48,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  57%|██████████████████████████████▏                      | 1039/1824 [10:26<07:49,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  57%|██████████████████████████████▏                      | 1040/1824 [10:26<07:39,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  57%|██████████████████████████████▏                      | 1041/1824 [10:27<07:47,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  57%|██████████████████████████████▎                      | 1042/1824 [10:28<07:44,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.5391:  57%|██████████████████████████████▎                      | 1043/1824 [10:28<07:47,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:  57%|██████████████████████████████▎                      | 1044/1824 [10:29<07:51,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  57%|██████████████████████████████▎                      | 1045/1824 [10:30<07:50,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  57%|██████████████████████████████▍                      | 1046/1824 [10:30<07:46,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.4336:  57%|██████████████████████████████▍                      | 1047/1824 [10:31<07:50,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.2480:  57%|██████████████████████████████▍                      | 1048/1824 [10:31<07:48,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1699:  58%|██████████████████████████████▍                      | 1049/1824 [10:32<07:40,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0312:  58%|██████████████████████████████▌                      | 1050/1824 [10:32<07:32,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  58%|██████████████████████████████▌                      | 1051/1824 [10:33<07:25,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.1523:  58%|██████████████████████████████▌                      | 1052/1824 [10:34<07:21,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.5977:  58%|██████████████████████████████▌                      | 1053/1824 [10:34<07:22,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  58%|██████████████████████████████▋                      | 1054/1824 [10:35<07:25,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  58%|██████████████████████████████▋                      | 1055/1824 [10:35<07:28,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8184:  58%|██████████████████████████████▋                      | 1056/1824 [10:36<07:39,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6855:  58%|██████████████████████████████▋                      | 1057/1824 [10:37<07:38,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1543:  58%|██████████████████████████████▋                      | 1058/1824 [10:37<07:24,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9688:  58%|██████████████████████████████▊                      | 1059/1824 [10:38<07:31,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8457:  58%|██████████████████████████████▊                      | 1060/1824 [10:38<07:30,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.2812:  58%|██████████████████████████████▊                      | 1061/1824 [10:39<07:33,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0234:  58%|██████████████████████████████▊                      | 1062/1824 [10:40<07:30,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:  58%|██████████████████████████████▉                      | 1063/1824 [10:40<07:24,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1445:  58%|██████████████████████████████▉                      | 1064/1824 [10:41<07:31,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  58%|██████████████████████████████▉                      | 1065/1824 [10:41<07:31,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  58%|██████████████████████████████▉                      | 1066/1824 [10:42<07:22,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8145:  58%|███████████████████████████████                      | 1067/1824 [10:42<07:29,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0781:  59%|███████████████████████████████                      | 1068/1824 [10:43<07:27,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  59%|███████████████████████████████                      | 1069/1824 [10:44<07:17,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  59%|███████████████████████████████                      | 1070/1824 [10:44<07:21,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  59%|███████████████████████████████                      | 1071/1824 [10:45<07:20,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7344:  59%|███████████████████████████████▏                     | 1072/1824 [10:45<07:23,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  59%|███████████████████████████████▏                     | 1073/1824 [10:46<07:12,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0488:  59%|███████████████████████████████▏                     | 1074/1824 [10:47<07:18,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:  59%|███████████████████████████████▏                     | 1075/1824 [10:47<07:19,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  59%|███████████████████████████████▎                     | 1076/1824 [10:48<07:18,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8301:  59%|███████████████████████████████▎                     | 1077/1824 [10:48<07:21,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  59%|███████████████████████████████▎                     | 1078/1824 [10:49<07:17,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.5391:  59%|███████████████████████████████▎                     | 1079/1824 [10:49<07:05,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.3750:  59%|███████████████████████████████▍                     | 1080/1824 [10:50<07:10,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  59%|███████████████████████████████▍                     | 1081/1824 [10:51<07:09,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.6777:  59%|███████████████████████████████▍                     | 1082/1824 [10:51<07:18,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0176:  59%|███████████████████████████████▍                     | 1083/1824 [10:52<07:24,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0371:  59%|███████████████████████████████▍                     | 1084/1824 [10:52<07:17,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:  59%|███████████████████████████████▌                     | 1085/1824 [10:53<07:21,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6328:  60%|███████████████████████████████▌                     | 1086/1824 [10:54<07:24,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:  60%|███████████████████████████████▌                     | 1087/1824 [10:54<07:20,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1426:  60%|███████████████████████████████▌                     | 1088/1824 [10:55<07:23,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0684:  60%|███████████████████████████████▋                     | 1089/1824 [10:55<07:30,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9551:  60%|███████████████████████████████▋                     | 1090/1824 [10:56<07:34,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  60%|███████████████████████████████▋                     | 1091/1824 [10:57<07:22,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  60%|███████████████████████████████▋                     | 1092/1824 [10:57<07:25,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  60%|███████████████████████████████▊                     | 1093/1824 [10:58<07:12,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7363:  60%|███████████████████████████████▊                     | 1094/1824 [10:58<07:09,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  60%|███████████████████████████████▊                     | 1095/1824 [10:59<07:23,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  60%|███████████████████████████████▊                     | 1096/1824 [11:00<07:12,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0371:  60%|███████████████████████████████▉                     | 1097/1824 [11:00<07:08,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  60%|███████████████████████████████▉                     | 1098/1824 [11:01<07:09,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  60%|███████████████████████████████▉                     | 1099/1824 [11:01<07:09,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  60%|███████████████████████████████▉                     | 1100/1824 [11:02<07:20,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1660:  60%|███████████████████████████████▉                     | 1101/1824 [11:03<07:19,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1953:  60%|████████████████████████████████                     | 1102/1824 [11:03<07:23,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.3203:  60%|████████████████████████████████                     | 1103/1824 [11:04<07:20,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.2852:  61%|████████████████████████████████                     | 1104/1824 [11:04<07:13,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  61%|████████████████████████████████                     | 1105/1824 [11:05<07:14,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5703:  61%|████████████████████████████████▏                    | 1106/1824 [11:06<07:13,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  61%|████████████████████████████████▏                    | 1107/1824 [11:06<07:09,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.4688:  61%|████████████████████████████████▏                    | 1108/1824 [11:07<07:13,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6582:  61%|████████████████████████████████▏                    | 1109/1824 [11:07<07:08,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  61%|████████████████████████████████▎                    | 1110/1824 [11:08<07:02,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8301:  61%|████████████████████████████████▎                    | 1111/1824 [11:09<07:05,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  61%|████████████████████████████████▎                    | 1112/1824 [11:09<07:01,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0566:  61%|████████████████████████████████▎                    | 1113/1824 [11:10<07:04,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  61%|████████████████████████████████▎                    | 1114/1824 [11:10<06:56,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1465:  61%|████████████████████████████████▍                    | 1115/1824 [11:11<06:54,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1133:  61%|████████████████████████████████▍                    | 1116/1824 [11:12<06:57,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1875:  61%|████████████████████████████████▍                    | 1117/1824 [11:12<06:50,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0781:  61%|████████████████████████████████▍                    | 1118/1824 [11:13<06:50,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.3008:  61%|████████████████████████████████▌                    | 1119/1824 [11:13<06:52,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9434:  61%|████████████████████████████████▌                    | 1120/1824 [11:14<06:46,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.0508:  61%|████████████████████████████████▌                    | 1121/1824 [11:14<06:43,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  62%|████████████████████████████████▌                    | 1122/1824 [11:15<06:38,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 3.1445:  62%|████████████████████████████████▋                    | 1123/1824 [11:16<06:44,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  62%|████████████████████████████████▋                    | 1124/1824 [11:16<06:47,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.6699:  62%|████████████████████████████████▋                    | 1125/1824 [11:17<06:51,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  62%|████████████████████████████████▋                    | 1126/1824 [11:17<06:45,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  62%|████████████████████████████████▋                    | 1127/1824 [11:18<07:01,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  62%|████████████████████████████████▊                    | 1128/1824 [11:19<06:55,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:  62%|████████████████████████████████▊                    | 1129/1824 [11:19<06:54,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1875:  62%|████████████████████████████████▊                    | 1130/1824 [11:20<06:55,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  62%|████████████████████████████████▊                    | 1131/1824 [11:20<06:39,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  62%|████████████████████████████████▉                    | 1132/1824 [11:21<06:35,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  62%|████████████████████████████████▉                    | 1133/1824 [11:22<06:44,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1367:  62%|████████████████████████████████▉                    | 1134/1824 [11:22<06:43,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8887:  62%|████████████████████████████████▉                    | 1135/1824 [11:23<06:48,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  62%|█████████████████████████████████                    | 1136/1824 [11:23<06:46,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  62%|█████████████████████████████████                    | 1137/1824 [11:24<06:50,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7617:  62%|█████████████████████████████████                    | 1138/1824 [11:25<06:49,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1680:  62%|█████████████████████████████████                    | 1139/1824 [11:25<06:50,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8008:  62%|█████████████████████████████████▏                   | 1140/1824 [11:26<06:49,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.5781:  63%|█████████████████████████████████▏                   | 1141/1824 [11:26<06:45,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  63%|█████████████████████████████████▏                   | 1142/1824 [11:27<06:49,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.4062:  63%|█████████████████████████████████▏                   | 1143/1824 [11:27<06:43,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  63%|█████████████████████████████████▏                   | 1144/1824 [11:28<06:51,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.2031:  63%|█████████████████████████████████▎                   | 1145/1824 [11:29<06:53,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7109:  63%|█████████████████████████████████▎                   | 1146/1824 [11:29<06:45,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  63%|█████████████████████████████████▎                   | 1147/1824 [11:30<06:47,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6738:  63%|█████████████████████████████████▎                   | 1148/1824 [11:31<06:41,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.5195:  63%|█████████████████████████████████▍                   | 1149/1824 [11:31<06:37,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.6621:  63%|█████████████████████████████████▍                   | 1150/1824 [11:32<06:31,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.2031:  63%|█████████████████████████████████▍                   | 1151/1824 [11:32<06:30,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9824:  63%|█████████████████████████████████▍                   | 1152/1824 [11:33<06:30,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:  63%|█████████████████████████████████▌                   | 1153/1824 [11:33<06:25,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9824:  63%|█████████████████████████████████▌                   | 1154/1824 [11:34<06:27,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.7715:  63%|█████████████████████████████████▌                   | 1155/1824 [11:34<06:20,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.7344:  63%|█████████████████████████████████▌                   | 1156/1824 [11:35<06:23,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7148:  63%|█████████████████████████████████▌                   | 1157/1824 [11:36<06:32,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7559:  63%|█████████████████████████████████▋                   | 1158/1824 [11:36<06:40,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:  64%|█████████████████████████████████▋                   | 1159/1824 [11:37<06:45,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.5547:  64%|█████████████████████████████████▋                   | 1160/1824 [11:38<06:43,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9668:  64%|█████████████████████████████████▋                   | 1161/1824 [11:38<06:38,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  64%|█████████████████████████████████▊                   | 1162/1824 [11:39<06:29,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  64%|█████████████████████████████████▊                   | 1163/1824 [11:39<06:21,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9980:  64%|█████████████████████████████████▊                   | 1164/1824 [11:40<06:11,  1.78it/s]

cuda:0


Epoch 1/4, Loss: 3.1367:  64%|█████████████████████████████████▊                   | 1165/1824 [11:40<06:13,  1.77it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  64%|█████████████████████████████████▉                   | 1166/1824 [11:41<06:16,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.6191:  64%|█████████████████████████████████▉                   | 1167/1824 [11:42<06:27,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.2266:  64%|█████████████████████████████████▉                   | 1168/1824 [11:42<06:21,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  64%|█████████████████████████████████▉                   | 1169/1824 [11:43<06:27,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6543:  64%|█████████████████████████████████▉                   | 1170/1824 [11:43<06:25,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:  64%|██████████████████████████████████                   | 1171/1824 [11:44<06:16,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9277:  64%|██████████████████████████████████                   | 1172/1824 [11:44<06:13,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.7734:  64%|██████████████████████████████████                   | 1173/1824 [11:45<06:13,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  64%|██████████████████████████████████                   | 1174/1824 [11:46<06:13,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.8535:  64%|██████████████████████████████████▏                  | 1175/1824 [11:46<06:10,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.8145:  64%|██████████████████████████████████▏                  | 1176/1824 [11:47<06:09,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.5352:  65%|██████████████████████████████████▏                  | 1177/1824 [11:47<06:13,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  65%|██████████████████████████████████▏                  | 1178/1824 [11:48<06:14,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9277:  65%|██████████████████████████████████▎                  | 1179/1824 [11:49<06:23,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6602:  65%|██████████████████████████████████▎                  | 1180/1824 [11:49<06:20,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  65%|██████████████████████████████████▎                  | 1181/1824 [11:50<06:17,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  65%|██████████████████████████████████▎                  | 1182/1824 [11:50<06:07,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  65%|██████████████████████████████████▎                  | 1183/1824 [11:51<06:12,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7188:  65%|██████████████████████████████████▍                  | 1184/1824 [11:51<06:23,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9297:  65%|██████████████████████████████████▍                  | 1185/1824 [11:52<06:18,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0020:  65%|██████████████████████████████████▍                  | 1186/1824 [11:53<06:22,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1289:  65%|██████████████████████████████████▍                  | 1187/1824 [11:53<06:18,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  65%|██████████████████████████████████▌                  | 1188/1824 [11:54<06:26,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1328:  65%|██████████████████████████████████▌                  | 1189/1824 [11:54<06:24,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1367:  65%|██████████████████████████████████▌                  | 1190/1824 [11:55<06:23,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  65%|██████████████████████████████████▌                  | 1191/1824 [11:56<06:24,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  65%|██████████████████████████████████▋                  | 1192/1824 [11:56<06:17,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7695:  65%|██████████████████████████████████▋                  | 1193/1824 [11:57<05:59,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  65%|██████████████████████████████████▋                  | 1194/1824 [11:57<06:06,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  66%|██████████████████████████████████▋                  | 1195/1824 [11:58<06:09,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7070:  66%|██████████████████████████████████▊                  | 1196/1824 [11:59<06:11,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  66%|██████████████████████████████████▊                  | 1197/1824 [11:59<06:14,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  66%|██████████████████████████████████▊                  | 1198/1824 [12:00<06:16,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7949:  66%|██████████████████████████████████▊                  | 1199/1824 [12:00<06:17,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  66%|██████████████████████████████████▊                  | 1200/1824 [12:01<06:17,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7285:  66%|██████████████████████████████████▉                  | 1201/1824 [12:02<06:17,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1055:  66%|██████████████████████████████████▉                  | 1202/1824 [12:02<06:12,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7168:  66%|██████████████████████████████████▉                  | 1203/1824 [12:03<06:19,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  66%|██████████████████████████████████▉                  | 1204/1824 [12:03<06:13,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.5117:  66%|███████████████████████████████████                  | 1205/1824 [12:04<06:12,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  66%|███████████████████████████████████                  | 1206/1824 [12:05<06:14,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9512:  66%|███████████████████████████████████                  | 1207/1824 [12:05<06:13,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  66%|███████████████████████████████████                  | 1208/1824 [12:06<06:10,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  66%|███████████████████████████████████▏                 | 1209/1824 [12:06<06:01,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7617:  66%|███████████████████████████████████▏                 | 1210/1824 [12:07<06:00,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.6680:  66%|███████████████████████████████████▏                 | 1211/1824 [12:08<06:02,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6270:  66%|███████████████████████████████████▏                 | 1212/1824 [12:08<06:07,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7852:  67%|███████████████████████████████████▏                 | 1213/1824 [12:09<06:06,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  67%|███████████████████████████████████▎                 | 1214/1824 [12:09<06:01,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7930:  67%|███████████████████████████████████▎                 | 1215/1824 [12:10<06:02,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  67%|███████████████████████████████████▎                 | 1216/1824 [12:11<06:12,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  67%|███████████████████████████████████▎                 | 1217/1824 [12:11<06:02,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:  67%|███████████████████████████████████▍                 | 1218/1824 [12:12<05:48,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:  67%|███████████████████████████████████▍                 | 1219/1824 [12:12<05:47,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  67%|███████████████████████████████████▍                 | 1220/1824 [12:13<05:43,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  67%|███████████████████████████████████▍                 | 1221/1824 [12:13<05:48,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  67%|███████████████████████████████████▌                 | 1222/1824 [12:14<05:47,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.3047:  67%|███████████████████████████████████▌                 | 1223/1824 [12:15<05:43,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.7324:  67%|███████████████████████████████████▌                 | 1224/1824 [12:15<05:51,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  67%|███████████████████████████████████▌                 | 1225/1824 [12:16<05:54,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  67%|███████████████████████████████████▌                 | 1226/1824 [12:16<05:58,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1445:  67%|███████████████████████████████████▋                 | 1227/1824 [12:17<05:53,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0410:  67%|███████████████████████████████████▋                 | 1228/1824 [12:18<05:57,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  67%|███████████████████████████████████▋                 | 1229/1824 [12:18<05:58,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  67%|███████████████████████████████████▋                 | 1230/1824 [12:19<05:58,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  67%|███████████████████████████████████▊                 | 1231/1824 [12:19<06:01,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0215:  68%|███████████████████████████████████▊                 | 1232/1824 [12:20<06:05,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  68%|███████████████████████████████████▊                 | 1233/1824 [12:21<06:06,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7930:  68%|███████████████████████████████████▊                 | 1234/1824 [12:21<05:58,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  68%|███████████████████████████████████▉                 | 1235/1824 [12:22<05:51,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7930:  68%|███████████████████████████████████▉                 | 1236/1824 [12:22<05:51,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2227:  68%|███████████████████████████████████▉                 | 1237/1824 [12:23<05:54,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8027:  68%|███████████████████████████████████▉                 | 1238/1824 [12:24<05:54,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0332:  68%|████████████████████████████████████                 | 1239/1824 [12:24<05:41,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  68%|████████████████████████████████████                 | 1240/1824 [12:25<05:41,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  68%|████████████████████████████████████                 | 1241/1824 [12:25<05:48,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  68%|████████████████████████████████████                 | 1242/1824 [12:26<05:50,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9316:  68%|████████████████████████████████████                 | 1243/1824 [12:27<05:51,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6719:  68%|████████████████████████████████████▏                | 1244/1824 [12:27<05:54,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6875:  68%|████████████████████████████████████▏                | 1245/1824 [12:28<05:54,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  68%|████████████████████████████████████▏                | 1246/1824 [12:29<05:55,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  68%|████████████████████████████████████▏                | 1247/1824 [12:29<05:51,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  68%|████████████████████████████████████▎                | 1248/1824 [12:30<05:51,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  68%|████████████████████████████████████▎                | 1249/1824 [12:30<05:44,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0566:  69%|████████████████████████████████████▎                | 1250/1824 [12:31<05:40,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9551:  69%|████████████████████████████████████▎                | 1251/1824 [12:32<05:38,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  69%|████████████████████████████████████▍                | 1252/1824 [12:32<05:40,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9297:  69%|████████████████████████████████████▍                | 1253/1824 [12:33<05:41,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.2402:  69%|████████████████████████████████████▍                | 1254/1824 [12:33<05:46,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  69%|████████████████████████████████████▍                | 1255/1824 [12:34<05:33,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6895:  69%|████████████████████████████████████▍                | 1256/1824 [12:34<05:33,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0234:  69%|████████████████████████████████████▌                | 1257/1824 [12:35<05:36,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0312:  69%|████████████████████████████████████▌                | 1258/1824 [12:36<05:31,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  69%|████████████████████████████████████▌                | 1259/1824 [12:36<05:32,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  69%|████████████████████████████████████▌                | 1260/1824 [12:37<05:27,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  69%|████████████████████████████████████▋                | 1261/1824 [12:37<05:22,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  69%|████████████████████████████████████▋                | 1262/1824 [12:38<05:29,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.2598:  69%|████████████████████████████████████▋                | 1263/1824 [12:39<05:30,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7129:  69%|████████████████████████████████████▋                | 1264/1824 [12:39<05:38,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6914:  69%|████████████████████████████████████▊                | 1265/1824 [12:40<05:36,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7734:  69%|████████████████████████████████████▊                | 1266/1824 [12:40<05:33,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7773:  69%|████████████████████████████████████▊                | 1267/1824 [12:41<05:35,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7676:  70%|████████████████████████████████████▊                | 1268/1824 [12:42<05:32,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7344:  70%|████████████████████████████████████▊                | 1269/1824 [12:42<05:36,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:  70%|████████████████████████████████████▉                | 1270/1824 [12:43<05:32,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0508:  70%|████████████████████████████████████▉                | 1271/1824 [12:43<05:30,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8008:  70%|████████████████████████████████████▉                | 1272/1824 [12:44<05:27,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.5293:  70%|████████████████████████████████████▉                | 1273/1824 [12:45<05:32,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  70%|█████████████████████████████████████                | 1274/1824 [12:45<05:21,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  70%|█████████████████████████████████████                | 1275/1824 [12:46<05:22,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  70%|█████████████████████████████████████                | 1276/1824 [12:46<05:29,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9707:  70%|█████████████████████████████████████                | 1277/1824 [12:47<05:26,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  70%|█████████████████████████████████████▏               | 1278/1824 [12:48<05:22,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  70%|█████████████████████████████████████▏               | 1279/1824 [12:48<05:17,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  70%|█████████████████████████████████████▏               | 1280/1824 [12:49<05:21,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  70%|█████████████████████████████████████▏               | 1281/1824 [12:49<05:19,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.4688:  70%|█████████████████████████████████████▎               | 1282/1824 [12:50<05:19,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8809:  70%|█████████████████████████████████████▎               | 1283/1824 [12:51<05:22,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:  70%|█████████████████████████████████████▎               | 1284/1824 [12:51<05:22,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6230:  70%|█████████████████████████████████████▎               | 1285/1824 [12:52<05:20,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7227:  71%|█████████████████████████████████████▎               | 1286/1824 [12:52<05:15,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7520:  71%|█████████████████████████████████████▍               | 1287/1824 [12:53<05:10,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8594:  71%|█████████████████████████████████████▍               | 1288/1824 [12:53<05:14,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  71%|█████████████████████████████████████▍               | 1289/1824 [12:54<05:12,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  71%|█████████████████████████████████████▍               | 1290/1824 [12:55<05:05,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.7773:  71%|█████████████████████████████████████▌               | 1291/1824 [12:55<05:14,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9473:  71%|█████████████████████████████████████▌               | 1292/1824 [12:56<05:16,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  71%|█████████████████████████████████████▌               | 1293/1824 [12:56<05:30,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9844:  71%|█████████████████████████████████████▌               | 1294/1824 [12:57<05:25,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  71%|█████████████████████████████████████▋               | 1295/1824 [12:58<05:16,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8965:  71%|█████████████████████████████████████▋               | 1296/1824 [12:58<05:15,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8457:  71%|█████████████████████████████████████▋               | 1297/1824 [12:59<05:11,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  71%|█████████████████████████████████████▋               | 1298/1824 [12:59<05:11,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9512:  71%|█████████████████████████████████████▋               | 1299/1824 [13:00<05:10,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0430:  71%|█████████████████████████████████████▊               | 1300/1824 [13:01<05:08,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8594:  71%|█████████████████████████████████████▊               | 1301/1824 [13:01<04:59,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 3.2344:  71%|█████████████████████████████████████▊               | 1302/1824 [13:02<05:06,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  71%|█████████████████████████████████████▊               | 1303/1824 [13:02<05:11,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.5469:  71%|█████████████████████████████████████▉               | 1304/1824 [13:03<05:11,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:  72%|█████████████████████████████████████▉               | 1305/1824 [13:04<05:10,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  72%|█████████████████████████████████████▉               | 1306/1824 [13:04<05:09,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  72%|█████████████████████████████████████▉               | 1307/1824 [13:05<05:11,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9805:  72%|██████████████████████████████████████               | 1308/1824 [13:05<05:15,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  72%|██████████████████████████████████████               | 1309/1824 [13:06<05:18,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8066:  72%|██████████████████████████████████████               | 1310/1824 [13:07<05:10,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  72%|██████████████████████████████████████               | 1311/1824 [13:07<05:00,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6426:  72%|██████████████████████████████████████               | 1312/1824 [13:08<05:05,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  72%|██████████████████████████████████████▏              | 1313/1824 [13:08<05:02,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9160:  72%|██████████████████████████████████████▏              | 1314/1824 [13:09<04:57,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0820:  72%|██████████████████████████████████████▏              | 1315/1824 [13:09<04:54,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.7695:  72%|██████████████████████████████████████▏              | 1316/1824 [13:10<04:55,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.5918:  72%|██████████████████████████████████████▎              | 1317/1824 [13:11<04:50,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:  72%|██████████████████████████████████████▎              | 1318/1824 [13:11<04:47,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:  72%|██████████████████████████████████████▎              | 1319/1824 [13:12<04:51,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  72%|██████████████████████████████████████▎              | 1320/1824 [13:12<04:50,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  72%|██████████████████████████████████████▍              | 1321/1824 [13:13<04:58,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  72%|██████████████████████████████████████▍              | 1322/1824 [13:14<04:58,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  73%|██████████████████████████████████████▍              | 1323/1824 [13:14<04:57,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1445:  73%|██████████████████████████████████████▍              | 1324/1824 [13:15<04:53,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6953:  73%|██████████████████████████████████████▌              | 1325/1824 [13:15<04:53,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  73%|██████████████████████████████████████▌              | 1326/1824 [13:16<04:49,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.5156:  73%|██████████████████████████████████████▌              | 1327/1824 [13:17<04:54,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9102:  73%|██████████████████████████████████████▌              | 1328/1824 [13:17<04:56,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  73%|██████████████████████████████████████▌              | 1329/1824 [13:18<04:56,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  73%|██████████████████████████████████████▋              | 1330/1824 [13:18<04:57,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.1133:  73%|██████████████████████████████████████▋              | 1331/1824 [13:19<04:58,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  73%|██████████████████████████████████████▋              | 1332/1824 [13:20<04:51,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9941:  73%|██████████████████████████████████████▋              | 1333/1824 [13:20<04:49,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8594:  73%|██████████████████████████████████████▊              | 1334/1824 [13:21<04:57,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1816:  73%|██████████████████████████████████████▊              | 1335/1824 [13:21<04:57,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0020:  73%|██████████████████████████████████████▊              | 1336/1824 [13:22<04:52,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  73%|██████████████████████████████████████▊              | 1337/1824 [13:23<04:53,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  73%|██████████████████████████████████████▉              | 1338/1824 [13:23<04:48,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  73%|██████████████████████████████████████▉              | 1339/1824 [13:24<04:38,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7754:  73%|██████████████████████████████████████▉              | 1340/1824 [13:24<04:36,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.6172:  74%|██████████████████████████████████████▉              | 1341/1824 [13:25<04:36,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9355:  74%|██████████████████████████████████████▉              | 1342/1824 [13:25<04:35,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  74%|███████████████████████████████████████              | 1343/1824 [13:26<04:32,  1.77it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  74%|███████████████████████████████████████              | 1344/1824 [13:26<04:31,  1.77it/s]

cuda:0


Epoch 1/4, Loss: 3.0215:  74%|███████████████████████████████████████              | 1345/1824 [13:27<04:37,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  74%|███████████████████████████████████████              | 1346/1824 [13:28<04:40,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  74%|███████████████████████████████████████▏             | 1347/1824 [13:28<04:43,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6426:  74%|███████████████████████████████████████▏             | 1348/1824 [13:29<04:42,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.2656:  74%|███████████████████████████████████████▏             | 1349/1824 [13:29<04:41,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  74%|███████████████████████████████████████▏             | 1350/1824 [13:30<04:44,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  74%|███████████████████████████████████████▎             | 1351/1824 [13:31<04:38,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  74%|███████████████████████████████████████▎             | 1352/1824 [13:31<04:36,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1816:  74%|███████████████████████████████████████▎             | 1353/1824 [13:32<04:31,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.7930:  74%|███████████████████████████████████████▎             | 1354/1824 [13:32<04:37,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7617:  74%|███████████████████████████████████████▎             | 1355/1824 [13:33<04:33,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9180:  74%|███████████████████████████████████████▍             | 1356/1824 [13:34<04:32,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  74%|███████████████████████████████████████▍             | 1357/1824 [13:34<04:27,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.9297:  74%|███████████████████████████████████████▍             | 1358/1824 [13:35<04:27,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7910:  75%|███████████████████████████████████████▍             | 1359/1824 [13:35<04:28,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.6914:  75%|███████████████████████████████████████▌             | 1360/1824 [13:36<04:33,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  75%|███████████████████████████████████████▌             | 1361/1824 [13:37<04:42,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6758:  75%|███████████████████████████████████████▌             | 1362/1824 [13:37<04:40,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7832:  75%|███████████████████████████████████████▌             | 1363/1824 [13:38<04:40,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8711:  75%|███████████████████████████████████████▋             | 1364/1824 [13:38<04:36,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9512:  75%|███████████████████████████████████████▋             | 1365/1824 [13:39<04:28,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  75%|███████████████████████████████████████▋             | 1366/1824 [13:39<04:28,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  75%|███████████████████████████████████████▋             | 1367/1824 [13:40<04:23,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  75%|███████████████████████████████████████▊             | 1368/1824 [13:41<04:25,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0156:  75%|███████████████████████████████████████▊             | 1369/1824 [13:41<04:22,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.1543:  75%|███████████████████████████████████████▊             | 1370/1824 [13:42<04:26,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8145:  75%|███████████████████████████████████████▊             | 1371/1824 [13:42<04:25,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  75%|███████████████████████████████████████▊             | 1372/1824 [13:43<04:24,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  75%|███████████████████████████████████████▉             | 1373/1824 [13:44<04:18,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  75%|███████████████████████████████████████▉             | 1374/1824 [13:44<04:18,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  75%|███████████████████████████████████████▉             | 1375/1824 [13:45<04:22,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7910:  75%|███████████████████████████████████████▉             | 1376/1824 [13:45<04:23,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7988:  75%|████████████████████████████████████████             | 1377/1824 [13:46<04:24,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7559:  76%|████████████████████████████████████████             | 1378/1824 [13:46<04:21,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9258:  76%|████████████████████████████████████████             | 1379/1824 [13:47<04:20,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.6016:  76%|████████████████████████████████████████             | 1380/1824 [13:48<04:26,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  76%|████████████████████████████████████████▏            | 1381/1824 [13:48<04:24,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  76%|████████████████████████████████████████▏            | 1382/1824 [13:49<04:17,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  76%|████████████████████████████████████████▏            | 1383/1824 [13:49<04:18,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  76%|████████████████████████████████████████▏            | 1384/1824 [13:50<04:21,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  76%|████████████████████████████████████████▏            | 1385/1824 [13:51<04:22,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7910:  76%|████████████████████████████████████████▎            | 1386/1824 [13:51<04:20,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0312:  76%|████████████████████████████████████████▎            | 1387/1824 [13:52<04:29,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  76%|████████████████████████████████████████▎            | 1388/1824 [13:52<04:25,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.4023:  76%|████████████████████████████████████████▎            | 1389/1824 [13:53<04:24,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  76%|████████████████████████████████████████▍            | 1390/1824 [13:54<04:18,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  76%|████████████████████████████████████████▍            | 1391/1824 [13:54<04:19,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.5703:  76%|████████████████████████████████████████▍            | 1392/1824 [13:55<04:20,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  76%|████████████████████████████████████████▍            | 1393/1824 [13:55<04:14,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  76%|████████████████████████████████████████▌            | 1394/1824 [13:56<04:04,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 3.2617:  76%|████████████████████████████████████████▌            | 1395/1824 [13:57<04:04,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.8125:  77%|████████████████████████████████████████▌            | 1396/1824 [13:57<04:05,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.8066:  77%|████████████████████████████████████████▌            | 1397/1824 [13:58<04:06,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.1719:  77%|████████████████████████████████████████▌            | 1398/1824 [13:58<04:06,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  77%|████████████████████████████████████████▋            | 1399/1824 [13:59<04:06,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  77%|████████████████████████████████████████▋            | 1400/1824 [13:59<04:11,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.2227:  77%|████████████████████████████████████████▋            | 1401/1824 [14:00<04:08,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1094:  77%|████████████████████████████████████████▋            | 1402/1824 [14:01<04:08,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  77%|████████████████████████████████████████▊            | 1403/1824 [14:01<04:07,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9434:  77%|████████████████████████████████████████▊            | 1404/1824 [14:02<04:06,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0117:  77%|████████████████████████████████████████▊            | 1405/1824 [14:02<03:59,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.6816:  77%|████████████████████████████████████████▊            | 1406/1824 [14:03<04:00,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7402:  77%|████████████████████████████████████████▉            | 1407/1824 [14:04<03:57,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.6953:  77%|████████████████████████████████████████▉            | 1408/1824 [14:04<03:57,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:  77%|████████████████████████████████████████▉            | 1409/1824 [14:05<03:59,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.4180:  77%|████████████████████████████████████████▉            | 1410/1824 [14:05<03:54,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 3.1602:  77%|████████████████████████████████████████▉            | 1411/1824 [14:06<03:59,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9766:  77%|█████████████████████████████████████████            | 1412/1824 [14:06<03:59,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8594:  77%|█████████████████████████████████████████            | 1413/1824 [14:07<04:05,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  78%|█████████████████████████████████████████            | 1414/1824 [14:08<04:06,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2832:  78%|█████████████████████████████████████████            | 1415/1824 [14:08<03:59,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9121:  78%|█████████████████████████████████████████▏           | 1416/1824 [14:09<04:00,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:  78%|█████████████████████████████████████████▏           | 1417/1824 [14:09<03:58,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  78%|█████████████████████████████████████████▏           | 1418/1824 [14:10<03:57,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0000:  78%|█████████████████████████████████████████▏           | 1419/1824 [14:11<03:52,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7754:  78%|█████████████████████████████████████████▎           | 1420/1824 [14:11<03:51,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  78%|█████████████████████████████████████████▎           | 1421/1824 [14:12<03:51,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.6719:  78%|█████████████████████████████████████████▎           | 1422/1824 [14:12<03:47,  1.77it/s]

cuda:0


Epoch 1/4, Loss: 2.5664:  78%|█████████████████████████████████████████▎           | 1423/1824 [14:13<03:47,  1.77it/s]

cuda:0


Epoch 1/4, Loss: 3.0586:  78%|█████████████████████████████████████████▍           | 1424/1824 [14:13<03:49,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.7070:  78%|█████████████████████████████████████████▍           | 1425/1824 [14:14<03:49,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0977:  78%|█████████████████████████████████████████▍           | 1426/1824 [14:15<03:48,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.7031:  78%|█████████████████████████████████████████▍           | 1427/1824 [14:15<03:49,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  78%|█████████████████████████████████████████▍           | 1428/1824 [14:16<03:50,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.8926:  78%|█████████████████████████████████████████▌           | 1429/1824 [14:16<03:48,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  78%|█████████████████████████████████████████▌           | 1430/1824 [14:17<03:48,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.1758:  78%|█████████████████████████████████████████▌           | 1431/1824 [14:17<03:48,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  79%|█████████████████████████████████████████▌           | 1432/1824 [14:18<03:49,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0312:  79%|█████████████████████████████████████████▋           | 1433/1824 [14:19<03:49,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.1289:  79%|█████████████████████████████████████████▋           | 1434/1824 [14:19<03:50,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8945:  79%|█████████████████████████████████████████▋           | 1435/1824 [14:20<03:54,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  79%|█████████████████████████████████████████▋           | 1436/1824 [14:20<03:53,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  79%|█████████████████████████████████████████▊           | 1437/1824 [14:21<03:49,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1230:  79%|█████████████████████████████████████████▊           | 1438/1824 [14:22<03:46,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  79%|█████████████████████████████████████████▊           | 1439/1824 [14:22<03:50,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  79%|█████████████████████████████████████████▊           | 1440/1824 [14:23<03:48,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:  79%|█████████████████████████████████████████▊           | 1441/1824 [14:23<03:51,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2090:  79%|█████████████████████████████████████████▉           | 1442/1824 [14:24<03:50,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  79%|█████████████████████████████████████████▉           | 1443/1824 [14:25<03:51,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  79%|█████████████████████████████████████████▉           | 1444/1824 [14:25<03:49,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0410:  79%|█████████████████████████████████████████▉           | 1445/1824 [14:26<03:47,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7578:  79%|██████████████████████████████████████████           | 1446/1824 [14:26<03:44,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7754:  79%|██████████████████████████████████████████           | 1447/1824 [14:27<03:47,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9082:  79%|██████████████████████████████████████████           | 1448/1824 [14:28<03:43,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8262:  79%|██████████████████████████████████████████           | 1449/1824 [14:28<03:35,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 2.8047:  79%|██████████████████████████████████████████▏          | 1450/1824 [14:29<03:39,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9668:  80%|██████████████████████████████████████████▏          | 1451/1824 [14:29<03:37,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1211:  80%|██████████████████████████████████████████▏          | 1452/1824 [14:30<03:39,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  80%|██████████████████████████████████████████▏          | 1453/1824 [14:31<03:43,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.5781:  80%|██████████████████████████████████████████▏          | 1454/1824 [14:31<03:47,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.5039:  80%|██████████████████████████████████████████▎          | 1455/1824 [14:32<03:43,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.1582:  80%|██████████████████████████████████████████▎          | 1456/1824 [14:32<03:40,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7344:  80%|██████████████████████████████████████████▎          | 1457/1824 [14:33<03:43,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0762:  80%|██████████████████████████████████████████▎          | 1458/1824 [14:34<03:40,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  80%|██████████████████████████████████████████▍          | 1459/1824 [14:34<03:40,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  80%|██████████████████████████████████████████▍          | 1460/1824 [14:35<03:38,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  80%|██████████████████████████████████████████▍          | 1461/1824 [14:35<03:39,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6133:  80%|██████████████████████████████████████████▍          | 1462/1824 [14:36<03:37,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  80%|██████████████████████████████████████████▌          | 1463/1824 [14:37<03:29,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7793:  80%|██████████████████████████████████████████▌          | 1464/1824 [14:37<03:29,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7832:  80%|██████████████████████████████████████████▌          | 1465/1824 [14:38<03:30,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0020:  80%|██████████████████████████████████████████▌          | 1466/1824 [14:38<03:28,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7266:  80%|██████████████████████████████████████████▋          | 1467/1824 [14:39<03:32,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6133:  80%|██████████████████████████████████████████▋          | 1468/1824 [14:40<03:39,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7598:  81%|██████████████████████████████████████████▋          | 1469/1824 [14:40<03:37,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  81%|██████████████████████████████████████████▋          | 1470/1824 [14:41<03:38,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9395:  81%|██████████████████████████████████████████▋          | 1471/1824 [14:41<03:32,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  81%|██████████████████████████████████████████▊          | 1472/1824 [14:42<03:30,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  81%|██████████████████████████████████████████▊          | 1473/1824 [14:43<03:32,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7422:  81%|██████████████████████████████████████████▊          | 1474/1824 [14:43<03:26,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9043:  81%|██████████████████████████████████████████▊          | 1475/1824 [14:44<03:21,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.6055:  81%|██████████████████████████████████████████▉          | 1476/1824 [14:44<03:24,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  81%|██████████████████████████████████████████▉          | 1477/1824 [14:45<03:22,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7207:  81%|██████████████████████████████████████████▉          | 1478/1824 [14:45<03:23,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.7715:  81%|██████████████████████████████████████████▉          | 1479/1824 [14:46<03:25,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9844:  81%|███████████████████████████████████████████          | 1480/1824 [14:47<03:22,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:  81%|███████████████████████████████████████████          | 1481/1824 [14:47<03:23,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  81%|███████████████████████████████████████████          | 1482/1824 [14:48<03:24,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9395:  81%|███████████████████████████████████████████          | 1483/1824 [14:49<03:27,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6094:  81%|███████████████████████████████████████████          | 1484/1824 [14:49<03:30,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  81%|███████████████████████████████████████████▏         | 1485/1824 [14:50<03:31,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  81%|███████████████████████████████████████████▏         | 1486/1824 [14:50<03:24,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9023:  82%|███████████████████████████████████████████▏         | 1487/1824 [14:51<03:15,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.6562:  82%|███████████████████████████████████████████▏         | 1488/1824 [14:52<03:19,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1094:  82%|███████████████████████████████████████████▎         | 1489/1824 [14:52<03:20,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.4805:  82%|███████████████████████████████████████████▎         | 1490/1824 [14:53<03:21,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6543:  82%|███████████████████████████████████████████▎         | 1491/1824 [14:53<03:20,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  82%|███████████████████████████████████████████▎         | 1492/1824 [14:54<03:15,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0820:  82%|███████████████████████████████████████████▍         | 1493/1824 [14:54<03:16,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6562:  82%|███████████████████████████████████████████▍         | 1494/1824 [14:55<03:18,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:  82%|███████████████████████████████████████████▍         | 1495/1824 [14:56<03:25,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.6719:  82%|███████████████████████████████████████████▍         | 1496/1824 [14:56<03:32,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 3.1094:  82%|███████████████████████████████████████████▍         | 1497/1824 [14:57<03:25,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.6641:  82%|███████████████████████████████████████████▌         | 1498/1824 [14:58<03:18,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1953:  82%|███████████████████████████████████████████▌         | 1499/1824 [14:58<03:13,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  82%|███████████████████████████████████████████▌         | 1500/1824 [14:59<03:13,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  82%|███████████████████████████████████████████▌         | 1501/1824 [14:59<03:13,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  82%|███████████████████████████████████████████▋         | 1502/1824 [15:00<03:13,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  82%|███████████████████████████████████████████▋         | 1503/1824 [15:01<03:09,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9199:  82%|███████████████████████████████████████████▋         | 1504/1824 [15:01<03:15,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  83%|███████████████████████████████████████████▋         | 1505/1824 [15:02<03:16,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  83%|███████████████████████████████████████████▊         | 1506/1824 [15:02<03:12,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  83%|███████████████████████████████████████████▊         | 1507/1824 [15:03<03:12,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6934:  83%|███████████████████████████████████████████▊         | 1508/1824 [15:04<03:11,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8262:  83%|███████████████████████████████████████████▊         | 1509/1824 [15:04<03:06,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  83%|███████████████████████████████████████████▉         | 1510/1824 [15:05<03:04,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  83%|███████████████████████████████████████████▉         | 1511/1824 [15:05<03:05,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0723:  83%|███████████████████████████████████████████▉         | 1512/1824 [15:06<03:02,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.5898:  83%|███████████████████████████████████████████▉         | 1513/1824 [15:07<03:03,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.4258:  83%|███████████████████████████████████████████▉         | 1514/1824 [15:07<03:03,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  83%|████████████████████████████████████████████         | 1515/1824 [15:08<03:07,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6035:  83%|████████████████████████████████████████████         | 1516/1824 [15:08<03:11,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7539:  83%|████████████████████████████████████████████         | 1517/1824 [15:09<03:07,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.5664:  83%|████████████████████████████████████████████         | 1518/1824 [15:10<03:04,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.2090:  83%|████████████████████████████████████████████▏        | 1519/1824 [15:10<03:01,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0625:  83%|████████████████████████████████████████████▏        | 1520/1824 [15:11<03:00,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  83%|████████████████████████████████████████████▏        | 1521/1824 [15:11<03:02,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  83%|████████████████████████████████████████████▏        | 1522/1824 [15:12<03:02,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 3.0820:  83%|████████████████████████████████████████████▎        | 1523/1824 [15:13<02:58,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  84%|████████████████████████████████████████████▎        | 1524/1824 [15:13<02:59,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.5938:  84%|████████████████████████████████████████████▎        | 1525/1824 [15:14<02:58,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8203:  84%|████████████████████████████████████████████▎        | 1526/1824 [15:14<03:00,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0020:  84%|████████████████████████████████████████████▎        | 1527/1824 [15:15<02:58,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:  84%|████████████████████████████████████████████▍        | 1528/1824 [15:16<02:57,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.8984:  84%|████████████████████████████████████████████▍        | 1529/1824 [15:16<02:57,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  84%|████████████████████████████████████████████▍        | 1530/1824 [15:17<02:55,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.4961:  84%|████████████████████████████████████████████▍        | 1531/1824 [15:17<02:56,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  84%|████████████████████████████████████████████▌        | 1532/1824 [15:18<02:56,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  84%|████████████████████████████████████████████▌        | 1533/1824 [15:19<02:54,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  84%|████████████████████████████████████████████▌        | 1534/1824 [15:19<02:48,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:  84%|████████████████████████████████████████████▌        | 1535/1824 [15:20<02:48,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.2578:  84%|████████████████████████████████████████████▋        | 1536/1824 [15:20<02:49,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9199:  84%|████████████████████████████████████████████▋        | 1537/1824 [15:21<02:49,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9512:  84%|████████████████████████████████████████████▋        | 1538/1824 [15:22<02:47,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8887:  84%|████████████████████████████████████████████▋        | 1539/1824 [15:22<02:48,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.5781:  84%|████████████████████████████████████████████▋        | 1540/1824 [15:23<02:48,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.8359:  84%|████████████████████████████████████████████▊        | 1541/1824 [15:23<02:51,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  85%|████████████████████████████████████████████▊        | 1542/1824 [15:24<02:50,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7695:  85%|████████████████████████████████████████████▊        | 1543/1824 [15:25<02:47,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1055:  85%|████████████████████████████████████████████▊        | 1544/1824 [15:25<02:41,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  85%|████████████████████████████████████████████▉        | 1545/1824 [15:26<02:44,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.1152:  85%|████████████████████████████████████████████▉        | 1546/1824 [15:26<02:46,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9492:  85%|████████████████████████████████████████████▉        | 1547/1824 [15:27<02:47,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  85%|████████████████████████████████████████████▉        | 1548/1824 [15:28<02:45,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.1250:  85%|█████████████████████████████████████████████        | 1549/1824 [15:28<02:43,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9707:  85%|█████████████████████████████████████████████        | 1550/1824 [15:29<02:46,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8750:  85%|█████████████████████████████████████████████        | 1551/1824 [15:29<02:47,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0938:  85%|█████████████████████████████████████████████        | 1552/1824 [15:30<02:44,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5840:  85%|█████████████████████████████████████████████▏       | 1553/1824 [15:31<02:40,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.6328:  85%|█████████████████████████████████████████████▏       | 1554/1824 [15:31<02:38,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.5234:  85%|█████████████████████████████████████████████▏       | 1555/1824 [15:32<02:34,  1.74it/s]

cuda:0


Epoch 1/4, Loss: 3.0820:  85%|█████████████████████████████████████████████▏       | 1556/1824 [15:32<02:36,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.5273:  85%|█████████████████████████████████████████████▏       | 1557/1824 [15:33<02:40,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8125:  85%|█████████████████████████████████████████████▎       | 1558/1824 [15:33<02:41,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  85%|█████████████████████████████████████████████▎       | 1559/1824 [15:34<02:37,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1348:  86%|█████████████████████████████████████████████▎       | 1560/1824 [15:35<02:34,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.1992:  86%|█████████████████████████████████████████████▎       | 1561/1824 [15:35<02:32,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  86%|█████████████████████████████████████████████▍       | 1562/1824 [15:36<02:32,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  86%|█████████████████████████████████████████████▍       | 1563/1824 [15:36<02:32,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.9277:  86%|█████████████████████████████████████████████▍       | 1564/1824 [15:37<02:31,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.6992:  86%|█████████████████████████████████████████████▍       | 1565/1824 [15:38<02:34,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  86%|█████████████████████████████████████████████▌       | 1566/1824 [15:38<02:34,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.6660:  86%|█████████████████████████████████████████████▌       | 1567/1824 [15:39<02:31,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8594:  86%|█████████████████████████████████████████████▌       | 1568/1824 [15:39<02:28,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  86%|█████████████████████████████████████████████▌       | 1569/1824 [15:40<02:24,  1.76it/s]

cuda:0


Epoch 1/4, Loss: 2.7441:  86%|█████████████████████████████████████████████▌       | 1570/1824 [15:40<02:27,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  86%|█████████████████████████████████████████████▋       | 1571/1824 [15:41<02:26,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  86%|█████████████████████████████████████████████▋       | 1572/1824 [15:42<02:32,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  86%|█████████████████████████████████████████████▋       | 1573/1824 [15:42<02:30,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.7480:  86%|█████████████████████████████████████████████▋       | 1574/1824 [15:43<02:30,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6836:  86%|█████████████████████████████████████████████▊       | 1575/1824 [15:43<02:30,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.6621:  86%|█████████████████████████████████████████████▊       | 1576/1824 [15:44<02:26,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:  86%|█████████████████████████████████████████████▊       | 1577/1824 [15:45<02:28,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.6992:  87%|█████████████████████████████████████████████▊       | 1578/1824 [15:45<02:26,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.9727:  87%|█████████████████████████████████████████████▉       | 1579/1824 [15:46<02:24,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8672:  87%|█████████████████████████████████████████████▉       | 1580/1824 [15:46<02:19,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.9785:  87%|█████████████████████████████████████████████▉       | 1581/1824 [15:47<02:18,  1.75it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  87%|█████████████████████████████████████████████▉       | 1582/1824 [15:48<02:19,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.7715:  87%|█████████████████████████████████████████████▉       | 1583/1824 [15:48<02:21,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 3.0449:  87%|██████████████████████████████████████████████       | 1584/1824 [15:49<02:19,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 3.0664:  87%|██████████████████████████████████████████████       | 1585/1824 [15:49<02:18,  1.73it/s]

cuda:0


Epoch 1/4, Loss: 2.8789:  87%|██████████████████████████████████████████████       | 1586/1824 [15:50<02:18,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  87%|██████████████████████████████████████████████       | 1587/1824 [15:50<02:19,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7910:  87%|██████████████████████████████████████████████▏      | 1588/1824 [15:51<02:20,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 2.7676:  87%|██████████████████████████████████████████████▏      | 1589/1824 [15:52<02:20,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 3.0547:  87%|██████████████████████████████████████████████▏      | 1590/1824 [15:52<02:18,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.5605:  87%|██████████████████████████████████████████████▏      | 1591/1824 [15:53<02:17,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  87%|██████████████████████████████████████████████▎      | 1592/1824 [15:53<02:15,  1.72it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  87%|██████████████████████████████████████████████▎      | 1593/1824 [15:54<02:17,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.1094:  87%|██████████████████████████████████████████████▎      | 1594/1824 [15:55<02:16,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0996:  87%|██████████████████████████████████████████████▎      | 1595/1824 [15:55<02:16,  1.68it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  88%|██████████████████████████████████████████████▍      | 1596/1824 [15:56<02:14,  1.70it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  88%|██████████████████████████████████████████████▍      | 1597/1824 [15:56<02:15,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9531:  88%|██████████████████████████████████████████████▍      | 1598/1824 [15:57<02:13,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 3.2871:  88%|██████████████████████████████████████████████▍      | 1599/1824 [15:58<02:11,  1.71it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  88%|██████████████████████████████████████████████▍      | 1600/1824 [15:58<02:12,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.9902:  88%|██████████████████████████████████████████████▌      | 1601/1824 [15:59<02:12,  1.69it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  88%|██████████████████████████████████████████████▌      | 1602/1824 [15:59<02:14,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6836:  88%|██████████████████████████████████████████████▌      | 1603/1824 [16:00<02:12,  1.67it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  88%|██████████████████████████████████████████████▌      | 1604/1824 [16:01<02:13,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6250:  88%|██████████████████████████████████████████████▋      | 1605/1824 [16:01<02:12,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6836:  88%|██████████████████████████████████████████████▋      | 1606/1824 [16:02<02:13,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0859:  88%|██████████████████████████████████████████████▋      | 1607/1824 [16:02<02:15,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  88%|██████████████████████████████████████████████▋      | 1608/1824 [16:03<02:17,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  88%|██████████████████████████████████████████████▊      | 1609/1824 [16:04<02:15,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.2500:  88%|██████████████████████████████████████████████▊      | 1610/1824 [16:04<02:13,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7344:  88%|██████████████████████████████████████████████▊      | 1611/1824 [16:05<02:11,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1797:  88%|██████████████████████████████████████████████▊      | 1612/1824 [16:06<02:09,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0059:  88%|██████████████████████████████████████████████▊      | 1613/1824 [16:06<02:10,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8672:  88%|██████████████████████████████████████████████▉      | 1614/1824 [16:07<02:08,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8789:  89%|██████████████████████████████████████████████▉      | 1615/1824 [16:07<02:08,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  89%|██████████████████████████████████████████████▉      | 1616/1824 [16:08<02:09,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.7148:  89%|██████████████████████████████████████████████▉      | 1617/1824 [16:09<02:08,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9648:  89%|███████████████████████████████████████████████      | 1618/1824 [16:09<02:07,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  89%|███████████████████████████████████████████████      | 1619/1824 [16:10<02:04,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7070:  89%|███████████████████████████████████████████████      | 1620/1824 [16:11<02:06,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7598:  89%|███████████████████████████████████████████████      | 1621/1824 [16:11<02:05,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0156:  89%|███████████████████████████████████████████████▏     | 1622/1824 [16:12<02:05,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.1992:  89%|███████████████████████████████████████████████▏     | 1623/1824 [16:12<02:02,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6758:  89%|███████████████████████████████████████████████▏     | 1624/1824 [16:13<02:01,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5762:  89%|███████████████████████████████████████████████▏     | 1625/1824 [16:14<02:02,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  89%|███████████████████████████████████████████████▏     | 1626/1824 [16:14<02:00,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  89%|███████████████████████████████████████████████▎     | 1627/1824 [16:15<01:59,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.6758:  89%|███████████████████████████████████████████████▎     | 1628/1824 [16:15<02:00,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9785:  89%|███████████████████████████████████████████████▎     | 1629/1824 [16:16<01:58,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7852:  89%|███████████████████████████████████████████████▎     | 1630/1824 [16:17<01:59,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.5977:  89%|███████████████████████████████████████████████▍     | 1631/1824 [16:17<02:02,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  89%|███████████████████████████████████████████████▍     | 1632/1824 [16:18<02:02,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.6660:  90%|███████████████████████████████████████████████▍     | 1633/1824 [16:19<01:59,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:  90%|███████████████████████████████████████████████▍     | 1634/1824 [16:19<01:58,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  90%|███████████████████████████████████████████████▌     | 1635/1824 [16:20<01:58,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  90%|███████████████████████████████████████████████▌     | 1636/1824 [16:20<01:57,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.1367:  90%|███████████████████████████████████████████████▌     | 1637/1824 [16:21<01:56,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.9375:  90%|███████████████████████████████████████████████▌     | 1638/1824 [16:22<01:55,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1289:  90%|███████████████████████████████████████████████▌     | 1639/1824 [16:22<01:54,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0195:  90%|███████████████████████████████████████████████▋     | 1640/1824 [16:23<01:53,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  90%|███████████████████████████████████████████████▋     | 1641/1824 [16:24<01:57,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.9512:  90%|███████████████████████████████████████████████▋     | 1642/1824 [16:24<01:56,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.6348:  90%|███████████████████████████████████████████████▋     | 1643/1824 [16:25<01:55,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.7559:  90%|███████████████████████████████████████████████▊     | 1644/1824 [16:25<01:53,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.0586:  90%|███████████████████████████████████████████████▊     | 1645/1824 [16:26<01:52,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.9941:  90%|███████████████████████████████████████████████▊     | 1646/1824 [16:27<01:55,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 2.9102:  90%|███████████████████████████████████████████████▊     | 1647/1824 [16:27<01:55,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  90%|███████████████████████████████████████████████▉     | 1648/1824 [16:28<01:53,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.9883:  90%|███████████████████████████████████████████████▉     | 1649/1824 [16:29<01:51,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.8184:  90%|███████████████████████████████████████████████▉     | 1650/1824 [16:29<01:51,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  91%|███████████████████████████████████████████████▉     | 1651/1824 [16:30<01:49,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.1348:  91%|████████████████████████████████████████████████     | 1652/1824 [16:31<01:46,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.2656:  91%|████████████████████████████████████████████████     | 1653/1824 [16:31<01:45,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8008:  91%|████████████████████████████████████████████████     | 1654/1824 [16:32<01:44,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7988:  91%|████████████████████████████████████████████████     | 1655/1824 [16:32<01:45,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8574:  91%|████████████████████████████████████████████████     | 1656/1824 [16:33<01:42,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.9102:  91%|████████████████████████████████████████████████▏    | 1657/1824 [16:34<01:40,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.8301:  91%|████████████████████████████████████████████████▏    | 1658/1824 [16:34<01:40,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  91%|████████████████████████████████████████████████▏    | 1659/1824 [16:35<01:43,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.1641:  91%|████████████████████████████████████████████████▏    | 1660/1824 [16:36<01:43,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  91%|████████████████████████████████████████████████▎    | 1661/1824 [16:36<01:41,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.6602:  91%|████████████████████████████████████████████████▎    | 1662/1824 [16:37<01:45,  1.53it/s]

cuda:0


Epoch 1/4, Loss: 2.6602:  91%|████████████████████████████████████████████████▎    | 1663/1824 [16:38<01:47,  1.50it/s]

cuda:0


Epoch 1/4, Loss: 2.7812:  91%|████████████████████████████████████████████████▎    | 1664/1824 [16:38<01:44,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  91%|████████████████████████████████████████████████▍    | 1665/1824 [16:39<01:42,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.7461:  91%|████████████████████████████████████████████████▍    | 1666/1824 [16:39<01:40,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.8477:  91%|████████████████████████████████████████████████▍    | 1667/1824 [16:40<01:39,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.8145:  91%|████████████████████████████████████████████████▍    | 1668/1824 [16:41<01:37,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  92%|████████████████████████████████████████████████▍    | 1669/1824 [16:41<01:35,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9395:  92%|████████████████████████████████████████████████▌    | 1670/1824 [16:42<01:36,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8672:  92%|████████████████████████████████████████████████▌    | 1671/1824 [16:42<01:34,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  92%|████████████████████████████████████████████████▌    | 1672/1824 [16:43<01:32,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  92%|████████████████████████████████████████████████▌    | 1673/1824 [16:44<01:32,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.0527:  92%|████████████████████████████████████████████████▋    | 1674/1824 [16:44<01:32,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1133:  92%|████████████████████████████████████████████████▋    | 1675/1824 [16:45<01:31,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.6055:  92%|████████████████████████████████████████████████▋    | 1676/1824 [16:46<01:31,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.5820:  92%|████████████████████████████████████████████████▋    | 1677/1824 [16:46<01:30,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.2598:  92%|████████████████████████████████████████████████▊    | 1678/1824 [16:47<01:28,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  92%|████████████████████████████████████████████████▊    | 1679/1824 [16:47<01:28,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9102:  92%|████████████████████████████████████████████████▊    | 1680/1824 [16:48<01:31,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.4922:  92%|████████████████████████████████████████████████▊    | 1681/1824 [16:49<01:31,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.5605:  92%|████████████████████████████████████████████████▊    | 1682/1824 [16:49<01:29,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  92%|████████████████████████████████████████████████▉    | 1683/1824 [16:50<01:28,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.7422:  92%|████████████████████████████████████████████████▉    | 1684/1824 [16:51<01:28,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.5410:  92%|████████████████████████████████████████████████▉    | 1685/1824 [16:51<01:27,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.0449:  92%|████████████████████████████████████████████████▉    | 1686/1824 [16:52<01:26,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 3.1973:  92%|█████████████████████████████████████████████████    | 1687/1824 [16:52<01:24,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7871:  93%|█████████████████████████████████████████████████    | 1688/1824 [16:53<01:24,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0273:  93%|█████████████████████████████████████████████████    | 1689/1824 [16:54<01:24,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  93%|█████████████████████████████████████████████████    | 1690/1824 [16:54<01:25,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  93%|█████████████████████████████████████████████████▏   | 1691/1824 [16:55<01:24,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.0430:  93%|█████████████████████████████████████████████████▏   | 1692/1824 [16:56<01:25,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.9062:  93%|█████████████████████████████████████████████████▏   | 1693/1824 [16:56<01:28,  1.49it/s]

cuda:0


Epoch 1/4, Loss: 2.6055:  93%|█████████████████████████████████████████████████▏   | 1694/1824 [16:57<01:25,  1.51it/s]

cuda:0


Epoch 1/4, Loss: 2.5859:  93%|█████████████████████████████████████████████████▎   | 1695/1824 [16:58<01:23,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 2.8633:  93%|█████████████████████████████████████████████████▎   | 1696/1824 [16:58<01:20,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  93%|█████████████████████████████████████████████████▎   | 1697/1824 [16:59<01:19,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.6367:  93%|█████████████████████████████████████████████████▎   | 1698/1824 [16:59<01:19,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.9707:  93%|█████████████████████████████████████████████████▎   | 1699/1824 [17:00<01:17,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7832:  93%|█████████████████████████████████████████████████▍   | 1700/1824 [17:01<01:18,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.0059:  93%|█████████████████████████████████████████████████▍   | 1701/1824 [17:01<01:15,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7148:  93%|█████████████████████████████████████████████████▍   | 1702/1824 [17:02<01:15,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1172:  93%|█████████████████████████████████████████████████▍   | 1703/1824 [17:03<01:14,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8008:  93%|█████████████████████████████████████████████████▌   | 1704/1824 [17:03<01:13,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7227:  93%|█████████████████████████████████████████████████▌   | 1705/1824 [17:04<01:13,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  94%|█████████████████████████████████████████████████▌   | 1706/1824 [17:04<01:14,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.6641:  94%|█████████████████████████████████████████████████▌   | 1707/1824 [17:05<01:11,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1445:  94%|█████████████████████████████████████████████████▋   | 1708/1824 [17:06<01:11,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8086:  94%|█████████████████████████████████████████████████▋   | 1709/1824 [17:06<01:10,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7188:  94%|█████████████████████████████████████████████████▋   | 1710/1824 [17:07<01:09,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.8398:  94%|█████████████████████████████████████████████████▋   | 1711/1824 [17:07<01:09,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9336:  94%|█████████████████████████████████████████████████▋   | 1712/1824 [17:08<01:08,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  94%|█████████████████████████████████████████████████▊   | 1713/1824 [17:09<01:07,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 3.1836:  94%|█████████████████████████████████████████████████▊   | 1714/1824 [17:09<01:06,  1.65it/s]

cuda:0


Epoch 1/4, Loss: 2.5605:  94%|█████████████████████████████████████████████████▊   | 1715/1824 [17:10<01:06,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1719:  94%|█████████████████████████████████████████████████▊   | 1716/1824 [17:11<01:06,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.5938:  94%|█████████████████████████████████████████████████▉   | 1717/1824 [17:11<01:06,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.6699:  94%|█████████████████████████████████████████████████▉   | 1718/1824 [17:12<01:05,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1562:  94%|█████████████████████████████████████████████████▉   | 1719/1824 [17:12<01:04,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.1680:  94%|█████████████████████████████████████████████████▉   | 1720/1824 [17:13<01:04,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8828:  94%|██████████████████████████████████████████████████   | 1721/1824 [17:14<01:08,  1.49it/s]

cuda:0


Epoch 1/4, Loss: 2.7266:  94%|██████████████████████████████████████████████████   | 1722/1824 [17:15<01:16,  1.33it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  94%|██████████████████████████████████████████████████   | 1723/1824 [17:15<01:14,  1.36it/s]

cuda:0


Epoch 1/4, Loss: 2.7695:  95%|██████████████████████████████████████████████████   | 1724/1824 [17:16<01:13,  1.35it/s]

cuda:0


Epoch 1/4, Loss: 3.0664:  95%|██████████████████████████████████████████████████   | 1725/1824 [17:17<01:11,  1.39it/s]

cuda:0


Epoch 1/4, Loss: 2.7676:  95%|██████████████████████████████████████████████████▏  | 1726/1824 [17:18<01:10,  1.39it/s]

cuda:0


Epoch 1/4, Loss: 2.8164:  95%|██████████████████████████████████████████████████▏  | 1727/1824 [17:18<01:10,  1.37it/s]

cuda:0


Epoch 1/4, Loss: 3.0078:  95%|██████████████████████████████████████████████████▏  | 1728/1824 [17:19<01:10,  1.36it/s]

cuda:0


Epoch 1/4, Loss: 2.7891:  95%|██████████████████████████████████████████████████▏  | 1729/1824 [17:20<01:07,  1.41it/s]

cuda:0


Epoch 1/4, Loss: 2.9688:  95%|██████████████████████████████████████████████████▎  | 1730/1824 [17:20<01:04,  1.47it/s]

cuda:0


Epoch 1/4, Loss: 3.2520:  95%|██████████████████████████████████████████████████▎  | 1731/1824 [17:21<01:02,  1.50it/s]

cuda:0


Epoch 1/4, Loss: 2.9395:  95%|██████████████████████████████████████████████████▎  | 1732/1824 [17:22<00:59,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 3.0039:  95%|██████████████████████████████████████████████████▎  | 1733/1824 [17:23<01:15,  1.21it/s]

cuda:0


Epoch 1/4, Loss: 2.9609:  95%|██████████████████████████████████████████████████▍  | 1734/1824 [17:24<01:16,  1.17it/s]

cuda:0


Epoch 1/4, Loss: 3.0840:  95%|██████████████████████████████████████████████████▍  | 1735/1824 [17:25<01:13,  1.22it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  95%|██████████████████████████████████████████████████▍  | 1736/1824 [17:25<01:09,  1.27it/s]

cuda:0


Epoch 1/4, Loss: 2.6934:  95%|██████████████████████████████████████████████████▍  | 1737/1824 [17:26<01:07,  1.29it/s]

cuda:0


Epoch 1/4, Loss: 2.7148:  95%|██████████████████████████████████████████████████▌  | 1738/1824 [17:27<01:07,  1.27it/s]

cuda:0


Epoch 1/4, Loss: 2.8301:  95%|██████████████████████████████████████████████████▌  | 1739/1824 [17:28<01:06,  1.27it/s]

cuda:0


Epoch 1/4, Loss: 2.7734:  95%|██████████████████████████████████████████████████▌  | 1740/1824 [17:28<01:05,  1.27it/s]

cuda:0


Epoch 1/4, Loss: 3.0195:  95%|██████████████████████████████████████████████████▌  | 1741/1824 [17:29<01:04,  1.29it/s]

cuda:0


Epoch 1/4, Loss: 2.9004:  96%|██████████████████████████████████████████████████▌  | 1742/1824 [17:30<01:02,  1.32it/s]

cuda:0


Epoch 1/4, Loss: 3.2598:  96%|██████████████████████████████████████████████████▋  | 1743/1824 [17:30<00:57,  1.40it/s]

cuda:0


Epoch 1/4, Loss: 2.9453:  96%|██████████████████████████████████████████████████▋  | 1744/1824 [17:31<00:56,  1.41it/s]

cuda:0


Epoch 1/4, Loss: 2.9941:  96%|██████████████████████████████████████████████████▋  | 1745/1824 [17:32<00:54,  1.46it/s]

cuda:0


Epoch 1/4, Loss: 2.8867:  96%|██████████████████████████████████████████████████▋  | 1746/1824 [17:32<00:54,  1.43it/s]

cuda:0


Epoch 1/4, Loss: 2.8242:  96%|██████████████████████████████████████████████████▊  | 1747/1824 [17:33<00:51,  1.48it/s]

cuda:0


Epoch 1/4, Loss: 2.7363:  96%|██████████████████████████████████████████████████▊  | 1748/1824 [17:34<00:52,  1.45it/s]

cuda:0


Epoch 1/4, Loss: 2.9219:  96%|██████████████████████████████████████████████████▊  | 1749/1824 [17:34<00:50,  1.48it/s]

cuda:0


Epoch 1/4, Loss: 3.0352:  96%|██████████████████████████████████████████████████▊  | 1750/1824 [17:35<00:52,  1.42it/s]

cuda:0


Epoch 1/4, Loss: 2.9121:  96%|██████████████████████████████████████████████████▉  | 1751/1824 [17:36<00:51,  1.43it/s]

cuda:0


Epoch 1/4, Loss: 3.0469:  96%|██████████████████████████████████████████████████▉  | 1752/1824 [17:37<00:49,  1.44it/s]

cuda:0


Epoch 1/4, Loss: 3.1328:  96%|██████████████████████████████████████████████████▉  | 1753/1824 [17:38<01:08,  1.03it/s]

cuda:0


Epoch 1/4, Loss: 2.9141:  96%|██████████████████████████████████████████████████▉  | 1754/1824 [17:39<01:03,  1.11it/s]

cuda:0


Epoch 1/4, Loss: 2.7266:  96%|██████████████████████████████████████████████████▉  | 1755/1824 [17:40<00:57,  1.20it/s]

cuda:0


Epoch 1/4, Loss: 2.9102:  96%|███████████████████████████████████████████████████  | 1756/1824 [17:40<00:52,  1.30it/s]

cuda:0


Epoch 1/4, Loss: 2.8516:  96%|███████████████████████████████████████████████████  | 1757/1824 [17:41<00:48,  1.38it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  96%|███████████████████████████████████████████████████  | 1758/1824 [17:42<00:47,  1.40it/s]

cuda:0


Epoch 1/4, Loss: 2.8535:  96%|███████████████████████████████████████████████████  | 1759/1824 [17:42<00:46,  1.41it/s]

cuda:0


Epoch 1/4, Loss: 2.7500:  96%|███████████████████████████████████████████████████▏ | 1760/1824 [17:43<00:44,  1.42it/s]

cuda:0


Epoch 1/4, Loss: 3.0391:  97%|███████████████████████████████████████████████████▏ | 1761/1824 [17:44<00:42,  1.48it/s]

cuda:0


Epoch 1/4, Loss: 3.1074:  97%|███████████████████████████████████████████████████▏ | 1762/1824 [17:44<00:41,  1.49it/s]

cuda:0


Epoch 1/4, Loss: 3.1328:  97%|███████████████████████████████████████████████████▏ | 1763/1824 [17:45<00:40,  1.51it/s]

cuda:0


Epoch 1/4, Loss: 2.9785:  97%|███████████████████████████████████████████████████▎ | 1764/1824 [17:46<00:39,  1.51it/s]

cuda:0


Epoch 1/4, Loss: 2.7715:  97%|███████████████████████████████████████████████████▎ | 1765/1824 [17:46<00:38,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 2.6523:  97%|███████████████████████████████████████████████████▎ | 1766/1824 [17:47<00:37,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 3.2012:  97%|███████████████████████████████████████████████████▎ | 1767/1824 [17:47<00:36,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.8672:  97%|███████████████████████████████████████████████████▎ | 1768/1824 [17:48<00:35,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.0898:  97%|███████████████████████████████████████████████████▍ | 1769/1824 [17:49<00:34,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.1562:  97%|███████████████████████████████████████████████████▍ | 1770/1824 [17:49<00:34,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.8320:  97%|███████████████████████████████████████████████████▍ | 1771/1824 [17:50<00:33,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.6836:  97%|███████████████████████████████████████████████████▍ | 1772/1824 [17:51<00:34,  1.52it/s]

cuda:0


Epoch 1/4, Loss: 2.8125:  97%|███████████████████████████████████████████████████▌ | 1773/1824 [17:51<00:33,  1.51it/s]

cuda:0


Epoch 1/4, Loss: 3.0312:  97%|███████████████████████████████████████████████████▌ | 1774/1824 [17:52<00:32,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 3.2109:  97%|███████████████████████████████████████████████████▌ | 1775/1824 [17:53<00:31,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.7422:  97%|███████████████████████████████████████████████████▌ | 1776/1824 [17:53<00:30,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.8965:  97%|███████████████████████████████████████████████████▋ | 1777/1824 [17:54<00:29,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8496:  97%|███████████████████████████████████████████████████▋ | 1778/1824 [17:54<00:29,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  98%|███████████████████████████████████████████████████▋ | 1779/1824 [17:55<00:28,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 3.2188:  98%|███████████████████████████████████████████████████▋ | 1780/1824 [17:56<00:28,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 2.9746:  98%|███████████████████████████████████████████████████▊ | 1781/1824 [17:56<00:27,  1.54it/s]

cuda:0


Epoch 1/4, Loss: 2.8613:  98%|███████████████████████████████████████████████████▊ | 1782/1824 [17:57<00:27,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.8281:  98%|███████████████████████████████████████████████████▊ | 1783/1824 [17:58<00:25,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 2.8457:  98%|███████████████████████████████████████████████████▊ | 1784/1824 [17:58<00:25,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8906:  98%|███████████████████████████████████████████████████▊ | 1785/1824 [17:59<00:24,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 3.1113:  98%|███████████████████████████████████████████████████▉ | 1786/1824 [17:59<00:23,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.7012:  98%|███████████████████████████████████████████████████▉ | 1787/1824 [18:00<00:23,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.8672:  98%|███████████████████████████████████████████████████▉ | 1788/1824 [18:01<00:22,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.8340:  98%|███████████████████████████████████████████████████▉ | 1789/1824 [18:01<00:21,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.3750:  98%|████████████████████████████████████████████████████ | 1790/1824 [18:02<00:21,  1.58it/s]

cuda:0


Epoch 1/4, Loss: 3.1367:  98%|████████████████████████████████████████████████████ | 1791/1824 [18:03<00:21,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.5254:  98%|████████████████████████████████████████████████████ | 1792/1824 [18:03<00:20,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.7852:  98%|████████████████████████████████████████████████████ | 1793/1824 [18:04<00:20,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.9570:  98%|████████████████████████████████████████████████████▏| 1794/1824 [18:05<00:19,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.9512:  98%|████████████████████████████████████████████████████▏| 1795/1824 [18:05<00:18,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.9961:  98%|████████████████████████████████████████████████████▏| 1796/1824 [18:06<00:17,  1.59it/s]

cuda:0


Epoch 1/4, Loss: 2.7305:  99%|████████████████████████████████████████████████████▏| 1797/1824 [18:07<00:17,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.7969:  99%|████████████████████████████████████████████████████▏| 1798/1824 [18:07<00:16,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.4297:  99%|████████████████████████████████████████████████████▎| 1799/1824 [18:08<00:16,  1.55it/s]

cuda:0


Epoch 1/4, Loss: 2.8848:  99%|████████████████████████████████████████████████████▎| 1800/1824 [18:08<00:15,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.7031:  99%|████████████████████████████████████████████████████▎| 1801/1824 [18:09<00:14,  1.56it/s]

cuda:0


Epoch 1/4, Loss: 2.6406:  99%|████████████████████████████████████████████████████▎| 1802/1824 [18:10<00:14,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 3.0098:  99%|████████████████████████████████████████████████████▍| 1803/1824 [18:10<00:13,  1.57it/s]

cuda:0


Epoch 1/4, Loss: 2.8789:  99%|████████████████████████████████████████████████████▍| 1804/1824 [18:11<00:12,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.6914:  99%|████████████████████████████████████████████████████▍| 1805/1824 [18:12<00:11,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7656:  99%|████████████████████████████████████████████████████▍| 1806/1824 [18:12<00:11,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.9414:  99%|████████████████████████████████████████████████████▌| 1807/1824 [18:13<00:10,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8340:  99%|████████████████████████████████████████████████████▌| 1808/1824 [18:13<00:09,  1.66it/s]

cuda:0


Epoch 1/4, Loss: 2.8555:  99%|████████████████████████████████████████████████████▌| 1809/1824 [18:14<00:09,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 2.8438:  99%|████████████████████████████████████████████████████▌| 1810/1824 [18:15<00:08,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.0781:  99%|████████████████████████████████████████████████████▌| 1811/1824 [18:15<00:08,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.7402:  99%|████████████████████████████████████████████████████▋| 1812/1824 [18:16<00:07,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7383:  99%|████████████████████████████████████████████████████▋| 1813/1824 [18:16<00:06,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 3.0703:  99%|████████████████████████████████████████████████████▋| 1814/1824 [18:17<00:06,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 3.0977: 100%|████████████████████████████████████████████████████▋| 1815/1824 [18:18<00:05,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.9727: 100%|████████████████████████████████████████████████████▊| 1816/1824 [18:18<00:04,  1.61it/s]

cuda:0


Epoch 1/4, Loss: 2.7695: 100%|████████████████████████████████████████████████████▊| 1817/1824 [18:19<00:04,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.8906: 100%|████████████████████████████████████████████████████▊| 1818/1824 [18:20<00:03,  1.60it/s]

cuda:0


Epoch 1/4, Loss: 2.9375: 100%|████████████████████████████████████████████████████▊| 1819/1824 [18:20<00:03,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 3.1230: 100%|████████████████████████████████████████████████████▉| 1820/1824 [18:21<00:02,  1.62it/s]

cuda:0


Epoch 1/4, Loss: 2.6758: 100%|████████████████████████████████████████████████████▉| 1821/1824 [18:21<00:01,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 2.6504: 100%|████████████████████████████████████████████████████▉| 1822/1824 [18:22<00:01,  1.64it/s]

cuda:0


Epoch 1/4, Loss: 1.6914: 100%|████████████████████████████████████████████████████▉| 1823/1824 [18:23<00:00,  1.63it/s]

cuda:0


Epoch 1/4, Loss: 1.6914: 100%|█████████████████████████████████████████████████████| 1824/1824 [18:23<00:00,  1.65it/s]
  0%|                                                                                         | 0/1824 [00:00<?, ?it/s]

cuda:0


Epoch 2/4, Loss: 3.1621:   0%|                                                        | 1/1824 [00:00<19:05,  1.59it/s]

cuda:0


Epoch 2/4, Loss: 2.8223:   0%|                                                        | 2/1824 [00:01<18:37,  1.63it/s]

cuda:0


Epoch 2/4, Loss: 2.8789:   0%|                                                        | 3/1824 [00:01<18:30,  1.64it/s]

cuda:0


Epoch 2/4, Loss: 3.0117:   0%|                                                        | 4/1824 [00:02<18:46,  1.61it/s]

cuda:0


Epoch 2/4, Loss: 2.8672:   0%|▏                                                       | 5/1824 [00:03<18:59,  1.60it/s]

cuda:0


Epoch 2/4, Loss: 3.0078:   0%|▏                                                       | 6/1824 [00:03<19:22,  1.56it/s]

cuda:0


Epoch 2/4, Loss: 2.6367:   0%|▏                                                       | 7/1824 [00:04<19:19,  1.57it/s]

cuda:0


Epoch 2/4, Loss: 2.8594:   0%|▏                                                       | 8/1824 [00:05<19:17,  1.57it/s]

cuda:0


Epoch 2/4, Loss: 2.8105:   0%|▎                                                       | 9/1824 [00:05<19:08,  1.58it/s]

cuda:0


Epoch 2/4, Loss: 3.1797:   1%|▎                                                      | 10/1824 [00:06<18:52,  1.60it/s]

cuda:0


Epoch 2/4, Loss: 3.1250:   1%|▎                                                      | 11/1824 [00:06<18:48,  1.61it/s]

cuda:0


Epoch 2/4, Loss: 2.8047:   1%|▎                                                      | 12/1824 [00:07<18:39,  1.62it/s]

cuda:0


Epoch 2/4, Loss: 3.1016:   1%|▍                                                      | 13/1824 [00:08<18:21,  1.64it/s]

cuda:0


Epoch 2/4, Loss: 2.8574:   1%|▍                                                      | 14/1824 [00:08<18:22,  1.64it/s]

cuda:0


Epoch 2/4, Loss: 2.8262:   1%|▍                                                      | 15/1824 [00:09<18:19,  1.64it/s]

cuda:0


Epoch 2/4, Loss: 2.7344:   1%|▍                                                      | 16/1824 [00:09<18:05,  1.66it/s]

cuda:0


Epoch 2/4, Loss: 2.8203:   1%|▌                                                      | 17/1824 [00:10<17:56,  1.68it/s]

cuda:0


Epoch 2/4, Loss: 2.6758:   1%|▌                                                      | 18/1824 [00:11<17:43,  1.70it/s]

cuda:0


Epoch 2/4, Loss: 2.5820:   1%|▌                                                      | 19/1824 [00:11<17:30,  1.72it/s]

cuda:0


Epoch 2/4, Loss: 2.7734:   1%|▌                                                      | 20/1824 [00:12<17:37,  1.71it/s]

cuda:0


Epoch 2/4, Loss: 2.6738:   1%|▋                                                      | 21/1824 [00:12<17:59,  1.67it/s]

cuda:0


Epoch 2/4, Loss: 3.0312:   1%|▋                                                      | 22/1824 [00:13<18:08,  1.66it/s]

cuda:0


Epoch 2/4, Loss: 2.9023:   1%|▋                                                      | 23/1824 [00:14<18:02,  1.66it/s]

cuda:0


Epoch 2/4, Loss: 2.9434:   1%|▋                                                      | 24/1824 [00:14<18:06,  1.66it/s]

cuda:0


Epoch 2/4, Loss: 2.7617:   1%|▊                                                      | 25/1824 [00:15<18:03,  1.66it/s]

cuda:0


Epoch 2/4, Loss: 2.8340:   1%|▊                                                      | 26/1824 [00:15<18:16,  1.64it/s]

cuda:0


Epoch 2/4, Loss: 3.0410:   1%|▊                                                      | 27/1824 [00:16<18:11,  1.65it/s]

cuda:0


Epoch 2/4, Loss: 2.7461:   2%|▊                                                      | 28/1824 [00:17<18:00,  1.66it/s]

cuda:0


Epoch 2/4, Loss: 2.7656:   2%|▊                                                      | 29/1824 [00:17<18:09,  1.65it/s]

cuda:0


Epoch 2/4, Loss: 2.6992:   2%|▉                                                      | 30/1824 [00:18<18:36,  1.61it/s]

cuda:0


Epoch 2/4, Loss: 2.8145:   2%|▉                                                      | 31/1824 [00:19<19:22,  1.54it/s]

cuda:0


Epoch 2/4, Loss: 2.7637:   2%|▉                                                      | 32/1824 [00:19<19:30,  1.53it/s]

cuda:0


Epoch 2/4, Loss: 2.9570:   2%|▉                                                      | 33/1824 [00:20<19:32,  1.53it/s]

cuda:0


Epoch 2/4, Loss: 3.1250:   2%|█                                                      | 34/1824 [00:20<19:10,  1.56it/s]

cuda:0


Epoch 2/4, Loss: 2.8926:   2%|█                                                      | 35/1824 [00:21<18:49,  1.58it/s]

cuda:0


Epoch 2/4, Loss: 2.8926:   2%|█                                                      | 35/1824 [00:22<18:57,  1.57it/s]


KeyboardInterrupt: 