In [1]:
import os

# Restrict PyTorch to only see GPU 0
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
import torch

if torch.cuda.is_available():
    print(f"Number of GPUs available: {torch.cuda.device_count()}")
    for i in range(torch.cuda.device_count()):
        print(f"GPU {i}: {torch.cuda.get_device_name(i)}")
else:
    print("CUDA is not available, using CPU.")
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")

Number of GPUs available: 1
GPU 0: NVIDIA L40S
Using device: cuda:0


In [2]:
from spatialvla.mobilevlm.model.diffusion_heads import DiffusionActionHead
import torch
import torch.optim as optim
from tqdm import tqdm
import torch
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
from tqdm import tqdm
import wandb
from einops import rearrange
from spatialvla.mobilevlm.model.diffusion_heads import DiffusionActionHead, FourierFeatures
DiffusionHead = {
    'head_type': 'Diffusion',
    'hidden_projection': 'pass',
    'use_map' : True,
    'max_action': 5.0,
    'loss_type': 'mse',
    'time_dim':  32,
    'num_blocks': 3,
    'dropout_rate': 0.0,
    'hidden_dim': 1024,
    'use_layer_norm':True,
    'diffusion_steps': 100,
    'n_diffusion_samples': 1,
}

In [3]:
model = DiffusionActionHead(in_dim=32, action_dim=28*28, head_args=DiffusionHead).cuda()

In [4]:
total_params = sum(p.numel() for p in model.parameters())
print(f"Total number of parameters: {total_params/1000000}million")

Total number of parameters: 31.075584million


In [5]:
import numpy as np
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,)),  # Normalize to [-1, 1] for MNIST
    transforms.Lambda(lambda x: x.view(-1))  # Flatten the image to (784,)
])
batch_size = 2048
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)

In [6]:
epochs = 1000
learning_rate = 1e-4
from transformers import get_cosine_schedule_with_warmup

# Assuming `optimizer` is defined

# Optimizer
optimizer = optim.AdamW(model.parameters(), lr=learning_rate, weight_decay=0.1)
fourier_encoder = FourierFeatures(output_size=32, learnable=False).cuda()
num_warmup_ratio = 0.06  # Adjust based on model size and data
num_training_steps = int(epochs * len(train_loader))
scheduler = get_cosine_schedule_with_warmup(
    optimizer,
    num_warmup_steps=int(num_training_steps * num_warmup_ratio),
    num_training_steps=num_training_steps
)

2024-11-14 21:00:22.248992: I tensorflow/core/util/port.cc:113] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2024-11-14 21:00:22.276999: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:9261] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2024-11-14 21:00:22.277041: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:607] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2024-11-14 21:00:22.277787: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1515] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
2024-11-14 21:00:22.282542: I tensorflow/core/platform/cpu_feature_guar

In [None]:
model.train()
# Training loop
for epoch in range(epochs):
    model.train()     
    optimizer.zero_grad()
    for batch_idx, (images, labels) in enumerate(tqdm(train_loader, desc=f"Epoch {epoch+1}/{epochs}")):
        # with torch.autocast(device_type='cuda', dtype=torch.float16):
        images = images.cuda()
        labels = labels.cuda()
        labels_encoded = fourier_encoder(labels.float().view(-1, 1, 1))
        loss = model.loss(labels_encoded, images.unsqueeze(1))
        loss.backward()
        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)
        optimizer.step()
        scheduler.step()
    current_lr = scheduler.get_last_lr()[0]
    print(f"Current learning rate = {current_lr}")
    print(loss)

Epoch 1/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:06<00:00,  4.89it/s]


Current learning rate = 1.6666666666666667e-06
tensor(1.0156, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 2/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.33it/s]


Current learning rate = 3.3333333333333333e-06
tensor(1.0061, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 3/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.04it/s]


Current learning rate = 5e-06
tensor(0.9995, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 4/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 6.666666666666667e-06
tensor(0.9912, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 5/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.02it/s]


Current learning rate = 8.333333333333334e-06
tensor(0.9757, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 6/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.15it/s]


Current learning rate = 1e-05
tensor(0.9537, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 7/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.02it/s]


Current learning rate = 1.1666666666666668e-05
tensor(0.9298, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 8/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.04it/s]


Current learning rate = 1.3333333333333333e-05
tensor(0.8948, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 9/1000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 1.5e-05
tensor(0.8728, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 10/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.04it/s]


Current learning rate = 1.6666666666666667e-05
tensor(0.8434, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 11/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 1.8333333333333333e-05
tensor(0.8291, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 12/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.03it/s]


Current learning rate = 2e-05
tensor(0.8147, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 13/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 2.1666666666666667e-05
tensor(0.7932, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 14/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 2.3333333333333336e-05
tensor(0.7778, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 15/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.07it/s]


Current learning rate = 2.5e-05
tensor(0.7733, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 16/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.12it/s]


Current learning rate = 2.6666666666666667e-05
tensor(0.7546, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 17/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.24it/s]


Current learning rate = 2.8333333333333335e-05
tensor(0.7366, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 18/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 3e-05
tensor(0.7386, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 19/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 3.1666666666666666e-05
tensor(0.7236, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 20/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 3.3333333333333335e-05
tensor(0.7058, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 21/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 3.5e-05
tensor(0.6922, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 22/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 3.6666666666666666e-05
tensor(0.6873, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 23/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.15it/s]


Current learning rate = 3.8333333333333334e-05
tensor(0.6802, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 24/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.34it/s]


Current learning rate = 4e-05
tensor(0.6658, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 25/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 4.166666666666667e-05
tensor(0.6483, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 26/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 4.3333333333333334e-05
tensor(0.6535, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 27/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.5e-05
tensor(0.6437, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 28/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 4.666666666666667e-05
tensor(0.6244, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 29/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.15it/s]


Current learning rate = 4.8333333333333334e-05
tensor(0.6283, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 30/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 5e-05
tensor(0.6121, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 31/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.10it/s]


Current learning rate = 5.166666666666667e-05
tensor(0.6087, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 32/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.30it/s]


Current learning rate = 5.333333333333333e-05
tensor(0.6018, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 33/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 5.500000000000001e-05
tensor(0.6046, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 34/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 5.666666666666667e-05
tensor(0.5882, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 35/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.33it/s]


Current learning rate = 5.833333333333334e-05
tensor(0.5937, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 36/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 6e-05
tensor(0.5679, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 37/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.16it/s]


Current learning rate = 6.166666666666667e-05
tensor(0.5713, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 38/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 6.333333333333333e-05
tensor(0.5686, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 39/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 6.500000000000001e-05
tensor(0.5699, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 40/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.15it/s]


Current learning rate = 6.666666666666667e-05
tensor(0.5549, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 41/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.23it/s]


Current learning rate = 6.833333333333333e-05
tensor(0.5503, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 42/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.10it/s]


Current learning rate = 7e-05
tensor(0.5488, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 43/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.10it/s]


Current learning rate = 7.166666666666667e-05
tensor(0.5361, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 44/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.07it/s]


Current learning rate = 7.333333333333333e-05
tensor(0.5377, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 45/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 7.500000000000001e-05
tensor(0.5349, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 46/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.10it/s]


Current learning rate = 7.666666666666667e-05
tensor(0.5271, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 47/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 7.833333333333333e-05
tensor(0.5246, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 48/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 8e-05
tensor(0.5151, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 49/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 8.166666666666667e-05
tensor(0.5223, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 50/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 8.333333333333334e-05
tensor(0.5134, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 51/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 8.5e-05
tensor(0.5198, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 52/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 8.666666666666667e-05
tensor(0.5086, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 53/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.04it/s]


Current learning rate = 8.833333333333333e-05
tensor(0.5101, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 54/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.26it/s]


Current learning rate = 9e-05
tensor(0.4957, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 55/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.06it/s]


Current learning rate = 9.166666666666667e-05
tensor(0.4950, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 56/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.14it/s]


Current learning rate = 9.333333333333334e-05
tensor(0.5064, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 57/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.5e-05
tensor(0.5050, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 58/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.34it/s]


Current learning rate = 9.666666666666667e-05
tensor(0.4947, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 59/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.833333333333333e-05
tensor(0.4953, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 60/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.15it/s]


Current learning rate = 0.0001
tensor(0.4973, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 61/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.99997207561336e-05
tensor(0.4859, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 62/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.999888302765345e-05
tensor(0.4872, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 63/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.10it/s]


Current learning rate = 9.99974868239168e-05
tensor(0.4706, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 64/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.99955321605189e-05
tensor(0.4793, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 65/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.07it/s]


Current learning rate = 9.999301905929286e-05
tensor(0.4849, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 66/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.01it/s]


Current learning rate = 9.99899475483094e-05
tensor(0.4687, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 67/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.998631766187651e-05
tensor(0.4751, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 68/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 9.99821294405392e-05
tensor(0.4670, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 69/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 9.997738293107881e-05
tensor(0.4670, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 70/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.997207818651274e-05
tensor(0.4575, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 71/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.996621526609364e-05
tensor(0.4709, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 72/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.03it/s]


Current learning rate = 9.995979423530892e-05
tensor(0.4601, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 73/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.11it/s]


Current learning rate = 9.995281516587991e-05
tensor(0.4489, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 74/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.23it/s]


Current learning rate = 9.99452781357611e-05
tensor(0.4502, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 75/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.99371832291393e-05
tensor(0.4401, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 76/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.07it/s]


Current learning rate = 9.992853053643257e-05
tensor(0.4444, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 77/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.991932015428941e-05
tensor(0.4522, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 78/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.99095521855875e-05
tensor(0.4436, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 79/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.98992267394327e-05
tensor(0.4463, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 80/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.27it/s]


Current learning rate = 9.988834393115767e-05
tensor(0.4461, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 81/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.10it/s]


Current learning rate = 9.98769038823207e-05
tensor(0.4410, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 82/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.12it/s]


Current learning rate = 9.986490672070437e-05
tensor(0.4243, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 83/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.13it/s]


Current learning rate = 9.9852352580314e-05
tensor(0.4338, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 84/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.30it/s]


Current learning rate = 9.983924160137625e-05
tensor(0.4340, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 85/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.11it/s]


Current learning rate = 9.982557393033758e-05
tensor(0.4274, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 86/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.98113497198625e-05
tensor(0.4249, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 87/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.34it/s]


Current learning rate = 9.979656912883193e-05
tensor(0.4183, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 88/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.16it/s]


Current learning rate = 9.978123232234147e-05
tensor(0.4195, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 89/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.976533947169948e-05
tensor(0.4324, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 90/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.28it/s]


Current learning rate = 9.974889075442521e-05
tensor(0.4188, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 91/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:06<00:00,  4.93it/s]


Current learning rate = 9.973188635424678e-05
tensor(0.4082, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 92/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 9.971432646109919e-05
tensor(0.4180, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 93/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 9.969621127112211e-05
tensor(0.3941, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 94/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.967754098665778e-05
tensor(0.4221, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 95/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.13it/s]


Current learning rate = 9.965831581624871e-05
tensor(0.3991, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 96/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.11it/s]


Current learning rate = 9.963853597463533e-05
tensor(0.3778, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 97/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.27it/s]


Current learning rate = 9.96182016827536e-05
tensor(0.4018, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 98/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.13it/s]


Current learning rate = 9.959731316773259e-05
tensor(0.3968, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 99/1000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.957587066289189e-05
tensor(0.4057, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 100/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 9.9553874407739e-05
tensor(0.4061, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 101/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.13it/s]


Current learning rate = 9.953132464796673e-05
tensor(0.3926, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 102/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.07it/s]


Current learning rate = 9.950822163545032e-05
tensor(0.3923, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 103/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.29it/s]


Current learning rate = 9.948456562824477e-05
tensor(0.3967, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 104/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.11it/s]


Current learning rate = 9.946035689058188e-05
tensor(0.3995, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 105/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.10it/s]


Current learning rate = 9.94355956928673e-05
tensor(0.3857, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 106/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.30it/s]


Current learning rate = 9.941028231167756e-05
tensor(0.3887, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 107/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.938441702975689e-05
tensor(0.3868, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 108/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.11it/s]


Current learning rate = 9.935800013601414e-05
tensor(0.3917, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 109/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.06it/s]


Current learning rate = 9.933103192551958e-05
tensor(0.3799, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 110/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.27it/s]


Current learning rate = 9.930351269950143e-05
tensor(0.3725, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 111/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.11it/s]


Current learning rate = 9.927544276534276e-05
tensor(0.3847, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 112/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.924682243657779e-05
tensor(0.3774, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 113/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 9.921765203288861e-05
tensor(0.3755, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 114/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 9.918793188010147e-05
tensor(0.3654, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 115/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.02it/s]


Current learning rate = 9.915766231018318e-05
tensor(0.3784, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 116/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.91268436612374e-05
tensor(0.3833, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 117/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.909547627750089e-05
tensor(0.3528, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 118/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.906356050933961e-05
tensor(0.3564, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 119/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.903109671324488e-05
tensor(0.3645, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 120/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.34it/s]


Current learning rate = 9.899808525182935e-05
tensor(0.3874, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 121/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.03it/s]


Current learning rate = 9.89645264938229e-05
tensor(0.3730, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 122/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.02it/s]


Current learning rate = 9.893042081406867e-05
tensor(0.3646, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 123/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.03it/s]


Current learning rate = 9.889576859351873e-05
tensor(0.3610, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 124/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 9.886057021922982e-05
tensor(0.3663, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 125/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.06it/s]


Current learning rate = 9.882482608435923e-05
tensor(0.3516, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 126/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 9.878853658816014e-05
tensor(0.3538, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 127/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:06<00:00,  4.93it/s]


Current learning rate = 9.87517021359773e-05
tensor(0.3602, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 128/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.23it/s]


Current learning rate = 9.871432313924255e-05
tensor(0.3543, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 129/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.867640001547008e-05
tensor(0.3581, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 130/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 9.863793318825186e-05
tensor(0.3561, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 131/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.26it/s]


Current learning rate = 9.859892308725296e-05
tensor(0.3458, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 132/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.06it/s]


Current learning rate = 9.85593701482066e-05
tensor(0.3337, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 133/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.851927481290942e-05
tensor(0.3553, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 134/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.847863752921649e-05
tensor(0.3414, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 135/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 9.843745875103627e-05
tensor(0.3477, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 136/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.13it/s]


Current learning rate = 9.839573893832563e-05
tensor(0.3454, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 137/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.23it/s]


Current learning rate = 9.835347855708464e-05
tensor(0.3304, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 138/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.831067807935137e-05
tensor(0.3583, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 139/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.82673379831967e-05
tensor(0.3335, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 140/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.11it/s]


Current learning rate = 9.822345875271883e-05
tensor(0.3384, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 141/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.27it/s]


Current learning rate = 9.817904087803802e-05
tensor(0.3323, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 142/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.07it/s]


Current learning rate = 9.813408485529103e-05
tensor(0.3246, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 143/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.08it/s]


Current learning rate = 9.808859118662557e-05
tensor(0.3354, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 144/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.26it/s]


Current learning rate = 9.804256038019481e-05
tensor(0.3276, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 145/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.799599295015154e-05
tensor(0.3176, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 146/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.10it/s]


Current learning rate = 9.794888941664253e-05
tensor(0.3413, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 147/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 9.790125030580269e-05
tensor(0.3272, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 148/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.785307614974921e-05
tensor(0.3356, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 149/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.780436748657558e-05
tensor(0.3310, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 150/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.34it/s]


Current learning rate = 9.775512486034563e-05
tensor(0.3223, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 151/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.13it/s]


Current learning rate = 9.77053488210874e-05
tensor(0.3370, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 152/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.765503992478704e-05
tensor(0.3200, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 153/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.76041987333826e-05
tensor(0.3139, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 154/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 9.755282581475769e-05
tensor(0.3208, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 155/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.750092174273521e-05
tensor(0.3112, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 156/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.744848709707091e-05
tensor(0.3158, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 157/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 9.739552246344692e-05
tensor(0.3203, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 158/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.05it/s]


Current learning rate = 9.734202843346522e-05
tensor(0.3256, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 159/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.00it/s]


Current learning rate = 9.728800560464097e-05
tensor(0.3380, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 160/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.723345458039594e-05
tensor(0.3138, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 161/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.717837597005168e-05
tensor(0.3048, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 162/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.01it/s]


Current learning rate = 9.712277038882273e-05
tensor(0.3151, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 163/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.706663845780984e-05
tensor(0.3148, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 164/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.00it/s]


Current learning rate = 9.700998080399287e-05
tensor(0.3070, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 165/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.02it/s]


Current learning rate = 9.69527980602239e-05
tensor(0.3230, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 166/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.03it/s]


Current learning rate = 9.689509086522019e-05
tensor(0.3035, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 167/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.15it/s]


Current learning rate = 9.683685986355692e-05
tensor(0.3105, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 168/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.04it/s]


Current learning rate = 9.67781057056601e-05
tensor(0.3071, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 169/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.00it/s]


Current learning rate = 9.671882904779926e-05
tensor(0.2967, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 170/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.665903055208014e-05
tensor(0.3159, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 171/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 9.659871088643724e-05
tensor(0.3169, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 172/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.03it/s]


Current learning rate = 9.653787072462643e-05
tensor(0.3083, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 173/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.25it/s]


Current learning rate = 9.64765107462174e-05
tensor(0.3101, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 174/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.641463163658605e-05
tensor(0.3096, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 175/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.635223408690688e-05
tensor(0.3046, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 176/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.628931879414517e-05
tensor(0.3006, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 177/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.622588646104934e-05
tensor(0.3034, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 178/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.616193779614294e-05
tensor(0.2855, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 179/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.60974735137169e-05
tensor(0.2840, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 180/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 9.603249433382144e-05
tensor(0.2953, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 181/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.596700098225806e-05
tensor(0.3043, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 182/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.590099419057141e-05
tensor(0.3021, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 183/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.583447469604119e-05
tensor(0.2988, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 184/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 9.57674432416738e-05
tensor(0.2904, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 185/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.569990057619414e-05
tensor(0.2916, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 186/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.563184745403724e-05
tensor(0.2746, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 187/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.556328463533977e-05
tensor(0.2944, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 188/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 9.549421288593157e-05
tensor(0.2780, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 189/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 9.542463297732716e-05
tensor(0.2921, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 190/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.535454568671704e-05
tensor(0.3102, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 191/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 9.528395179695905e-05
tensor(0.2979, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 192/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.521285209656962e-05
tensor(0.2822, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 193/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.514124737971495e-05
tensor(0.2693, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 194/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.506913844620218e-05
tensor(0.2774, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 195/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.49965261014704e-05
tensor(0.2824, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 196/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 9.492341115658167e-05
tensor(0.3146, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 197/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.484979442821199e-05
tensor(0.3055, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 198/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.477567673864216e-05
tensor(0.2855, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 199/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.470105891574861e-05
tensor(0.2766, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 200/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.462594179299406e-05
tensor(0.2828, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 201/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.45503262094184e-05
tensor(0.2873, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 202/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 9.44742130096291e-05
tensor(0.2901, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 203/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 9.439760304379197e-05
tensor(0.2823, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 204/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.43204971676215e-05
tensor(0.2751, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 205/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.424289624237144e-05
tensor(0.2915, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 206/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.416480113482504e-05
tensor(0.2780, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 207/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.408621271728554e-05
tensor(0.2815, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 208/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.400713186756625e-05
tensor(0.2747, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 209/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 9.392755946898088e-05
tensor(0.2721, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 210/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.384749641033359e-05
tensor(0.2873, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 211/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.37669435859091e-05
tensor(0.2834, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 212/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 9.368590189546269e-05
tensor(0.2797, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 213/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.360437224421017e-05
tensor(0.2856, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 214/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.352235554281774e-05
tensor(0.2942, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 215/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 9.343985270739182e-05
tensor(0.2905, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 216/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.335686465946887e-05
tensor(0.2809, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 217/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.3273392326005e-05
tensor(0.2762, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 218/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.31894366393657e-05
tensor(0.2950, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 219/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.31049985373154e-05
tensor(0.2862, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 220/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.302007896300698e-05
tensor(0.2810, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 221/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.293467886497122e-05
tensor(0.2733, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 222/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.284879919710632e-05
tensor(0.2572, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 223/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.276244091866706e-05
tensor(0.2622, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 224/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.267560499425424e-05
tensor(0.2700, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 225/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 9.25882923938038e-05
tensor(0.2912, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 226/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.16it/s]


Current learning rate = 9.250050409257611e-05
tensor(0.2650, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 227/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.241224107114495e-05
tensor(0.2642, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 228/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 9.232350431538656e-05
tensor(0.2706, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 229/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.16it/s]


Current learning rate = 9.223429481646882e-05
tensor(0.2752, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 230/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.214461357083985e-05
tensor(0.2593, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 231/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.15it/s]


Current learning rate = 9.205446158021724e-05
tensor(0.2579, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 232/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.34it/s]


Current learning rate = 9.196383985157656e-05
tensor(0.2656, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 233/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.187274939714031e-05
tensor(0.2713, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 234/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.17811912343665e-05
tensor(0.2576, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 235/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.168916638593736e-05
tensor(0.2626, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 236/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.159667587974785e-05
tensor(0.2754, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 237/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 9.150372074889426e-05
tensor(0.2754, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 238/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 9.141030203166256e-05
tensor(0.2860, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 239/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.131642077151694e-05
tensor(0.2682, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 240/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.122207801708802e-05
tensor(0.2819, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 241/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 9.112727482216124e-05
tensor(0.2766, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 242/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 9.103201224566498e-05
tensor(0.2722, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 243/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.093629135165892e-05
tensor(0.2526, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 244/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.084011320932189e-05
tensor(0.2669, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 245/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.074347889294016e-05
tensor(0.2553, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 246/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 9.064638948189538e-05
tensor(0.2568, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 247/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 9.054884606065243e-05
tensor(0.2814, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 248/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 9.045084971874738e-05
tensor(0.2534, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 249/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.035240155077533e-05
tensor(0.2689, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 250/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 9.025350265637815e-05
tensor(0.2711, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 251/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 9.015415414023225e-05
tensor(0.2731, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 252/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 9.005435711203618e-05
tensor(0.2595, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 253/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.995411268649823e-05
tensor(0.2605, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 254/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 8.985342198332407e-05
tensor(0.2817, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 255/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.975228612720416e-05
tensor(0.2593, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 256/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 8.965070624780116e-05
tensor(0.2724, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 257/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.954868347973742e-05
tensor(0.2488, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 258/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.944621896258225e-05
tensor(0.2724, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 259/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.934331384083914e-05
tensor(0.2646, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 260/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.923996926393305e-05
tensor(0.2734, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 261/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.913618638619757e-05
tensor(0.2582, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 262/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.903196636686197e-05
tensor(0.2628, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 263/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.89273103700383e-05
tensor(0.2561, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 264/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 8.882221956470836e-05
tensor(0.2664, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 265/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.871669512471068e-05
tensor(0.2440, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 266/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.861073822872734e-05
tensor(0.2547, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 267/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 8.85043500602709e-05
tensor(0.2508, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 268/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.839753180767108e-05
tensor(0.2714, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 269/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.829028466406155e-05
tensor(0.2513, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 270/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.818260982736661e-05
tensor(0.2552, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 271/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 8.807450850028776e-05
tensor(0.2692, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 272/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 8.79659818902903e-05
tensor(0.2512, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 273/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 8.785703120958984e-05
tensor(0.2569, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 274/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 8.774765767513875e-05
tensor(0.2663, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 275/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.763786250861256e-05
tensor(0.2672, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 276/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 8.752764693639638e-05
tensor(0.2583, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 277/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 8.74170121895711e-05
tensor(0.2525, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 278/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.730595950389968e-05
tensor(0.2647, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 279/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.719449011981339e-05
tensor(0.2576, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 280/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.708260528239788e-05
tensor(0.2610, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 281/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.697030624137936e-05
tensor(0.2416, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 282/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 8.685759425111056e-05
tensor(0.2515, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 283/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.674447057055672e-05
tensor(0.2415, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 284/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.34it/s]


Current learning rate = 8.663093646328166e-05
tensor(0.2628, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 285/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.651699319743347e-05
tensor(0.2555, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 286/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.640264204573047e-05
tensor(0.2541, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 287/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.628788428544699e-05
tensor(0.2485, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 288/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 8.617272119839903e-05
tensor(0.2461, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 289/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.605715407093005e-05
tensor(0.2628, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 290/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 8.594118419389647e-05
tensor(0.2686, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 291/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.58248128626534e-05
tensor(0.2378, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 292/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.570804137704003e-05
tensor(0.2588, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 293/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.559087104136526e-05
tensor(0.2553, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 294/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.547330316439291e-05
tensor(0.2521, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 295/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.535533905932738e-05
tensor(0.2368, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 296/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.523698004379877e-05
tensor(0.2446, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 297/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 8.511822743984823e-05
tensor(0.2450, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 298/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.499908257391323e-05
tensor(0.2394, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 299/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.48795467768127e-05
tensor(0.2508, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 300/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 8.475962138373213e-05
tensor(0.2528, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 301/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.463930773420874e-05
tensor(0.2452, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 302/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 8.451860717211653e-05
tensor(0.2467, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 303/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 8.43975210456511e-05
tensor(0.2381, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 304/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.23it/s]


Current learning rate = 8.427605070731482e-05
tensor(0.2453, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 305/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.415419751390155e-05
tensor(0.2433, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 306/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 8.403196282648156e-05
tensor(0.2557, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 307/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.390934801038632e-05
tensor(0.2364, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 308/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 8.378635443519327e-05
tensor(0.2474, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 309/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.366298347471042e-05
tensor(0.2455, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 310/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 8.353923650696118e-05
tensor(0.2432, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 311/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.341511491416878e-05
tensor(0.2434, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 312/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.329062008274098e-05
tensor(0.2514, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 313/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 8.31657534032545e-05
tensor(0.2397, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 314/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.304051627043953e-05
tensor(0.2617, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 315/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.291491008316409e-05
tensor(0.2630, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 316/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 8.278893624441848e-05
tensor(0.2547, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 317/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.266259616129958e-05
tensor(0.2326, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 318/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 8.253589124499512e-05
tensor(0.2285, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 319/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.240882291076793e-05
tensor(0.2267, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 320/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.228139257794012e-05
tensor(0.2496, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 321/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.215360166987726e-05
tensor(0.2313, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 322/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.202545161397242e-05
tensor(0.2475, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 323/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.189694384163032e-05
tensor(0.2434, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 324/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.176807978825118e-05
tensor(0.2355, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 325/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 8.163886089321493e-05
tensor(0.2556, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 326/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.150928859986488e-05
tensor(0.2404, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 327/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 8.13793643554918e-05
tensor(0.2393, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 328/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 8.124908961131759e-05
tensor(0.2380, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 329/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.111846582247917e-05
tensor(0.2304, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 330/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.098749444801224e-05
tensor(0.2439, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 331/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.085617695083493e-05
tensor(0.2411, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 332/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.072451479773143e-05
tensor(0.2331, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 333/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 8.05925094593357e-05
tensor(0.2444, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 334/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 8.0460162410115e-05
tensor(0.2404, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 335/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 8.032747512835337e-05
tensor(0.2337, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 336/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 8.019444909613522e-05
tensor(0.2481, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 337/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.39it/s]


Current learning rate = 8.006108579932869e-05
tensor(0.2320, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 338/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.992738672756909e-05
tensor(0.2450, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 339/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.979335337424221e-05
tensor(0.2256, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 340/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 7.965898723646776e-05
tensor(0.2338, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 341/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 7.952428981508253e-05
tensor(0.2334, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 342/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.938926261462366e-05
tensor(0.2377, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 343/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.925390714331185e-05
tensor(0.2224, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 344/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 7.911822491303452e-05
tensor(0.2325, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 345/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.898221743932888e-05
tensor(0.2280, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 346/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.884588624136504e-05
tensor(0.2434, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 347/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 7.870923284192904e-05
tensor(0.2389, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 348/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.857225876740584e-05
tensor(0.2387, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 349/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.843496554776222e-05
tensor(0.2250, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 350/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 7.829735471652978e-05
tensor(0.2382, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 351/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.815942781078771e-05
tensor(0.2432, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 352/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.802118637114573e-05
tensor(0.2359, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 353/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 7.788263194172684e-05
tensor(0.2292, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 354/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 7.774376607014995e-05
tensor(0.2390, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 355/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.760459030751284e-05
tensor(0.2304, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 356/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.746510620837459e-05
tensor(0.2460, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 357/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.39it/s]


Current learning rate = 7.73253153307384e-05
tensor(0.2308, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 358/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 7.718521923603404e-05
tensor(0.2274, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 359/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.704481948910056e-05
tensor(0.2236, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 360/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 7.690411765816864e-05
tensor(0.2161, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 361/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.676311531484324e-05
tensor(0.2312, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 362/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.662181403408593e-05
tensor(0.2344, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 363/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 7.648021539419736e-05
tensor(0.2368, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 364/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.633832097679958e-05
tensor(0.2301, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 365/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.619613236681843e-05
tensor(0.2173, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 366/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.605365115246581e-05
tensor(0.2350, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 367/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 7.591087892522193e-05
tensor(0.2319, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 368/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.576781727981749e-05
tensor(0.2257, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 369/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.562446781421604e-05
tensor(0.2167, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 370/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 7.548083212959588e-05
tensor(0.2173, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 371/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.53369118303324e-05
tensor(0.2325, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 372/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.519270852398001e-05
tensor(0.2320, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 373/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 7.504822382125431e-05
tensor(0.2198, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 374/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.490345933601395e-05
tensor(0.2315, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 375/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.475841668524268e-05
tensor(0.2336, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 376/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 7.461309748903139e-05
tensor(0.2376, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 377/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.44675033705598e-05
tensor(0.2231, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 378/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.432163595607851e-05
tensor(0.2342, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 379/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.417549687489073e-05
tensor(0.2161, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 380/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 7.402908775933419e-05
tensor(0.2172, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 381/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.388241024476276e-05
tensor(0.2194, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 382/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.373546596952829e-05
tensor(0.2173, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 383/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 7.358825657496227e-05
tensor(0.2378, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 384/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.344078370535757e-05
tensor(0.2177, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 385/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.329304900794991e-05
tensor(0.2255, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 386/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 7.314505413289964e-05
tensor(0.2349, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 387/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 7.29968007332732e-05
tensor(0.2169, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 388/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.284829046502468e-05
tensor(0.2128, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 389/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 7.269952498697734e-05
tensor(0.2096, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 390/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.255050596080509e-05
tensor(0.2200, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 391/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.240123505101388e-05
tensor(0.2113, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 392/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.225171392492316e-05
tensor(0.2222, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 393/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 7.210194425264723e-05
tensor(0.2107, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 394/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 7.195192770707654e-05
tensor(0.2130, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 395/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 7.180166596385914e-05
tensor(0.2086, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 396/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 7.165116070138183e-05
tensor(0.2123, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 397/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.150041360075146e-05
tensor(0.2276, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 398/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.134942634577614e-05
tensor(0.2066, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 399/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 7.119820062294651e-05
tensor(0.2079, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 400/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 7.104673812141675e-05
tensor(0.2023, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 401/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.089504053298587e-05
tensor(0.2046, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 402/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 7.07431095520787e-05
tensor(0.2163, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 403/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 7.059094687572701e-05
tensor(0.2184, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 404/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 7.04385542035506e-05
tensor(0.2216, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 405/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 7.02859332377382e-05
tensor(0.2145, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 406/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 7.013308568302854e-05
tensor(0.2149, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 407/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.998001324669135e-05
tensor(0.2115, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 408/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.982671763850814e-05
tensor(0.2126, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 409/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 6.967320057075328e-05
tensor(0.2002, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 410/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.951946375817474e-05
tensor(0.2220, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 411/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.936550891797499e-05
tensor(0.2022, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 412/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 6.921133776979186e-05
tensor(0.2002, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 413/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 6.905695203567918e-05
tensor(0.2220, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 414/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 6.890235344008781e-05
tensor(0.2145, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 415/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 6.874754370984606e-05
tensor(0.2290, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 416/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.859252457414067e-05
tensor(0.2170, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 417/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.843729776449733e-05
tensor(0.2173, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 418/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.828186501476144e-05
tensor(0.2138, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 419/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 6.81262280610787e-05
tensor(0.2155, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 420/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.797038864187564e-05
tensor(0.2153, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 421/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.781434849784038e-05
tensor(0.2047, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 422/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 6.765810937190306e-05
tensor(0.2305, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 423/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.750167300921635e-05
tensor(0.2026, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 424/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.734504115713604e-05
tensor(0.2164, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 425/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 6.718821556520151e-05
tensor(0.2186, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 426/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 6.703119798511612e-05
tensor(0.1987, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 427/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.687399017072775e-05
tensor(0.2097, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 428/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 6.67165938780091e-05
tensor(0.1960, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 429/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.655901086503813e-05
tensor(0.2206, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 430/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.640124289197845e-05
tensor(0.2112, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 431/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.624329172105963e-05
tensor(0.2022, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 432/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 6.608515911655744e-05
tensor(0.2047, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 433/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.592684684477435e-05
tensor(0.2082, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 434/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.576835667401953e-05
tensor(0.2130, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 435/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 6.560969037458933e-05
tensor(0.2174, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 436/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 6.545084971874738e-05
tensor(0.2022, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 437/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.529183648070483e-05
tensor(0.1989, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 438/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 6.513265243660057e-05
tensor(0.2181, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 439/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 6.497329936448129e-05
tensor(0.2012, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 440/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.09it/s]


Current learning rate = 6.481377904428171e-05
tensor(0.2074, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 441/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 6.465409325780467e-05
tensor(0.2179, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 442/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.449424378870123e-05
tensor(0.1992, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 443/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.433423242245074e-05
tensor(0.1972, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 444/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.16it/s]


Current learning rate = 6.41740609463409e-05
tensor(0.1987, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 445/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 6.401373114944781e-05
tensor(0.2091, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 446/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 6.385324482261597e-05
tensor(0.1993, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 447/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 6.369260375843825e-05
tensor(0.2206, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 448/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 6.353180975123595e-05
tensor(0.2015, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 449/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.337086459703867e-05
tensor(0.1995, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 450/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.320977009356431e-05
tensor(0.2199, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 451/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 6.304852804019891e-05
tensor(0.2003, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 452/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.288714023797672e-05
tensor(0.2218, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 453/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.272560848955981e-05
tensor(0.2041, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 454/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 6.256393459921824e-05
tensor(0.2042, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 455/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 6.240212037280966e-05
tensor(0.2267, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 456/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.224016761775933e-05
tensor(0.2062, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 457/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.207807814303973e-05
tensor(0.1875, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 458/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 6.191585375915055e-05
tensor(0.2069, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 459/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.175349627809839e-05
tensor(0.1936, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 460/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 6.159100751337642e-05
tensor(0.1974, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 461/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 6.142838927994432e-05
tensor(0.2154, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 462/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.126564339420784e-05
tensor(0.2074, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 463/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 6.11027716739986e-05
tensor(0.2018, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 464/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.39it/s]


Current learning rate = 6.093977593855375e-05
tensor(0.1953, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 465/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 6.077665800849568e-05
tensor(0.2043, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 466/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 6.061341970581165e-05
tensor(0.2055, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 467/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 6.0450062853833424e-05
tensor(0.1862, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 468/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 6.028658927721697e-05
tensor(0.2051, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 469/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 6.012300080192208e-05
tensor(0.1934, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 470/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.99592992551918e-05
tensor(0.1976, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 471/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 5.9795486465532325e-05
tensor(0.1919, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 472/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.9631564262692274e-05
tensor(0.1899, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 473/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.946753447764245e-05
tensor(0.1870, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 474/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 5.930339894255532e-05
tensor(0.2095, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 475/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.913915949078452e-05
tensor(0.2044, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 476/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 5.897481795684446e-05
tensor(0.1952, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 477/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.8810376176389715e-05
tensor(0.2057, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 478/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 5.8645835986194676e-05
tensor(0.1811, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 479/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.8481199224132855e-05
tensor(0.1936, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 480/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.831646772915651e-05
tensor(0.1811, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 481/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.815164334127603e-05
tensor(0.2019, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 482/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 5.7986727901539374e-05
tensor(0.1880, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 483/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 5.782172325201155e-05
tensor(0.1981, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 484/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 5.7656631235754014e-05
tensor(0.1950, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 485/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.749145369680407e-05
tensor(0.1937, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 486/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 5.732619248015434e-05
tensor(0.1800, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 487/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.716084943173202e-05
tensor(0.1983, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 488/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.699542639837844e-05
tensor(0.1978, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 489/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.682992522782824e-05
tensor(0.1930, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 490/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.666434776868895e-05
tensor(0.1862, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 491/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 5.6498695870420125e-05
tensor(0.1843, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 492/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.633297138331285e-05
tensor(0.1997, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 493/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.616717615846897e-05
tensor(0.1942, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 494/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.6001312047780486e-05
tensor(0.1910, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 495/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 5.583538090390882e-05
tensor(0.1801, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 496/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.5669384580264104e-05
tensor(0.2050, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 497/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.55033249309846e-05
tensor(0.1828, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 498/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.533720381091582e-05
tensor(0.2047, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 499/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.16it/s]


Current learning rate = 5.517102307558991e-05
tensor(0.1998, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 500/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 5.5004784581204927e-05
tensor(0.2018, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 501/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 5.483849018460406e-05
tensor(0.1893, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 502/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.467214174325493e-05
tensor(0.1945, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 503/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 5.4505741115228805e-05
tensor(0.1852, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 504/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 5.4339290159179875e-05
tensor(0.2003, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 505/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.41727907343245e-05
tensor(0.1845, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 506/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 5.400624470042037e-05
tensor(0.1704, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 507/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.383965391774586e-05
tensor(0.1820, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 508/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 5.367302024707911e-05
tensor(0.1860, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 509/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.350634554967737e-05
tensor(0.1892, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 510/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 5.3339631687256084e-05
tensor(0.1930, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 511/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.317288052196822e-05
tensor(0.1895, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 512/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 5.300609391638336e-05
tensor(0.1886, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 513/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 5.283927373346698e-05
tensor(0.1872, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 514/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.267242183655961e-05
tensor(0.1884, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 515/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.250554008935596e-05
tensor(0.1834, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 516/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.233863035588426e-05
tensor(0.1786, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 517/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.2171694500485244e-05
tensor(0.1815, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 518/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.200473438779146e-05
tensor(0.1872, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 519/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.183775188270642e-05
tensor(0.1667, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 520/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.167074885038373e-05
tensor(0.1878, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 521/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 5.150372715620629e-05
tensor(0.1713, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 522/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 5.133668866576544e-05
tensor(0.1904, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 523/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.116963524484015e-05
tensor(0.1852, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 524/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.1002568759376134e-05
tensor(0.1734, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 525/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 5.0835491075465045e-05
tensor(0.1801, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 526/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 5.0668404059323635e-05
tensor(0.1829, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 527/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5.050130957727286e-05
tensor(0.1763, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 528/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.17it/s]


Current learning rate = 5.033420949571712e-05
tensor(0.1878, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 529/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 5.016710568112329e-05
tensor(0.1802, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 530/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 5e-05
tensor(0.1766, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 531/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.983289431887672e-05
tensor(0.1817, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 532/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 4.96657905042829e-05
tensor(0.1830, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 533/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.949869042272715e-05
tensor(0.1834, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 534/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.933159594067637e-05
tensor(0.1687, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 535/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.916450892453495e-05
tensor(0.1756, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 536/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 4.899743124062388e-05
tensor(0.1739, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 537/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 4.883036475515986e-05
tensor(0.1823, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 538/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 4.866331133423456e-05
tensor(0.1789, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 539/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 4.8496272843793705e-05
tensor(0.1650, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 540/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.832925114961629e-05
tensor(0.1713, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 541/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.816224811729359e-05
tensor(0.1878, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 542/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 4.799526561220855e-05
tensor(0.1882, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 543/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.782830549951476e-05
tensor(0.1892, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 544/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.7661369644115755e-05
tensor(0.1859, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 545/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 4.749445991064404e-05
tensor(0.1800, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 546/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 4.73275781634404e-05
tensor(0.1868, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 547/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 4.716072626653302e-05
tensor(0.1793, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 548/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.6993906083616654e-05
tensor(0.1691, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 549/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 4.68271194780318e-05
tensor(0.1892, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 550/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 4.666036831274392e-05
tensor(0.1741, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 551/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.649365445032265e-05
tensor(0.1799, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 552/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 4.63269797529209e-05
tensor(0.1627, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 553/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.616034608225415e-05
tensor(0.1813, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 554/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 4.5993755299579626e-05
tensor(0.1705, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 555/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 4.582720926567552e-05
tensor(0.1832, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 556/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.566070984082013e-05
tensor(0.1647, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 557/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.22it/s]


Current learning rate = 4.549425888477121e-05
tensor(0.1747, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 558/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 4.5327858256745073e-05
tensor(0.1789, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 559/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.516150981539596e-05
tensor(0.1727, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 560/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.4995215418795085e-05
tensor(0.1791, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 561/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.4828976924410107e-05
tensor(0.1690, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 562/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 4.466279618908419e-05
tensor(0.1767, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 563/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.449667506901542e-05
tensor(0.1672, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 564/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.433061541973591e-05
tensor(0.1900, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 565/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 4.416461909609119e-05
tensor(0.1637, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 566/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.399868795221951e-05
tensor(0.1666, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 567/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.3832823841531036e-05
tensor(0.1694, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 568/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.35it/s]


Current learning rate = 4.366702861668716e-05
tensor(0.1769, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 569/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.18it/s]


Current learning rate = 4.350130412957988e-05
tensor(0.1623, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 570/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 4.333565223131107e-05
tensor(0.1633, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 571/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 4.317007477217177e-05
tensor(0.1885, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 572/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.300457360162158e-05
tensor(0.1872, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 573/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.2839150568267985e-05
tensor(0.1780, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 574/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.267380751984568e-05
tensor(0.1719, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 575/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.38it/s]


Current learning rate = 4.250854630319593e-05
tensor(0.1713, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 576/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 4.2343368764246e-05
tensor(0.1697, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 577/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.2178276747988446e-05
tensor(0.1720, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 578/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.24it/s]


Current learning rate = 4.201327209846065e-05
tensor(0.1754, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 579/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.184835665872399e-05
tensor(0.1581, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 580/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.1683532270843504e-05
tensor(0.1729, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 581/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.36it/s]


Current learning rate = 4.1518800775867156e-05
tensor(0.1669, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 582/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.20it/s]


Current learning rate = 4.135416401380535e-05
tensor(0.1691, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 583/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.118962382361029e-05
tensor(0.1713, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 584/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.37it/s]


Current learning rate = 4.102518204315555e-05
tensor(0.1688, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 585/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.19it/s]


Current learning rate = 4.0860840509215496e-05
tensor(0.1772, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 586/1000: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30/30 [00:05<00:00,  5.21it/s]


Current learning rate = 4.069660105744469e-05
tensor(0.1789, device='cuda:0', grad_fn=<MeanBackward0>)


Epoch 587/1000:  93%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋        | 28/30 [00:05<00:00,  5.26it/s]

In [None]:
loss.item()

In [None]:
p, h = model.predict_action(fourier_encoder(torch.Tensor([[8], [8]]).view(-1, 1).cuda()), return_history=True)

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image
for image in p:
    image = (image.reshape(28, 28).detach() * 0.5 + 0.5).clamp(0, 1).cpu().numpy()
    img = Image.fromarray(image*255.0)
    plt.imshow(img)
    break

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image

# Assuming `h` is a list of tensors
frames = []

# Loop through each element in `h` to create and save each frame
for h_elem in h:
    # Plot the data
    fig, ax = plt.subplots()
    ax.plot(range(7), h_elem[0].detach().cpu().numpy())

    # Save the plot as an image in memory
    fig.canvas.draw()
    image = np.array(fig.canvas.renderer.buffer_rgba())
    frames.append(Image.fromarray(image))

    # Close the figure to avoid display overlap and memory issues
    plt.close(fig)

# Save frames as an animated GIF
frames[0].save("animation.gif", save_all=True, append_images=frames[1:], loop=0, duration=200)
