# Single Path One-Shot Neural Architecture Search using Random Search

# Train supernet

## Setup

### Imports

In [1]:
from typing import Tuple

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import DataLoader
from tqdm import tqdm

from cifar10 import get_train_transform, get_val_transform

### Make everything a bit faster

In [2]:
torch.backends.cudnn.benchmark = True
torch.backends.cudnn.deterministic = False

### Build datasets and dataloaders for CIFAR-10

In [3]:
# Change this value if needed.
batch_size = 512

In [4]:
train_transform = get_train_transform()
val_transform = get_val_transform()

train_set = torchvision.datasets.CIFAR10(
    root='./data',
    train=True,
    download=True,
    transform=train_transform,
)
test_set = torchvision.datasets.CIFAR10(
    root='./data',
    train=False,
    download=True,
    transform=val_transform,
)

train_dataloader = DataLoader(
    train_set,
    batch_size=batch_size,
    shuffle=True,
    num_workers=4,
    drop_last=True,
)
test_dataloader = DataLoader(
    test_set,
    batch_size=batch_size,
    shuffle=False,
    num_workers=4,
    drop_last=False,
)

Files already downloaded and verified
Files already downloaded and verified


## Create supernet

In [5]:
from supernet import supernet18

In [6]:
# Select suitable device.
# You should probably use either cuda (NVidia GPU) or mps (Apple) backend.
device = torch.device('cuda:0')

In [7]:
# Better search space, which lower mean MACs and more operations.
channel_multipliers = (0.25, 0.5, 0.75, 1.0, 1.25, 1.5)

In [8]:
supernet = supernet18(num_classes=10, zero_init_residual=True, channel_multipliers=channel_multipliers)
supernet.to(device=device)

Supernet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): SearchBlock(
      (ops): ModuleList(
        (0): BasicBlock(
          (conv1): Conv2d(64, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
          (bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (relu): ReLU(inplace=True)
          (conv2): Conv2d(16, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
          (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        )
        (1): BasicBlock(
          (conv1): Conv2d(64, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
          (bn1): BatchNorm2d(32, eps=1e-05,

### Define loss function

In [9]:
criterion = nn.CrossEntropyLoss()

### Select hyperparameters

In [10]:
# The same hyperparameters as for training baseline model, EXCEPT the number of epochs, which
# is increased 18 times (360 instead of 20).

lr = 0.25
weight_decay = 5e-4
momentum = 0.9
n_epochs = 360

### Build optimizer and scheduler

In [11]:
optimizer = optim.SGD(supernet.parameters(), lr=lr, weight_decay=weight_decay, momentum=momentum)
scheduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=len(train_dataloader) * n_epochs)

### Define training function

In [12]:
def pretrain_one_epoch(
        model: nn.Module,
        criterion: nn.Module,
        dataloader: DataLoader,
        optimizer: optim.Optimizer,
        scheduler,
        device: torch.device,
        epoch: int,
) -> Tuple[float, float]:
    model.train()

    total_loss = 0.0
    total_correct = 0.0
    total_samples = 0

    wrapped_dataloader = tqdm(enumerate(dataloader), total=len(dataloader))
    for i, (inputs, labels) in wrapped_dataloader:
        inputs = inputs.to(device=device)
        labels = labels.to(device=device)

        optimizer.zero_grad()

        # For each search block in the search space, we set only one operation to participate
        # in supernet forward. Only its weights (among other ops from this search block) will
        # be updated using this batch data.
        model.sample_random_architecture()  # <-------------- THIS WAS ADDED

        logits = model(inputs)
        loss = criterion(logits, labels)
        loss.backward()
        optimizer.step()
        scheduler.step()

        with torch.no_grad():
            _, predicted_labels = torch.max(logits, 1)
            total_loss += loss.item()
            total_correct += (predicted_labels == labels).sum().item()
            total_samples += labels.shape[0]

        wrapped_dataloader.set_description(
            f'(train) Epoch={epoch}, lr={scheduler.get_last_lr()[0]:.4f} loss={total_loss / (i + 1):.3f}'
        )

    return total_loss / len(dataloader), total_correct / total_samples


@torch.no_grad()
def validate_one_epoch(
        model: nn.Module,
        criterion: nn.Module,
        dataloader: DataLoader,
        device: torch.device,
        epoch: int,
) -> Tuple[float, float]:
    model.eval()

    total_loss = 0.0
    total_correct = 0.0
    total_samples = 0

    wrapped_dataloader = tqdm(enumerate(dataloader), total=len(dataloader))
    for i, (inputs, labels) in wrapped_dataloader:
        inputs = inputs.to(device=device)
        labels = labels.to(device=device)

        logits = model(inputs)
        loss = criterion(logits, labels)
        _, predicted_labels = torch.max(logits, 1)
        total_loss += loss.item()
        total_correct += (predicted_labels == labels).sum().item()
        total_samples += labels.shape[0]

        wrapped_dataloader.set_description(f'(val) Epoch={epoch}, loss={total_loss / (i + 1):.3f}')

    return total_loss / len(dataloader), total_correct / total_samples

### Run training

In [13]:
for epoch in range(n_epochs):
    print(f'Epoch: {epoch}')
    loss, accuracy = pretrain_one_epoch(supernet, criterion, train_dataloader, optimizer, scheduler, device, epoch)
    print(f'train_loss={loss:.4f}, train_accuracy={accuracy:.3%}')
    loss, accuracy = validate_one_epoch(supernet, criterion, test_dataloader, device, epoch)
    print(f'test_loss={loss:.4f}, test_accuracy={accuracy:.3%}')

Epoch: 0


(train) Epoch=0, lr=0.2500 loss=6.238: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:06<00:00, 14.57it/s]

train_loss=6.2377, train_accuracy=10.394%



(val) Epoch=0, loss=145.282: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 43.54it/s]

test_loss=145.2823, test_accuracy=10.940%
Epoch: 1



(train) Epoch=1, lr=0.2500 loss=2.699: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.58it/s]

train_loss=2.6994, train_accuracy=10.370%



(val) Epoch=1, loss=2.399: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 46.45it/s]

test_loss=2.3987, test_accuracy=12.550%
Epoch: 2



(train) Epoch=2, lr=0.2500 loss=2.316: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.78it/s]

train_loss=2.3163, train_accuracy=10.978%



(val) Epoch=2, loss=2.302: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 46.30it/s]


test_loss=2.3015, test_accuracy=10.680%
Epoch: 3


(train) Epoch=3, lr=0.2499 loss=2.297: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.79it/s]


train_loss=2.2968, train_accuracy=11.544%


(val) Epoch=3, loss=2.307: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.40it/s]

test_loss=2.3068, test_accuracy=9.060%
Epoch: 4



(train) Epoch=4, lr=0.2499 loss=2.281: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 36.03it/s]

train_loss=2.2810, train_accuracy=12.895%



(val) Epoch=4, loss=2.296: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 46.94it/s]

test_loss=2.2959, test_accuracy=11.440%
Epoch: 5



(train) Epoch=5, lr=0.2498 loss=2.242: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 36.22it/s]

train_loss=2.2424, train_accuracy=15.279%



(val) Epoch=5, loss=2.387: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.07it/s]

test_loss=2.3866, test_accuracy=12.200%
Epoch: 6



(train) Epoch=6, lr=0.2498 loss=2.149: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.41it/s]

train_loss=2.1489, train_accuracy=18.331%



(val) Epoch=6, loss=2.296: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.39it/s]

test_loss=2.2964, test_accuracy=13.700%
Epoch: 7



(train) Epoch=7, lr=0.2497 loss=2.086: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.66it/s]

train_loss=2.0861, train_accuracy=19.906%



(val) Epoch=7, loss=2.087: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.59it/s]


test_loss=2.0871, test_accuracy=17.910%
Epoch: 8


(train) Epoch=8, lr=0.2496 loss=2.003: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.96it/s]

train_loss=2.0032, train_accuracy=21.736%



(val) Epoch=8, loss=2.138: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.45it/s]

test_loss=2.1376, test_accuracy=15.680%
Epoch: 9



(train) Epoch=9, lr=0.2495 loss=1.964: 100%|███████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.28it/s]


train_loss=1.9636, train_accuracy=22.535%


(val) Epoch=9, loss=2.015: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.26it/s]

test_loss=2.0148, test_accuracy=17.260%
Epoch: 10



(train) Epoch=10, lr=0.2494 loss=1.917: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.77it/s]

train_loss=1.9173, train_accuracy=24.166%



(val) Epoch=10, loss=1.883: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.41it/s]

test_loss=1.8834, test_accuracy=24.920%
Epoch: 11



(train) Epoch=11, lr=0.2493 loss=1.896: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.26it/s]


train_loss=1.8965, train_accuracy=24.833%


(val) Epoch=11, loss=1.884: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.33it/s]


test_loss=1.8837, test_accuracy=24.690%
Epoch: 12


(train) Epoch=12, lr=0.2492 loss=1.839: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.67it/s]


train_loss=1.8393, train_accuracy=26.993%


(val) Epoch=12, loss=2.438: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.75it/s]

test_loss=2.4380, test_accuracy=16.000%
Epoch: 13



(train) Epoch=13, lr=0.2491 loss=1.824: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.05it/s]

train_loss=1.8241, train_accuracy=27.330%



(val) Epoch=13, loss=1.825: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.68it/s]

test_loss=1.8254, test_accuracy=27.590%
Epoch: 14



(train) Epoch=14, lr=0.2489 loss=1.798: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.55it/s]

train_loss=1.7980, train_accuracy=28.038%



(val) Epoch=14, loss=2.057: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.57it/s]

test_loss=2.0575, test_accuracy=20.630%
Epoch: 15



(train) Epoch=15, lr=0.2488 loss=1.782: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.70it/s]

train_loss=1.7825, train_accuracy=29.063%



(val) Epoch=15, loss=1.830: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.53it/s]


test_loss=1.8301, test_accuracy=27.000%
Epoch: 16


(train) Epoch=16, lr=0.2486 loss=1.764: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.53it/s]

train_loss=1.7643, train_accuracy=29.484%



(val) Epoch=16, loss=2.041: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.35it/s]

test_loss=2.0415, test_accuracy=24.350%
Epoch: 17



(train) Epoch=17, lr=0.2485 loss=1.730: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.41it/s]

train_loss=1.7296, train_accuracy=30.743%



(val) Epoch=17, loss=1.859: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.22it/s]

test_loss=1.8590, test_accuracy=26.810%
Epoch: 18



(train) Epoch=18, lr=0.2483 loss=1.716: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.98it/s]

train_loss=1.7162, train_accuracy=31.482%



(val) Epoch=18, loss=2.055: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.84it/s]

test_loss=2.0554, test_accuracy=23.330%
Epoch: 19



(train) Epoch=19, lr=0.2481 loss=1.703: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.15it/s]

train_loss=1.7026, train_accuracy=32.225%



(val) Epoch=19, loss=1.766: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.20it/s]

test_loss=1.7660, test_accuracy=31.940%
Epoch: 20



(train) Epoch=20, lr=0.2479 loss=1.692: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.04it/s]

train_loss=1.6925, train_accuracy=32.976%



(val) Epoch=20, loss=1.994: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.30it/s]


test_loss=1.9945, test_accuracy=22.920%
Epoch: 21


(train) Epoch=21, lr=0.2477 loss=1.671: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.37it/s]

train_loss=1.6709, train_accuracy=33.614%



(val) Epoch=21, loss=1.776: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.45it/s]


test_loss=1.7763, test_accuracy=29.990%
Epoch: 22


(train) Epoch=22, lr=0.2475 loss=1.652: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.11it/s]

train_loss=1.6519, train_accuracy=34.145%



(val) Epoch=22, loss=1.684: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.66it/s]

test_loss=1.6836, test_accuracy=32.690%
Epoch: 23



(train) Epoch=23, lr=0.2473 loss=1.638: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.92it/s]

train_loss=1.6375, train_accuracy=34.766%



(val) Epoch=23, loss=1.733: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.05it/s]

test_loss=1.7329, test_accuracy=32.090%
Epoch: 24



(train) Epoch=24, lr=0.2470 loss=1.610: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.97it/s]

train_loss=1.6102, train_accuracy=36.399%



(val) Epoch=24, loss=1.586: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.82it/s]

test_loss=1.5857, test_accuracy=38.020%
Epoch: 25



(train) Epoch=25, lr=0.2468 loss=1.614: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.15it/s]

train_loss=1.6137, train_accuracy=36.749%



(val) Epoch=25, loss=1.739: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.08it/s]

test_loss=1.7386, test_accuracy=29.950%
Epoch: 26



(train) Epoch=26, lr=0.2465 loss=1.590: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.41it/s]

train_loss=1.5905, train_accuracy=37.999%



(val) Epoch=26, loss=1.708: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.07it/s]

test_loss=1.7084, test_accuracy=33.700%
Epoch: 27



(train) Epoch=27, lr=0.2463 loss=1.589: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.15it/s]

train_loss=1.5894, train_accuracy=38.342%



(val) Epoch=27, loss=1.551: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.61it/s]

test_loss=1.5506, test_accuracy=40.770%
Epoch: 28



(train) Epoch=28, lr=0.2460 loss=1.551: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.14it/s]

train_loss=1.5509, train_accuracy=39.779%



(val) Epoch=28, loss=1.781: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.61it/s]

test_loss=1.7806, test_accuracy=35.970%
Epoch: 29



(train) Epoch=29, lr=0.2457 loss=1.565: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.22it/s]

train_loss=1.5652, train_accuracy=39.661%



(val) Epoch=29, loss=1.819: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.19it/s]

test_loss=1.8194, test_accuracy=36.150%
Epoch: 30



(train) Epoch=30, lr=0.2455 loss=1.539: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.37it/s]

train_loss=1.5390, train_accuracy=41.277%



(val) Epoch=30, loss=1.623: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.55it/s]

test_loss=1.6226, test_accuracy=38.220%
Epoch: 31



(train) Epoch=31, lr=0.2452 loss=1.520: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.90it/s]

train_loss=1.5204, train_accuracy=42.546%



(val) Epoch=31, loss=1.607: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.80it/s]

test_loss=1.6067, test_accuracy=38.600%
Epoch: 32



(train) Epoch=32, lr=0.2449 loss=1.477: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.08it/s]

train_loss=1.4773, train_accuracy=44.368%



(val) Epoch=32, loss=1.585: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.79it/s]

test_loss=1.5845, test_accuracy=40.450%
Epoch: 33



(train) Epoch=33, lr=0.2445 loss=1.460: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.79it/s]

train_loss=1.4595, train_accuracy=45.343%



(val) Epoch=33, loss=1.577: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.20it/s]

test_loss=1.5766, test_accuracy=42.180%
Epoch: 34



(train) Epoch=34, lr=0.2442 loss=1.415: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.38it/s]


train_loss=1.4153, train_accuracy=47.735%


(val) Epoch=34, loss=1.698: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.32it/s]

test_loss=1.6980, test_accuracy=39.520%
Epoch: 35



(train) Epoch=35, lr=0.2439 loss=1.446: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.29it/s]

train_loss=1.4461, train_accuracy=46.597%



(val) Epoch=35, loss=1.654: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.65it/s]

test_loss=1.6536, test_accuracy=44.010%
Epoch: 36



(train) Epoch=36, lr=0.2435 loss=1.404: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.44it/s]

train_loss=1.4044, train_accuracy=48.222%



(val) Epoch=36, loss=1.545: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.33it/s]

test_loss=1.5451, test_accuracy=40.870%
Epoch: 37



(train) Epoch=37, lr=0.2432 loss=1.373: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.41it/s]

train_loss=1.3735, train_accuracy=49.625%



(val) Epoch=37, loss=1.619: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.67it/s]

test_loss=1.6186, test_accuracy=40.110%
Epoch: 38



(train) Epoch=38, lr=0.2428 loss=1.368: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.39it/s]

train_loss=1.3680, train_accuracy=49.863%



(val) Epoch=38, loss=1.455: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.48it/s]

test_loss=1.4549, test_accuracy=46.850%
Epoch: 39



(train) Epoch=39, lr=0.2425 loss=1.346: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.51it/s]


train_loss=1.3459, train_accuracy=50.902%


(val) Epoch=39, loss=1.464: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.90it/s]

test_loss=1.4645, test_accuracy=46.880%
Epoch: 40



(train) Epoch=40, lr=0.2421 loss=1.321: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.40it/s]

train_loss=1.3211, train_accuracy=51.824%



(val) Epoch=40, loss=1.431: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.59it/s]


test_loss=1.4312, test_accuracy=49.270%
Epoch: 41


(train) Epoch=41, lr=0.2417 loss=1.319: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.61it/s]

train_loss=1.3192, train_accuracy=52.334%



(val) Epoch=41, loss=1.262: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.32it/s]

test_loss=1.2619, test_accuracy=54.240%
Epoch: 42



(train) Epoch=42, lr=0.2413 loss=1.279: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.19it/s]

train_loss=1.2791, train_accuracy=53.528%



(val) Epoch=42, loss=1.383: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.42it/s]

test_loss=1.3826, test_accuracy=50.690%
Epoch: 43



(train) Epoch=43, lr=0.2409 loss=1.289: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.47it/s]

train_loss=1.2892, train_accuracy=53.397%



(val) Epoch=43, loss=1.367: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.25it/s]

test_loss=1.3666, test_accuracy=50.560%
Epoch: 44



(train) Epoch=44, lr=0.2405 loss=1.253: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.01it/s]

train_loss=1.2529, train_accuracy=54.522%



(val) Epoch=44, loss=1.312: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.22it/s]

test_loss=1.3116, test_accuracy=51.770%
Epoch: 45



(train) Epoch=45, lr=0.2401 loss=1.255: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.62it/s]

train_loss=1.2553, train_accuracy=54.998%



(val) Epoch=45, loss=1.328: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.06it/s]

test_loss=1.3275, test_accuracy=52.600%
Epoch: 46



(train) Epoch=46, lr=0.2396 loss=1.239: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.70it/s]


train_loss=1.2388, train_accuracy=55.503%


(val) Epoch=46, loss=1.367: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.44it/s]

test_loss=1.3674, test_accuracy=52.900%
Epoch: 47



(train) Epoch=47, lr=0.2392 loss=1.220: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.23it/s]

train_loss=1.2200, train_accuracy=56.147%



(val) Epoch=47, loss=1.211: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.15it/s]

test_loss=1.2114, test_accuracy=56.160%
Epoch: 48



(train) Epoch=48, lr=0.2387 loss=1.229: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.29it/s]

train_loss=1.2288, train_accuracy=55.924%



(val) Epoch=48, loss=1.252: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.23it/s]


test_loss=1.2519, test_accuracy=55.850%
Epoch: 49


(train) Epoch=49, lr=0.2383 loss=1.197: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.97it/s]


train_loss=1.1968, train_accuracy=57.158%


(val) Epoch=49, loss=1.453: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.92it/s]


test_loss=1.4527, test_accuracy=48.850%
Epoch: 50


(train) Epoch=50, lr=0.2378 loss=1.209: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.03it/s]


train_loss=1.2088, train_accuracy=56.786%


(val) Epoch=50, loss=1.378: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.27it/s]

test_loss=1.3777, test_accuracy=51.420%
Epoch: 51



(train) Epoch=51, lr=0.2373 loss=1.197: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.31it/s]

train_loss=1.1972, train_accuracy=57.063%



(val) Epoch=51, loss=1.469: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.88it/s]

test_loss=1.4689, test_accuracy=48.170%
Epoch: 52



(train) Epoch=52, lr=0.2369 loss=1.181: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.92it/s]

train_loss=1.1806, train_accuracy=57.955%



(val) Epoch=52, loss=1.313: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.02it/s]

test_loss=1.3126, test_accuracy=52.060%
Epoch: 53



(train) Epoch=53, lr=0.2364 loss=1.177: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.61it/s]

train_loss=1.1767, train_accuracy=58.076%



(val) Epoch=53, loss=1.256: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.05it/s]

test_loss=1.2562, test_accuracy=54.680%
Epoch: 54



(train) Epoch=54, lr=0.2359 loss=1.163: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.95it/s]

train_loss=1.1628, train_accuracy=58.799%



(val) Epoch=54, loss=1.214: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.92it/s]

test_loss=1.2137, test_accuracy=57.580%
Epoch: 55



(train) Epoch=55, lr=0.2354 loss=1.154: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.35it/s]

train_loss=1.1544, train_accuracy=58.926%



(val) Epoch=55, loss=1.204: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.88it/s]

test_loss=1.2036, test_accuracy=57.220%
Epoch: 56



(train) Epoch=56, lr=0.2349 loss=1.147: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.08it/s]


train_loss=1.1471, train_accuracy=59.063%


(val) Epoch=56, loss=1.212: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.07it/s]

test_loss=1.2122, test_accuracy=56.590%
Epoch: 57



(train) Epoch=57, lr=0.2343 loss=1.156: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.72it/s]


train_loss=1.1564, train_accuracy=59.204%


(val) Epoch=57, loss=1.185: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.89it/s]

test_loss=1.1846, test_accuracy=58.570%
Epoch: 58



(train) Epoch=58, lr=0.2338 loss=1.125: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.45it/s]

train_loss=1.1247, train_accuracy=60.054%



(val) Epoch=58, loss=1.150: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.14it/s]

test_loss=1.1501, test_accuracy=58.450%
Epoch: 59



(train) Epoch=59, lr=0.2333 loss=1.126: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.47it/s]

train_loss=1.1261, train_accuracy=60.205%



(val) Epoch=59, loss=1.125: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.02it/s]

test_loss=1.1245, test_accuracy=59.890%
Epoch: 60



(train) Epoch=60, lr=0.2327 loss=1.108: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.44it/s]

train_loss=1.1077, train_accuracy=60.607%



(val) Epoch=60, loss=1.182: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.14it/s]


test_loss=1.1824, test_accuracy=57.800%
Epoch: 61


(train) Epoch=61, lr=0.2321 loss=1.111: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.61it/s]

train_loss=1.1108, train_accuracy=60.656%



(val) Epoch=61, loss=1.315: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.71it/s]

test_loss=1.3155, test_accuracy=56.040%
Epoch: 62



(train) Epoch=62, lr=0.2316 loss=1.094: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.83it/s]


train_loss=1.0939, train_accuracy=61.517%


(val) Epoch=62, loss=1.311: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.62it/s]


test_loss=1.3114, test_accuracy=55.680%
Epoch: 63


(train) Epoch=63, lr=0.2310 loss=1.106: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.88it/s]

train_loss=1.1060, train_accuracy=61.074%



(val) Epoch=63, loss=1.139: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.99it/s]

test_loss=1.1392, test_accuracy=59.240%
Epoch: 64



(train) Epoch=64, lr=0.2304 loss=1.087: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.24it/s]

train_loss=1.0872, train_accuracy=61.844%



(val) Epoch=64, loss=1.140: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.28it/s]

test_loss=1.1398, test_accuracy=60.050%
Epoch: 65



(train) Epoch=65, lr=0.2298 loss=1.067: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.25it/s]


train_loss=1.0666, train_accuracy=62.391%


(val) Epoch=65, loss=1.418: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.61it/s]

test_loss=1.4180, test_accuracy=53.020%
Epoch: 66



(train) Epoch=66, lr=0.2292 loss=1.078: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.24it/s]

train_loss=1.0776, train_accuracy=62.202%



(val) Epoch=66, loss=1.071: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.94it/s]

test_loss=1.0710, test_accuracy=62.070%
Epoch: 67



(train) Epoch=67, lr=0.2286 loss=1.054: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.79it/s]

train_loss=1.0537, train_accuracy=63.112%



(val) Epoch=67, loss=1.137: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.90it/s]

test_loss=1.1370, test_accuracy=62.050%
Epoch: 68



(train) Epoch=68, lr=0.2280 loss=1.054: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.92it/s]

train_loss=1.0541, train_accuracy=62.897%



(val) Epoch=68, loss=1.122: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.56it/s]

test_loss=1.1215, test_accuracy=60.820%
Epoch: 69



(train) Epoch=69, lr=0.2274 loss=1.061: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.85it/s]

train_loss=1.0605, train_accuracy=62.870%



(val) Epoch=69, loss=1.265: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.86it/s]

test_loss=1.2649, test_accuracy=58.490%
Epoch: 70



(train) Epoch=70, lr=0.2268 loss=1.041: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.33it/s]

train_loss=1.0415, train_accuracy=63.654%



(val) Epoch=70, loss=1.038: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.77it/s]

test_loss=1.0379, test_accuracy=63.360%
Epoch: 71



(train) Epoch=71, lr=0.2261 loss=1.047: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.62it/s]

train_loss=1.0473, train_accuracy=63.102%



(val) Epoch=71, loss=1.117: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 60.04it/s]

test_loss=1.1175, test_accuracy=60.900%
Epoch: 72



(train) Epoch=72, lr=0.2255 loss=1.026: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.18it/s]

train_loss=1.0263, train_accuracy=63.793%



(val) Epoch=72, loss=1.179: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.01it/s]

test_loss=1.1793, test_accuracy=60.060%
Epoch: 73



(train) Epoch=73, lr=0.2248 loss=1.029: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.54it/s]

train_loss=1.0294, train_accuracy=63.805%



(val) Epoch=73, loss=1.170: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.55it/s]

test_loss=1.1705, test_accuracy=60.180%
Epoch: 74



(train) Epoch=74, lr=0.2242 loss=1.027: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.72it/s]

train_loss=1.0267, train_accuracy=64.230%



(val) Epoch=74, loss=1.113: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.96it/s]

test_loss=1.1131, test_accuracy=60.260%
Epoch: 75



(train) Epoch=75, lr=0.2235 loss=1.012: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.41it/s]

train_loss=1.0117, train_accuracy=64.791%



(val) Epoch=75, loss=1.248: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.10it/s]

test_loss=1.2481, test_accuracy=59.010%
Epoch: 76



(train) Epoch=76, lr=0.2228 loss=1.004: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.19it/s]

train_loss=1.0038, train_accuracy=65.061%



(val) Epoch=76, loss=1.002: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.38it/s]

test_loss=1.0022, test_accuracy=65.140%
Epoch: 77



(train) Epoch=77, lr=0.2221 loss=1.007: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.01it/s]

train_loss=1.0067, train_accuracy=64.789%



(val) Epoch=77, loss=1.049: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.21it/s]

test_loss=1.0494, test_accuracy=64.380%
Epoch: 78



(train) Epoch=78, lr=0.2215 loss=0.991: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.28it/s]

train_loss=0.9906, train_accuracy=65.375%



(val) Epoch=78, loss=0.965: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.06it/s]


test_loss=0.9646, test_accuracy=66.610%
Epoch: 79


(train) Epoch=79, lr=0.2208 loss=1.004: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.32it/s]

train_loss=1.0040, train_accuracy=64.995%



(val) Epoch=79, loss=0.963: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.08it/s]

test_loss=0.9631, test_accuracy=67.000%
Epoch: 80



(train) Epoch=80, lr=0.2201 loss=1.000: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.63it/s]

train_loss=0.9997, train_accuracy=65.031%



(val) Epoch=80, loss=1.096: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.86it/s]

test_loss=1.0957, test_accuracy=62.620%
Epoch: 81



(train) Epoch=81, lr=0.2193 loss=0.979: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.43it/s]

train_loss=0.9790, train_accuracy=66.064%



(val) Epoch=81, loss=1.096: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.50it/s]

test_loss=1.0959, test_accuracy=61.580%
Epoch: 82



(train) Epoch=82, lr=0.2186 loss=0.970: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.16it/s]

train_loss=0.9699, train_accuracy=66.090%



(val) Epoch=82, loss=1.016: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.42it/s]

test_loss=1.0163, test_accuracy=66.640%
Epoch: 83



(train) Epoch=83, lr=0.2179 loss=0.987: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.95it/s]

train_loss=0.9874, train_accuracy=65.697%



(val) Epoch=83, loss=1.117: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.33it/s]

test_loss=1.1172, test_accuracy=63.190%
Epoch: 84



(train) Epoch=84, lr=0.2172 loss=0.964: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.40it/s]

train_loss=0.9641, train_accuracy=66.463%



(val) Epoch=84, loss=1.054: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.37it/s]

test_loss=1.0541, test_accuracy=63.350%
Epoch: 85



(train) Epoch=85, lr=0.2164 loss=0.967: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.83it/s]

train_loss=0.9671, train_accuracy=66.545%



(val) Epoch=85, loss=0.951: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.37it/s]


test_loss=0.9513, test_accuracy=67.390%
Epoch: 86


(train) Epoch=86, lr=0.2157 loss=0.969: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.33it/s]

train_loss=0.9688, train_accuracy=66.265%



(val) Epoch=86, loss=1.072: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.46it/s]

test_loss=1.0721, test_accuracy=63.230%
Epoch: 87



(train) Epoch=87, lr=0.2149 loss=0.971: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.88it/s]

train_loss=0.9712, train_accuracy=66.179%



(val) Epoch=87, loss=1.050: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.19it/s]

test_loss=1.0502, test_accuracy=64.500%
Epoch: 88



(train) Epoch=88, lr=0.2142 loss=0.957: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.71it/s]

train_loss=0.9569, train_accuracy=66.803%



(val) Epoch=88, loss=1.067: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.46it/s]

test_loss=1.0673, test_accuracy=62.670%
Epoch: 89



(train) Epoch=89, lr=0.2134 loss=0.933: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.58it/s]

train_loss=0.9329, train_accuracy=67.608%



(val) Epoch=89, loss=0.963: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.59it/s]

test_loss=0.9634, test_accuracy=66.570%
Epoch: 90



(train) Epoch=90, lr=0.2126 loss=0.946: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.90it/s]


train_loss=0.9459, train_accuracy=67.347%


(val) Epoch=90, loss=0.998: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.78it/s]

test_loss=0.9977, test_accuracy=64.510%
Epoch: 91



(train) Epoch=91, lr=0.2118 loss=0.951: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 32.88it/s]

train_loss=0.9510, train_accuracy=67.312%



(val) Epoch=91, loss=1.117: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.16it/s]

test_loss=1.1173, test_accuracy=60.840%
Epoch: 92



(train) Epoch=92, lr=0.2110 loss=0.925: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.28it/s]

train_loss=0.9250, train_accuracy=67.892%



(val) Epoch=92, loss=1.090: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.40it/s]

test_loss=1.0896, test_accuracy=63.080%
Epoch: 93



(train) Epoch=93, lr=0.2102 loss=0.934: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.36it/s]

train_loss=0.9338, train_accuracy=67.604%



(val) Epoch=93, loss=1.072: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.56it/s]

test_loss=1.0719, test_accuracy=63.970%
Epoch: 94



(train) Epoch=94, lr=0.2094 loss=0.923: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.47it/s]

train_loss=0.9233, train_accuracy=67.850%



(val) Epoch=94, loss=1.010: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.54it/s]

test_loss=1.0102, test_accuracy=66.320%
Epoch: 95



(train) Epoch=95, lr=0.2086 loss=0.923: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.68it/s]

train_loss=0.9228, train_accuracy=68.059%



(val) Epoch=95, loss=0.969: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.16it/s]

test_loss=0.9685, test_accuracy=66.730%
Epoch: 96



(train) Epoch=96, lr=0.2078 loss=0.912: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.60it/s]

train_loss=0.9124, train_accuracy=68.303%



(val) Epoch=96, loss=1.014: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.80it/s]

test_loss=1.0142, test_accuracy=65.130%
Epoch: 97



(train) Epoch=97, lr=0.2070 loss=0.926: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.61it/s]

train_loss=0.9257, train_accuracy=67.798%



(val) Epoch=97, loss=0.975: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.73it/s]

test_loss=0.9750, test_accuracy=66.170%
Epoch: 98



(train) Epoch=98, lr=0.2062 loss=0.918: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.37it/s]

train_loss=0.9184, train_accuracy=68.269%



(val) Epoch=98, loss=1.104: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.63it/s]


test_loss=1.1035, test_accuracy=64.040%
Epoch: 99


(train) Epoch=99, lr=0.2053 loss=0.901: 100%|██████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.58it/s]

train_loss=0.9012, train_accuracy=68.937%



(val) Epoch=99, loss=0.941: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.01it/s]


test_loss=0.9407, test_accuracy=68.510%
Epoch: 100


(train) Epoch=100, lr=0.2045 loss=0.906: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.80it/s]

train_loss=0.9065, train_accuracy=68.639%



(val) Epoch=100, loss=1.028: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.35it/s]

test_loss=1.0283, test_accuracy=66.400%
Epoch: 101



(train) Epoch=101, lr=0.2037 loss=0.907: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.78it/s]

train_loss=0.9068, train_accuracy=68.736%



(val) Epoch=101, loss=1.044: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.64it/s]


test_loss=1.0438, test_accuracy=64.320%
Epoch: 102


(train) Epoch=102, lr=0.2028 loss=0.903: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.09it/s]

train_loss=0.9025, train_accuracy=68.796%



(val) Epoch=102, loss=0.937: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.25it/s]


test_loss=0.9370, test_accuracy=67.870%
Epoch: 103


(train) Epoch=103, lr=0.2020 loss=0.888: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.55it/s]

train_loss=0.8876, train_accuracy=69.300%



(val) Epoch=103, loss=1.151: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.47it/s]

test_loss=1.1509, test_accuracy=61.970%
Epoch: 104



(train) Epoch=104, lr=0.2011 loss=0.897: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.00it/s]

train_loss=0.8975, train_accuracy=68.974%



(val) Epoch=104, loss=1.015: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.24it/s]

test_loss=1.0153, test_accuracy=65.980%
Epoch: 105



(train) Epoch=105, lr=0.2002 loss=0.881: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.16it/s]

train_loss=0.8806, train_accuracy=69.533%



(val) Epoch=105, loss=0.968: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.89it/s]

test_loss=0.9681, test_accuracy=68.330%
Epoch: 106



(train) Epoch=106, lr=0.1994 loss=0.885: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.58it/s]

train_loss=0.8850, train_accuracy=69.533%



(val) Epoch=106, loss=0.999: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.45it/s]

test_loss=0.9988, test_accuracy=65.470%
Epoch: 107



(train) Epoch=107, lr=0.1985 loss=0.879: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.55it/s]

train_loss=0.8793, train_accuracy=69.503%



(val) Epoch=107, loss=0.881: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.31it/s]

test_loss=0.8812, test_accuracy=69.920%
Epoch: 108



(train) Epoch=108, lr=0.1976 loss=0.880: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.83it/s]

train_loss=0.8796, train_accuracy=69.505%



(val) Epoch=108, loss=0.899: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.72it/s]

test_loss=0.8993, test_accuracy=68.780%
Epoch: 109



(train) Epoch=109, lr=0.1967 loss=0.892: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.79it/s]

train_loss=0.8917, train_accuracy=69.209%



(val) Epoch=109, loss=1.079: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.14it/s]

test_loss=1.0786, test_accuracy=63.760%
Epoch: 110



(train) Epoch=110, lr=0.1958 loss=0.880: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.18it/s]

train_loss=0.8796, train_accuracy=69.743%



(val) Epoch=110, loss=1.117: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.76it/s]


test_loss=1.1172, test_accuracy=62.330%
Epoch: 111


(train) Epoch=111, lr=0.1949 loss=0.867: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.67it/s]

train_loss=0.8674, train_accuracy=69.984%



(val) Epoch=111, loss=0.894: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.34it/s]

test_loss=0.8943, test_accuracy=70.450%
Epoch: 112



(train) Epoch=112, lr=0.1940 loss=0.854: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.23it/s]

train_loss=0.8542, train_accuracy=70.520%



(val) Epoch=112, loss=0.955: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.94it/s]

test_loss=0.9553, test_accuracy=68.270%
Epoch: 113



(train) Epoch=113, lr=0.1931 loss=0.856: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.30it/s]

train_loss=0.8558, train_accuracy=70.296%



(val) Epoch=113, loss=0.944: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.34it/s]

test_loss=0.9441, test_accuracy=67.950%
Epoch: 114



(train) Epoch=114, lr=0.1922 loss=0.855: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.53it/s]

train_loss=0.8547, train_accuracy=70.439%



(val) Epoch=114, loss=1.101: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.62it/s]


test_loss=1.1007, test_accuracy=63.040%
Epoch: 115


(train) Epoch=115, lr=0.1912 loss=0.861: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.92it/s]

train_loss=0.8609, train_accuracy=70.268%



(val) Epoch=115, loss=1.000: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.12it/s]

test_loss=1.0001, test_accuracy=65.960%
Epoch: 116



(train) Epoch=116, lr=0.1903 loss=0.843: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.91it/s]

train_loss=0.8425, train_accuracy=70.838%



(val) Epoch=116, loss=0.968: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.63it/s]


test_loss=0.9678, test_accuracy=67.130%
Epoch: 117


(train) Epoch=117, lr=0.1894 loss=0.852: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.00it/s]

train_loss=0.8522, train_accuracy=70.550%



(val) Epoch=117, loss=0.834: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.81it/s]

test_loss=0.8339, test_accuracy=71.430%
Epoch: 118



(train) Epoch=118, lr=0.1884 loss=0.845: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.08it/s]

train_loss=0.8449, train_accuracy=71.031%



(val) Epoch=118, loss=0.857: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.05it/s]

test_loss=0.8573, test_accuracy=71.430%
Epoch: 119



(train) Epoch=119, lr=0.1875 loss=0.840: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.29it/s]

train_loss=0.8403, train_accuracy=71.088%



(val) Epoch=119, loss=1.026: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.84it/s]

test_loss=1.0256, test_accuracy=63.800%
Epoch: 120



(train) Epoch=120, lr=0.1866 loss=0.831: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.67it/s]

train_loss=0.8311, train_accuracy=71.311%



(val) Epoch=120, loss=0.847: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.06it/s]

test_loss=0.8474, test_accuracy=71.010%
Epoch: 121



(train) Epoch=121, lr=0.1856 loss=0.832: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.78it/s]

train_loss=0.8320, train_accuracy=71.235%



(val) Epoch=121, loss=1.017: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.36it/s]


test_loss=1.0171, test_accuracy=66.210%
Epoch: 122


(train) Epoch=122, lr=0.1846 loss=0.835: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.00it/s]

train_loss=0.8347, train_accuracy=71.255%



(val) Epoch=122, loss=0.937: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.99it/s]

test_loss=0.9367, test_accuracy=68.310%
Epoch: 123



(train) Epoch=123, lr=0.1837 loss=0.822: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.74it/s]

train_loss=0.8223, train_accuracy=71.730%



(val) Epoch=123, loss=0.954: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.88it/s]


test_loss=0.9540, test_accuracy=67.150%
Epoch: 124


(train) Epoch=124, lr=0.1827 loss=0.830: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.64it/s]


train_loss=0.8299, train_accuracy=71.400%


(val) Epoch=124, loss=1.046: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.58it/s]

test_loss=1.0463, test_accuracy=65.130%
Epoch: 125



(train) Epoch=125, lr=0.1817 loss=0.820: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.67it/s]

train_loss=0.8199, train_accuracy=71.774%



(val) Epoch=125, loss=0.831: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.12it/s]

test_loss=0.8312, test_accuracy=71.940%
Epoch: 126



(train) Epoch=126, lr=0.1808 loss=0.811: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.61it/s]

train_loss=0.8108, train_accuracy=72.117%



(val) Epoch=126, loss=1.165: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.60it/s]


test_loss=1.1645, test_accuracy=63.960%
Epoch: 127


(train) Epoch=127, lr=0.1798 loss=0.820: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.39it/s]

train_loss=0.8197, train_accuracy=71.831%



(val) Epoch=127, loss=0.878: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.02it/s]

test_loss=0.8776, test_accuracy=71.420%
Epoch: 128



(train) Epoch=128, lr=0.1788 loss=0.810: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.02it/s]

train_loss=0.8104, train_accuracy=71.891%



(val) Epoch=128, loss=0.912: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.10it/s]

test_loss=0.9118, test_accuracy=68.110%
Epoch: 129



(train) Epoch=129, lr=0.1778 loss=0.831: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.28it/s]

train_loss=0.8307, train_accuracy=71.353%



(val) Epoch=129, loss=0.934: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.42it/s]


test_loss=0.9337, test_accuracy=70.170%
Epoch: 130


(train) Epoch=130, lr=0.1768 loss=0.810: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.71it/s]

train_loss=0.8098, train_accuracy=72.044%



(val) Epoch=130, loss=0.937: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.03it/s]

test_loss=0.9371, test_accuracy=67.600%
Epoch: 131



(train) Epoch=131, lr=0.1758 loss=0.815: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.83it/s]

train_loss=0.8151, train_accuracy=71.937%



(val) Epoch=131, loss=0.958: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.61it/s]

test_loss=0.9584, test_accuracy=68.320%
Epoch: 132



(train) Epoch=132, lr=0.1748 loss=0.794: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.01it/s]

train_loss=0.7942, train_accuracy=72.541%



(val) Epoch=132, loss=0.932: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.58it/s]

test_loss=0.9320, test_accuracy=67.750%
Epoch: 133



(train) Epoch=133, lr=0.1738 loss=0.799: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.24it/s]

train_loss=0.7986, train_accuracy=72.449%



(val) Epoch=133, loss=0.806: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.83it/s]

test_loss=0.8056, test_accuracy=71.980%
Epoch: 134



(train) Epoch=134, lr=0.1728 loss=0.782: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.77it/s]

train_loss=0.7819, train_accuracy=73.091%



(val) Epoch=134, loss=0.865: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.78it/s]

test_loss=0.8649, test_accuracy=70.710%
Epoch: 135



(train) Epoch=135, lr=0.1718 loss=0.795: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.38it/s]

train_loss=0.7949, train_accuracy=72.560%



(val) Epoch=135, loss=0.809: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.22it/s]

test_loss=0.8086, test_accuracy=73.210%
Epoch: 136



(train) Epoch=136, lr=0.1708 loss=0.793: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.30it/s]

train_loss=0.7925, train_accuracy=72.636%



(val) Epoch=136, loss=0.845: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.77it/s]


test_loss=0.8454, test_accuracy=71.280%
Epoch: 137


(train) Epoch=137, lr=0.1698 loss=0.801: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.68it/s]

train_loss=0.8011, train_accuracy=72.229%



(val) Epoch=137, loss=0.938: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.63it/s]

test_loss=0.9382, test_accuracy=69.890%
Epoch: 138



(train) Epoch=138, lr=0.1688 loss=0.781: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.98it/s]

train_loss=0.7813, train_accuracy=73.212%



(val) Epoch=138, loss=0.829: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.14it/s]

test_loss=0.8291, test_accuracy=71.710%
Epoch: 139



(train) Epoch=139, lr=0.1678 loss=0.791: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.51it/s]

train_loss=0.7915, train_accuracy=72.751%



(val) Epoch=139, loss=0.902: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.77it/s]

test_loss=0.9018, test_accuracy=70.650%
Epoch: 140



(train) Epoch=140, lr=0.1667 loss=0.783: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.95it/s]

train_loss=0.7827, train_accuracy=73.043%



(val) Epoch=140, loss=1.025: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.98it/s]

test_loss=1.0253, test_accuracy=66.420%
Epoch: 141



(train) Epoch=141, lr=0.1657 loss=0.786: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.29it/s]

train_loss=0.7863, train_accuracy=73.083%



(val) Epoch=141, loss=0.877: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.88it/s]

test_loss=0.8769, test_accuracy=71.520%
Epoch: 142



(train) Epoch=142, lr=0.1647 loss=0.777: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.40it/s]

train_loss=0.7770, train_accuracy=73.347%



(val) Epoch=142, loss=0.935: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.91it/s]

test_loss=0.9346, test_accuracy=69.150%
Epoch: 143



(train) Epoch=143, lr=0.1636 loss=0.777: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.46it/s]

train_loss=0.7766, train_accuracy=73.321%



(val) Epoch=143, loss=1.158: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.29it/s]


test_loss=1.1577, test_accuracy=62.230%
Epoch: 144


(train) Epoch=144, lr=0.1626 loss=0.768: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.45it/s]


train_loss=0.7679, train_accuracy=73.709%


(val) Epoch=144, loss=0.838: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.22it/s]


test_loss=0.8378, test_accuracy=71.850%
Epoch: 145


(train) Epoch=145, lr=0.1615 loss=0.770: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.20it/s]

train_loss=0.7696, train_accuracy=73.254%



(val) Epoch=145, loss=0.927: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.01it/s]

test_loss=0.9274, test_accuracy=67.710%
Epoch: 146



(train) Epoch=146, lr=0.1605 loss=0.775: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.78it/s]

train_loss=0.7750, train_accuracy=73.262%



(val) Epoch=146, loss=0.839: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.57it/s]

test_loss=0.8392, test_accuracy=70.640%
Epoch: 147



(train) Epoch=147, lr=0.1595 loss=0.769: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.45it/s]

train_loss=0.7691, train_accuracy=73.649%



(val) Epoch=147, loss=0.842: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.60it/s]

test_loss=0.8420, test_accuracy=71.530%
Epoch: 148



(train) Epoch=148, lr=0.1584 loss=0.769: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.32it/s]

train_loss=0.7693, train_accuracy=73.476%



(val) Epoch=148, loss=0.845: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.78it/s]


test_loss=0.8448, test_accuracy=70.960%
Epoch: 149


(train) Epoch=149, lr=0.1574 loss=0.763: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.77it/s]

train_loss=0.7629, train_accuracy=73.721%



(val) Epoch=149, loss=0.944: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 49.96it/s]

test_loss=0.9441, test_accuracy=69.010%
Epoch: 150



(train) Epoch=150, lr=0.1563 loss=0.753: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.30it/s]

train_loss=0.7525, train_accuracy=74.454%



(val) Epoch=150, loss=0.819: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.77it/s]

test_loss=0.8195, test_accuracy=72.020%
Epoch: 151



(train) Epoch=151, lr=0.1552 loss=0.753: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.20it/s]

train_loss=0.7526, train_accuracy=74.138%



(val) Epoch=151, loss=0.935: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.80it/s]

test_loss=0.9345, test_accuracy=68.650%
Epoch: 152



(train) Epoch=152, lr=0.1542 loss=0.753: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.16it/s]


train_loss=0.7530, train_accuracy=73.997%


(val) Epoch=152, loss=0.906: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.01it/s]

test_loss=0.9059, test_accuracy=69.610%
Epoch: 153



(train) Epoch=153, lr=0.1531 loss=0.747: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.39it/s]

train_loss=0.7468, train_accuracy=74.408%



(val) Epoch=153, loss=0.756: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.88it/s]

test_loss=0.7563, test_accuracy=74.750%
Epoch: 154



(train) Epoch=154, lr=0.1521 loss=0.755: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.57it/s]

train_loss=0.7553, train_accuracy=74.237%



(val) Epoch=154, loss=0.779: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.86it/s]

test_loss=0.7791, test_accuracy=74.020%
Epoch: 155



(train) Epoch=155, lr=0.1510 loss=0.740: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.89it/s]

train_loss=0.7403, train_accuracy=74.253%



(val) Epoch=155, loss=0.913: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.15it/s]


test_loss=0.9128, test_accuracy=69.510%
Epoch: 156


(train) Epoch=156, lr=0.1499 loss=0.741: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.75it/s]

train_loss=0.7414, train_accuracy=74.662%



(val) Epoch=156, loss=0.901: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.44it/s]

test_loss=0.9010, test_accuracy=69.340%
Epoch: 157



(train) Epoch=157, lr=0.1489 loss=0.743: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.41it/s]

train_loss=0.7429, train_accuracy=74.436%



(val) Epoch=157, loss=0.926: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.05it/s]

test_loss=0.9260, test_accuracy=68.980%
Epoch: 158



(train) Epoch=158, lr=0.1478 loss=0.739: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.05it/s]

train_loss=0.7388, train_accuracy=74.662%



(val) Epoch=158, loss=0.908: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.28it/s]

test_loss=0.9081, test_accuracy=70.070%
Epoch: 159



(train) Epoch=159, lr=0.1467 loss=0.743: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.06it/s]

train_loss=0.7429, train_accuracy=74.573%



(val) Epoch=159, loss=0.841: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.85it/s]


test_loss=0.8408, test_accuracy=71.310%
Epoch: 160


(train) Epoch=160, lr=0.1456 loss=0.729: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.68it/s]


train_loss=0.7289, train_accuracy=74.954%


(val) Epoch=160, loss=0.964: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.59it/s]

test_loss=0.9643, test_accuracy=67.400%
Epoch: 161



(train) Epoch=161, lr=0.1446 loss=0.724: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.72it/s]

train_loss=0.7241, train_accuracy=75.125%



(val) Epoch=161, loss=1.022: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.91it/s]

test_loss=1.0216, test_accuracy=65.900%
Epoch: 162



(train) Epoch=162, lr=0.1435 loss=0.732: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.91it/s]


train_loss=0.7320, train_accuracy=74.746%


(val) Epoch=162, loss=0.830: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.86it/s]

test_loss=0.8299, test_accuracy=72.290%
Epoch: 163



(train) Epoch=163, lr=0.1424 loss=0.720: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.31it/s]

train_loss=0.7200, train_accuracy=75.187%



(val) Epoch=163, loss=0.842: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.93it/s]

test_loss=0.8420, test_accuracy=71.040%
Epoch: 164



(train) Epoch=164, lr=0.1413 loss=0.733: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.93it/s]

train_loss=0.7331, train_accuracy=74.841%



(val) Epoch=164, loss=1.027: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.88it/s]

test_loss=1.0269, test_accuracy=64.610%
Epoch: 165



(train) Epoch=165, lr=0.1402 loss=0.719: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.64it/s]

train_loss=0.7195, train_accuracy=75.326%



(val) Epoch=165, loss=1.018: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.11it/s]

test_loss=1.0184, test_accuracy=68.170%
Epoch: 166



(train) Epoch=166, lr=0.1392 loss=0.716: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.17it/s]

train_loss=0.7162, train_accuracy=75.340%



(val) Epoch=166, loss=0.861: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.90it/s]

test_loss=0.8607, test_accuracy=71.850%
Epoch: 167



(train) Epoch=167, lr=0.1381 loss=0.717: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.63it/s]


train_loss=0.7166, train_accuracy=75.312%


(val) Epoch=167, loss=0.851: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.72it/s]

test_loss=0.8509, test_accuracy=71.580%
Epoch: 168



(train) Epoch=168, lr=0.1370 loss=0.720: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.97it/s]

train_loss=0.7195, train_accuracy=75.421%



(val) Epoch=168, loss=0.817: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.98it/s]

test_loss=0.8169, test_accuracy=72.850%
Epoch: 169



(train) Epoch=169, lr=0.1359 loss=0.714: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 32.84it/s]

train_loss=0.7144, train_accuracy=75.463%



(val) Epoch=169, loss=0.841: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.39it/s]

test_loss=0.8406, test_accuracy=71.730%
Epoch: 170



(train) Epoch=170, lr=0.1348 loss=0.710: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.85it/s]

train_loss=0.7101, train_accuracy=75.536%



(val) Epoch=170, loss=1.111: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.44it/s]

test_loss=1.1106, test_accuracy=64.720%
Epoch: 171



(train) Epoch=171, lr=0.1337 loss=0.723: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.54it/s]

train_loss=0.7233, train_accuracy=75.014%



(val) Epoch=171, loss=0.806: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.12it/s]

test_loss=0.8055, test_accuracy=72.400%
Epoch: 172



(train) Epoch=172, lr=0.1326 loss=0.701: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.97it/s]

train_loss=0.7011, train_accuracy=75.791%



(val) Epoch=172, loss=0.775: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.33it/s]

test_loss=0.7755, test_accuracy=73.600%
Epoch: 173



(train) Epoch=173, lr=0.1315 loss=0.696: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.85it/s]

train_loss=0.6959, train_accuracy=76.156%



(val) Epoch=173, loss=0.836: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.07it/s]

test_loss=0.8361, test_accuracy=71.780%
Epoch: 174



(train) Epoch=174, lr=0.1305 loss=0.698: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.11it/s]

train_loss=0.6980, train_accuracy=76.057%



(val) Epoch=174, loss=0.761: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.21it/s]


test_loss=0.7611, test_accuracy=74.690%
Epoch: 175


(train) Epoch=175, lr=0.1294 loss=0.690: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.93it/s]

train_loss=0.6899, train_accuracy=76.198%



(val) Epoch=175, loss=0.856: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.22it/s]

test_loss=0.8558, test_accuracy=71.400%
Epoch: 176



(train) Epoch=176, lr=0.1283 loss=0.690: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.14it/s]

train_loss=0.6904, train_accuracy=76.333%



(val) Epoch=176, loss=0.718: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.07it/s]

test_loss=0.7176, test_accuracy=75.640%
Epoch: 177



(train) Epoch=177, lr=0.1272 loss=0.687: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.27it/s]


train_loss=0.6874, train_accuracy=76.456%


(val) Epoch=177, loss=0.822: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.91it/s]

test_loss=0.8218, test_accuracy=72.040%
Epoch: 178



(train) Epoch=178, lr=0.1261 loss=0.697: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.68it/s]

train_loss=0.6966, train_accuracy=76.023%



(val) Epoch=178, loss=0.783: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.10it/s]

test_loss=0.7830, test_accuracy=74.090%
Epoch: 179



(train) Epoch=179, lr=0.1250 loss=0.696: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.72it/s]

train_loss=0.6965, train_accuracy=76.031%



(val) Epoch=179, loss=0.823: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.24it/s]

test_loss=0.8230, test_accuracy=72.610%
Epoch: 180



(train) Epoch=180, lr=0.1239 loss=0.688: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.62it/s]

train_loss=0.6883, train_accuracy=76.367%



(val) Epoch=180, loss=0.733: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.98it/s]

test_loss=0.7333, test_accuracy=75.910%
Epoch: 181



(train) Epoch=181, lr=0.1228 loss=0.689: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.81it/s]

train_loss=0.6892, train_accuracy=76.281%



(val) Epoch=181, loss=0.777: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.54it/s]

test_loss=0.7766, test_accuracy=73.300%
Epoch: 182



(train) Epoch=182, lr=0.1217 loss=0.675: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.09it/s]

train_loss=0.6754, train_accuracy=76.756%



(val) Epoch=182, loss=0.695: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.70it/s]

test_loss=0.6955, test_accuracy=76.230%
Epoch: 183



(train) Epoch=183, lr=0.1206 loss=0.671: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.47it/s]

train_loss=0.6705, train_accuracy=76.903%



(val) Epoch=183, loss=0.714: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.75it/s]

test_loss=0.7139, test_accuracy=76.090%
Epoch: 184



(train) Epoch=184, lr=0.1195 loss=0.680: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.29it/s]

train_loss=0.6799, train_accuracy=76.401%



(val) Epoch=184, loss=0.787: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.27it/s]

test_loss=0.7873, test_accuracy=74.130%
Epoch: 185



(train) Epoch=185, lr=0.1185 loss=0.670: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 32.64it/s]

train_loss=0.6700, train_accuracy=77.078%



(val) Epoch=185, loss=0.815: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.63it/s]

test_loss=0.8146, test_accuracy=72.970%
Epoch: 186



(train) Epoch=186, lr=0.1174 loss=0.674: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.01it/s]

train_loss=0.6739, train_accuracy=76.812%



(val) Epoch=186, loss=0.690: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 50.85it/s]

test_loss=0.6897, test_accuracy=76.360%
Epoch: 187



(train) Epoch=187, lr=0.1163 loss=0.692: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.50it/s]

train_loss=0.6922, train_accuracy=76.136%



(val) Epoch=187, loss=0.842: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.25it/s]

test_loss=0.8417, test_accuracy=72.150%
Epoch: 188



(train) Epoch=188, lr=0.1152 loss=0.668: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.41it/s]

train_loss=0.6676, train_accuracy=76.945%



(val) Epoch=188, loss=0.711: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.19it/s]

test_loss=0.7111, test_accuracy=75.470%
Epoch: 189



(train) Epoch=189, lr=0.1141 loss=0.670: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.29it/s]


train_loss=0.6703, train_accuracy=76.705%


(val) Epoch=189, loss=0.755: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.99it/s]

test_loss=0.7555, test_accuracy=74.840%
Epoch: 190



(train) Epoch=190, lr=0.1130 loss=0.661: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.70it/s]

train_loss=0.6614, train_accuracy=77.281%



(val) Epoch=190, loss=0.750: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.68it/s]

test_loss=0.7502, test_accuracy=75.710%
Epoch: 191



(train) Epoch=191, lr=0.1119 loss=0.670: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.63it/s]

train_loss=0.6699, train_accuracy=76.947%



(val) Epoch=191, loss=0.793: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.62it/s]

test_loss=0.7930, test_accuracy=72.510%
Epoch: 192



(train) Epoch=192, lr=0.1108 loss=0.668: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.19it/s]

train_loss=0.6684, train_accuracy=76.826%



(val) Epoch=192, loss=0.788: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 49.84it/s]

test_loss=0.7876, test_accuracy=73.870%
Epoch: 193



(train) Epoch=193, lr=0.1098 loss=0.660: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.23it/s]

train_loss=0.6596, train_accuracy=77.120%



(val) Epoch=193, loss=0.726: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.01it/s]

test_loss=0.7255, test_accuracy=75.830%
Epoch: 194



(train) Epoch=194, lr=0.1087 loss=0.656: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.71it/s]

train_loss=0.6555, train_accuracy=77.452%



(val) Epoch=194, loss=0.695: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.23it/s]

test_loss=0.6955, test_accuracy=76.530%
Epoch: 195



(train) Epoch=195, lr=0.1076 loss=0.658: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.89it/s]

train_loss=0.6578, train_accuracy=77.408%



(val) Epoch=195, loss=0.873: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.92it/s]

test_loss=0.8729, test_accuracy=70.210%
Epoch: 196



(train) Epoch=196, lr=0.1065 loss=0.650: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.07it/s]

train_loss=0.6496, train_accuracy=77.656%



(val) Epoch=196, loss=0.720: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.78it/s]

test_loss=0.7201, test_accuracy=75.460%
Epoch: 197



(train) Epoch=197, lr=0.1054 loss=0.657: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.84it/s]

train_loss=0.6567, train_accuracy=77.314%



(val) Epoch=197, loss=0.729: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.53it/s]

test_loss=0.7290, test_accuracy=76.140%
Epoch: 198



(train) Epoch=198, lr=0.1044 loss=0.644: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.74it/s]

train_loss=0.6438, train_accuracy=78.133%



(val) Epoch=198, loss=0.682: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.43it/s]

test_loss=0.6818, test_accuracy=77.410%
Epoch: 199



(train) Epoch=199, lr=0.1033 loss=0.645: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.71it/s]

train_loss=0.6452, train_accuracy=77.748%



(val) Epoch=199, loss=0.705: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.03it/s]

test_loss=0.7048, test_accuracy=76.320%
Epoch: 200



(train) Epoch=200, lr=0.1022 loss=0.642: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.53it/s]

train_loss=0.6420, train_accuracy=78.008%



(val) Epoch=200, loss=0.796: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.51it/s]

test_loss=0.7963, test_accuracy=73.750%
Epoch: 201



(train) Epoch=201, lr=0.1011 loss=0.639: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.04it/s]

train_loss=0.6394, train_accuracy=77.948%



(val) Epoch=201, loss=0.795: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.77it/s]

test_loss=0.7946, test_accuracy=72.900%
Epoch: 202



(train) Epoch=202, lr=0.1001 loss=0.647: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.39it/s]

train_loss=0.6468, train_accuracy=77.781%



(val) Epoch=202, loss=0.695: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.89it/s]

test_loss=0.6949, test_accuracy=76.720%
Epoch: 203



(train) Epoch=203, lr=0.0990 loss=0.643: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.75it/s]


train_loss=0.6430, train_accuracy=77.992%


(val) Epoch=203, loss=0.702: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.14it/s]

test_loss=0.7016, test_accuracy=76.850%
Epoch: 204



(train) Epoch=204, lr=0.0979 loss=0.650: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.10it/s]

train_loss=0.6501, train_accuracy=77.614%



(val) Epoch=204, loss=0.679: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.58it/s]

test_loss=0.6790, test_accuracy=76.800%
Epoch: 205



(train) Epoch=205, lr=0.0969 loss=0.628: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.25it/s]

train_loss=0.6282, train_accuracy=78.431%



(val) Epoch=205, loss=0.812: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.28it/s]

test_loss=0.8116, test_accuracy=73.450%
Epoch: 206



(train) Epoch=206, lr=0.0958 loss=0.637: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.33it/s]

train_loss=0.6375, train_accuracy=78.065%



(val) Epoch=206, loss=0.887: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.10it/s]

test_loss=0.8868, test_accuracy=72.770%
Epoch: 207



(train) Epoch=207, lr=0.0948 loss=0.622: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.93it/s]

train_loss=0.6218, train_accuracy=78.679%



(val) Epoch=207, loss=0.736: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.49it/s]


test_loss=0.7363, test_accuracy=75.530%
Epoch: 208


(train) Epoch=208, lr=0.0937 loss=0.622: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.69it/s]


train_loss=0.6219, train_accuracy=78.659%


(val) Epoch=208, loss=0.738: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.25it/s]

test_loss=0.7382, test_accuracy=75.730%
Epoch: 209



(train) Epoch=209, lr=0.0926 loss=0.631: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.49it/s]

train_loss=0.6313, train_accuracy=78.109%



(val) Epoch=209, loss=0.777: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.80it/s]

test_loss=0.7775, test_accuracy=73.550%
Epoch: 210



(train) Epoch=210, lr=0.0916 loss=0.621: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.76it/s]

train_loss=0.6213, train_accuracy=78.453%



(val) Epoch=210, loss=0.742: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.49it/s]


test_loss=0.7422, test_accuracy=75.360%
Epoch: 211


(train) Epoch=211, lr=0.0905 loss=0.617: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.43it/s]

train_loss=0.6174, train_accuracy=78.896%



(val) Epoch=211, loss=0.660: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.29it/s]

test_loss=0.6595, test_accuracy=77.810%
Epoch: 212



(train) Epoch=212, lr=0.0895 loss=0.629: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.16it/s]


train_loss=0.6291, train_accuracy=78.518%


(val) Epoch=212, loss=0.665: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.10it/s]


test_loss=0.6654, test_accuracy=77.080%
Epoch: 213


(train) Epoch=213, lr=0.0885 loss=0.616: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.55it/s]

train_loss=0.6165, train_accuracy=78.777%



(val) Epoch=213, loss=0.742: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.87it/s]

test_loss=0.7421, test_accuracy=76.000%
Epoch: 214



(train) Epoch=214, lr=0.0874 loss=0.621: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.92it/s]


train_loss=0.6210, train_accuracy=78.594%


(val) Epoch=214, loss=0.755: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.50it/s]

test_loss=0.7550, test_accuracy=74.470%
Epoch: 215



(train) Epoch=215, lr=0.0864 loss=0.614: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.49it/s]

train_loss=0.6143, train_accuracy=79.021%



(val) Epoch=215, loss=0.770: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.95it/s]


test_loss=0.7704, test_accuracy=74.630%
Epoch: 216


(train) Epoch=216, lr=0.0853 loss=0.607: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.36it/s]

train_loss=0.6070, train_accuracy=79.053%



(val) Epoch=216, loss=0.763: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.20it/s]

test_loss=0.7628, test_accuracy=75.470%
Epoch: 217



(train) Epoch=217, lr=0.0843 loss=0.609: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.33it/s]

train_loss=0.6089, train_accuracy=79.083%



(val) Epoch=217, loss=0.726: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.75it/s]


test_loss=0.7257, test_accuracy=75.870%
Epoch: 218


(train) Epoch=218, lr=0.0833 loss=0.608: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.65it/s]

train_loss=0.6082, train_accuracy=79.124%



(val) Epoch=218, loss=0.835: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.18it/s]


test_loss=0.8351, test_accuracy=70.500%
Epoch: 219


(train) Epoch=219, lr=0.0822 loss=0.610: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.94it/s]

train_loss=0.6095, train_accuracy=79.255%



(val) Epoch=219, loss=0.689: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.89it/s]

test_loss=0.6886, test_accuracy=77.060%
Epoch: 220



(train) Epoch=220, lr=0.0812 loss=0.595: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.37it/s]


train_loss=0.5945, train_accuracy=79.432%


(val) Epoch=220, loss=0.646: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.57it/s]

test_loss=0.6463, test_accuracy=78.150%
Epoch: 221



(train) Epoch=221, lr=0.0802 loss=0.589: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.41it/s]

train_loss=0.5888, train_accuracy=79.633%



(val) Epoch=221, loss=0.709: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.53it/s]

test_loss=0.7087, test_accuracy=75.830%
Epoch: 222



(train) Epoch=222, lr=0.0792 loss=0.596: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.07it/s]

train_loss=0.5964, train_accuracy=79.440%



(val) Epoch=222, loss=0.756: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.28it/s]

test_loss=0.7557, test_accuracy=74.490%
Epoch: 223



(train) Epoch=223, lr=0.0782 loss=0.597: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.85it/s]

train_loss=0.5972, train_accuracy=79.313%



(val) Epoch=223, loss=0.715: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.32it/s]

test_loss=0.7153, test_accuracy=76.100%
Epoch: 224



(train) Epoch=224, lr=0.0772 loss=0.595: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.86it/s]

train_loss=0.5949, train_accuracy=79.625%



(val) Epoch=224, loss=0.681: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.53it/s]

test_loss=0.6808, test_accuracy=77.420%
Epoch: 225



(train) Epoch=225, lr=0.0762 loss=0.584: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.70it/s]

train_loss=0.5844, train_accuracy=79.780%



(val) Epoch=225, loss=0.629: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.09it/s]

test_loss=0.6295, test_accuracy=78.960%
Epoch: 226



(train) Epoch=226, lr=0.0752 loss=0.578: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.09it/s]

train_loss=0.5784, train_accuracy=79.983%



(val) Epoch=226, loss=0.635: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.83it/s]

test_loss=0.6349, test_accuracy=78.780%
Epoch: 227



(train) Epoch=227, lr=0.0742 loss=0.575: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.18it/s]

train_loss=0.5745, train_accuracy=80.072%



(val) Epoch=227, loss=0.644: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.06it/s]


test_loss=0.6441, test_accuracy=78.820%
Epoch: 228


(train) Epoch=228, lr=0.0732 loss=0.579: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.64it/s]

train_loss=0.5792, train_accuracy=80.072%



(val) Epoch=228, loss=0.697: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.98it/s]

test_loss=0.6975, test_accuracy=76.690%
Epoch: 229



(train) Epoch=229, lr=0.0722 loss=0.584: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.44it/s]

train_loss=0.5837, train_accuracy=79.899%



(val) Epoch=229, loss=0.629: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.02it/s]

test_loss=0.6290, test_accuracy=78.650%
Epoch: 230



(train) Epoch=230, lr=0.0712 loss=0.574: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.75it/s]

train_loss=0.5742, train_accuracy=80.314%



(val) Epoch=230, loss=0.659: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.75it/s]

test_loss=0.6586, test_accuracy=77.630%
Epoch: 231



(train) Epoch=231, lr=0.0702 loss=0.571: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.59it/s]

train_loss=0.5710, train_accuracy=80.263%



(val) Epoch=231, loss=0.682: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.43it/s]

test_loss=0.6820, test_accuracy=77.040%
Epoch: 232



(train) Epoch=232, lr=0.0692 loss=0.574: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.68it/s]

train_loss=0.5742, train_accuracy=80.022%



(val) Epoch=232, loss=0.629: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.24it/s]

test_loss=0.6287, test_accuracy=78.820%
Epoch: 233



(train) Epoch=233, lr=0.0683 loss=0.567: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.73it/s]

train_loss=0.5669, train_accuracy=80.624%



(val) Epoch=233, loss=0.650: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.02it/s]


test_loss=0.6501, test_accuracy=78.020%
Epoch: 234


(train) Epoch=234, lr=0.0673 loss=0.569: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.59it/s]

train_loss=0.5691, train_accuracy=80.437%



(val) Epoch=234, loss=0.709: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.31it/s]

test_loss=0.7088, test_accuracy=76.720%
Epoch: 235



(train) Epoch=235, lr=0.0663 loss=0.566: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.70it/s]

train_loss=0.5659, train_accuracy=80.511%



(val) Epoch=235, loss=0.582: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.37it/s]

test_loss=0.5820, test_accuracy=79.820%
Epoch: 236



(train) Epoch=236, lr=0.0654 loss=0.562: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.54it/s]

train_loss=0.5619, train_accuracy=80.783%



(val) Epoch=236, loss=0.732: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.71it/s]


test_loss=0.7324, test_accuracy=74.540%
Epoch: 237


(train) Epoch=237, lr=0.0644 loss=0.561: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.32it/s]

train_loss=0.5605, train_accuracy=80.567%



(val) Epoch=237, loss=0.608: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.40it/s]


test_loss=0.6085, test_accuracy=79.630%
Epoch: 238


(train) Epoch=238, lr=0.0634 loss=0.559: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.54it/s]

train_loss=0.5592, train_accuracy=80.495%



(val) Epoch=238, loss=0.642: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.97it/s]

test_loss=0.6421, test_accuracy=78.550%
Epoch: 239



(train) Epoch=239, lr=0.0625 loss=0.559: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.76it/s]

train_loss=0.5593, train_accuracy=80.737%



(val) Epoch=239, loss=0.659: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.83it/s]

test_loss=0.6594, test_accuracy=77.820%
Epoch: 240



(train) Epoch=240, lr=0.0616 loss=0.561: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.77it/s]

train_loss=0.5605, train_accuracy=80.706%



(val) Epoch=240, loss=0.605: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.27it/s]

test_loss=0.6047, test_accuracy=79.400%
Epoch: 241



(train) Epoch=241, lr=0.0606 loss=0.562: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.67it/s]

train_loss=0.5619, train_accuracy=80.638%



(val) Epoch=241, loss=0.649: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.73it/s]

test_loss=0.6489, test_accuracy=77.870%
Epoch: 242



(train) Epoch=242, lr=0.0597 loss=0.561: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.33it/s]

train_loss=0.5613, train_accuracy=80.720%



(val) Epoch=242, loss=0.725: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.51it/s]


test_loss=0.7252, test_accuracy=75.880%
Epoch: 243


(train) Epoch=243, lr=0.0588 loss=0.554: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.01it/s]

train_loss=0.5538, train_accuracy=80.980%



(val) Epoch=243, loss=0.642: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.44it/s]

test_loss=0.6420, test_accuracy=78.130%
Epoch: 244



(train) Epoch=244, lr=0.0578 loss=0.546: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.41it/s]

train_loss=0.5460, train_accuracy=81.167%



(val) Epoch=244, loss=0.593: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.06it/s]

test_loss=0.5934, test_accuracy=80.600%
Epoch: 245



(train) Epoch=245, lr=0.0569 loss=0.544: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.84it/s]

train_loss=0.5436, train_accuracy=81.347%



(val) Epoch=245, loss=0.666: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.79it/s]

test_loss=0.6658, test_accuracy=77.560%
Epoch: 246



(train) Epoch=246, lr=0.0560 loss=0.541: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.26it/s]

train_loss=0.5409, train_accuracy=81.369%



(val) Epoch=246, loss=0.677: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.32it/s]


test_loss=0.6772, test_accuracy=76.180%
Epoch: 247


(train) Epoch=247, lr=0.0551 loss=0.546: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.24it/s]


train_loss=0.5457, train_accuracy=81.105%


(val) Epoch=247, loss=0.662: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.65it/s]

test_loss=0.6616, test_accuracy=77.100%
Epoch: 248



(train) Epoch=248, lr=0.0542 loss=0.543: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.80it/s]

train_loss=0.5432, train_accuracy=81.222%



(val) Epoch=248, loss=0.590: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.34it/s]

test_loss=0.5895, test_accuracy=79.850%
Epoch: 249



(train) Epoch=249, lr=0.0533 loss=0.543: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.28it/s]

train_loss=0.5427, train_accuracy=81.236%



(val) Epoch=249, loss=0.658: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.93it/s]

test_loss=0.6579, test_accuracy=76.990%
Epoch: 250



(train) Epoch=250, lr=0.0524 loss=0.533: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.85it/s]


train_loss=0.5326, train_accuracy=81.562%


(val) Epoch=250, loss=0.571: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.23it/s]

test_loss=0.5714, test_accuracy=80.640%
Epoch: 251



(train) Epoch=251, lr=0.0515 loss=0.532: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.88it/s]

train_loss=0.5322, train_accuracy=81.661%



(val) Epoch=251, loss=0.645: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.14it/s]

test_loss=0.6454, test_accuracy=78.320%
Epoch: 252



(train) Epoch=252, lr=0.0506 loss=0.538: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.96it/s]

train_loss=0.5379, train_accuracy=81.341%



(val) Epoch=252, loss=0.640: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.81it/s]

test_loss=0.6395, test_accuracy=77.930%
Epoch: 253



(train) Epoch=253, lr=0.0498 loss=0.530: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.83it/s]

train_loss=0.5299, train_accuracy=81.574%



(val) Epoch=253, loss=0.646: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.46it/s]

test_loss=0.6462, test_accuracy=78.630%
Epoch: 254



(train) Epoch=254, lr=0.0489 loss=0.531: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.59it/s]

train_loss=0.5309, train_accuracy=81.518%



(val) Epoch=254, loss=0.638: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.82it/s]

test_loss=0.6381, test_accuracy=78.350%
Epoch: 255



(train) Epoch=255, lr=0.0480 loss=0.522: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.87it/s]

train_loss=0.5220, train_accuracy=82.080%



(val) Epoch=255, loss=0.602: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.26it/s]


test_loss=0.6018, test_accuracy=79.890%
Epoch: 256


(train) Epoch=256, lr=0.0472 loss=0.528: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.95it/s]

train_loss=0.5282, train_accuracy=81.602%



(val) Epoch=256, loss=0.600: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.39it/s]


test_loss=0.5996, test_accuracy=79.730%
Epoch: 257


(train) Epoch=257, lr=0.0463 loss=0.519: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.53it/s]

train_loss=0.5191, train_accuracy=81.989%



(val) Epoch=257, loss=0.644: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.58it/s]


test_loss=0.6441, test_accuracy=77.720%
Epoch: 258


(train) Epoch=258, lr=0.0455 loss=0.515: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.18it/s]

train_loss=0.5149, train_accuracy=82.212%



(val) Epoch=258, loss=0.662: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.33it/s]

test_loss=0.6622, test_accuracy=77.520%
Epoch: 259



(train) Epoch=259, lr=0.0447 loss=0.517: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.70it/s]

train_loss=0.5165, train_accuracy=82.251%



(val) Epoch=259, loss=0.662: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.06it/s]

test_loss=0.6621, test_accuracy=78.180%
Epoch: 260



(train) Epoch=260, lr=0.0438 loss=0.505: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.68it/s]

train_loss=0.5047, train_accuracy=82.510%



(val) Epoch=260, loss=0.548: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.78it/s]

test_loss=0.5484, test_accuracy=81.330%
Epoch: 261



(train) Epoch=261, lr=0.0430 loss=0.506: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.85it/s]

train_loss=0.5062, train_accuracy=82.553%



(val) Epoch=261, loss=0.608: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.36it/s]

test_loss=0.6076, test_accuracy=79.820%
Epoch: 262



(train) Epoch=262, lr=0.0422 loss=0.504: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.96it/s]

train_loss=0.5039, train_accuracy=82.514%



(val) Epoch=262, loss=0.575: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.46it/s]

test_loss=0.5746, test_accuracy=80.350%
Epoch: 263



(train) Epoch=263, lr=0.0414 loss=0.507: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.84it/s]


train_loss=0.5070, train_accuracy=82.615%


(val) Epoch=263, loss=0.537: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.78it/s]

test_loss=0.5366, test_accuracy=81.940%
Epoch: 264



(train) Epoch=264, lr=0.0406 loss=0.496: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.20it/s]

train_loss=0.4965, train_accuracy=82.845%



(val) Epoch=264, loss=0.626: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.06it/s]


test_loss=0.6257, test_accuracy=79.190%
Epoch: 265


(train) Epoch=265, lr=0.0398 loss=0.499: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.80it/s]

train_loss=0.4986, train_accuracy=82.790%



(val) Epoch=265, loss=0.632: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.78it/s]

test_loss=0.6315, test_accuracy=78.700%
Epoch: 266



(train) Epoch=266, lr=0.0390 loss=0.501: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.78it/s]

train_loss=0.5013, train_accuracy=82.742%



(val) Epoch=266, loss=0.609: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.39it/s]


test_loss=0.6089, test_accuracy=79.020%
Epoch: 267


(train) Epoch=267, lr=0.0382 loss=0.499: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.31it/s]

train_loss=0.4995, train_accuracy=82.835%



(val) Epoch=267, loss=0.594: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 50.34it/s]

test_loss=0.5944, test_accuracy=80.860%
Epoch: 268



(train) Epoch=268, lr=0.0374 loss=0.490: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.72it/s]

train_loss=0.4902, train_accuracy=83.201%



(val) Epoch=268, loss=0.575: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.70it/s]

test_loss=0.5753, test_accuracy=80.580%
Epoch: 269



(train) Epoch=269, lr=0.0366 loss=0.497: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.16it/s]


train_loss=0.4966, train_accuracy=82.865%


(val) Epoch=269, loss=0.590: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.29it/s]

test_loss=0.5899, test_accuracy=80.600%
Epoch: 270



(train) Epoch=270, lr=0.0358 loss=0.492: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.80it/s]

train_loss=0.4921, train_accuracy=82.962%



(val) Epoch=270, loss=0.607: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.12it/s]

test_loss=0.6068, test_accuracy=79.740%
Epoch: 271



(train) Epoch=271, lr=0.0351 loss=0.493: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.00it/s]

train_loss=0.4934, train_accuracy=82.853%



(val) Epoch=271, loss=0.592: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.39it/s]

test_loss=0.5923, test_accuracy=80.170%
Epoch: 272



(train) Epoch=272, lr=0.0343 loss=0.490: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.91it/s]

train_loss=0.4896, train_accuracy=83.052%



(val) Epoch=272, loss=0.598: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.17it/s]

test_loss=0.5977, test_accuracy=79.540%
Epoch: 273



(train) Epoch=273, lr=0.0336 loss=0.488: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.47it/s]

train_loss=0.4875, train_accuracy=83.181%



(val) Epoch=273, loss=0.560: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.52it/s]

test_loss=0.5596, test_accuracy=81.280%
Epoch: 274



(train) Epoch=274, lr=0.0328 loss=0.494: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.96it/s]

train_loss=0.4938, train_accuracy=82.917%



(val) Epoch=274, loss=0.560: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.83it/s]

test_loss=0.5602, test_accuracy=80.790%
Epoch: 275



(train) Epoch=275, lr=0.0321 loss=0.482: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.06it/s]

train_loss=0.4816, train_accuracy=83.215%



(val) Epoch=275, loss=0.519: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.44it/s]

test_loss=0.5185, test_accuracy=82.920%
Epoch: 276



(train) Epoch=276, lr=0.0314 loss=0.478: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.47it/s]

train_loss=0.4782, train_accuracy=83.417%



(val) Epoch=276, loss=0.552: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.47it/s]

test_loss=0.5525, test_accuracy=81.600%
Epoch: 277



(train) Epoch=277, lr=0.0307 loss=0.473: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.75it/s]

train_loss=0.4729, train_accuracy=83.588%



(val) Epoch=277, loss=0.542: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.37it/s]

test_loss=0.5423, test_accuracy=81.960%
Epoch: 278



(train) Epoch=278, lr=0.0299 loss=0.472: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.29it/s]

train_loss=0.4723, train_accuracy=83.547%



(val) Epoch=278, loss=0.532: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.04it/s]

test_loss=0.5316, test_accuracy=82.310%
Epoch: 279



(train) Epoch=279, lr=0.0292 loss=0.475: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.06it/s]

train_loss=0.4752, train_accuracy=83.461%



(val) Epoch=279, loss=0.605: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.81it/s]

test_loss=0.6048, test_accuracy=79.810%
Epoch: 280



(train) Epoch=280, lr=0.0285 loss=0.461: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.05it/s]

train_loss=0.4610, train_accuracy=84.071%



(val) Epoch=280, loss=0.554: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.69it/s]

test_loss=0.5543, test_accuracy=81.330%
Epoch: 281



(train) Epoch=281, lr=0.0279 loss=0.467: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.85it/s]

train_loss=0.4673, train_accuracy=83.894%



(val) Epoch=281, loss=0.575: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.09it/s]

test_loss=0.5749, test_accuracy=80.960%
Epoch: 282



(train) Epoch=282, lr=0.0272 loss=0.470: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.28it/s]

train_loss=0.4701, train_accuracy=83.827%



(val) Epoch=282, loss=0.527: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 50.20it/s]

test_loss=0.5271, test_accuracy=82.550%
Epoch: 283



(train) Epoch=283, lr=0.0265 loss=0.465: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.33it/s]

train_loss=0.4652, train_accuracy=83.751%



(val) Epoch=283, loss=0.560: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.93it/s]

test_loss=0.5599, test_accuracy=81.750%
Epoch: 284



(train) Epoch=284, lr=0.0258 loss=0.466: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.50it/s]

train_loss=0.4661, train_accuracy=83.789%



(val) Epoch=284, loss=0.645: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.73it/s]

test_loss=0.6448, test_accuracy=77.720%
Epoch: 285



(train) Epoch=285, lr=0.0252 loss=0.452: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.09it/s]

train_loss=0.4521, train_accuracy=84.294%



(val) Epoch=285, loss=0.556: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.95it/s]

test_loss=0.5562, test_accuracy=80.940%
Epoch: 286



(train) Epoch=286, lr=0.0245 loss=0.456: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.70it/s]

train_loss=0.4558, train_accuracy=84.198%



(val) Epoch=286, loss=0.542: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.77it/s]


test_loss=0.5425, test_accuracy=82.180%
Epoch: 287


(train) Epoch=287, lr=0.0239 loss=0.457: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.38it/s]

train_loss=0.4568, train_accuracy=84.258%



(val) Epoch=287, loss=0.558: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 48.51it/s]

test_loss=0.5577, test_accuracy=81.220%
Epoch: 288



(train) Epoch=288, lr=0.0232 loss=0.449: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.00it/s]

train_loss=0.4491, train_accuracy=84.599%



(val) Epoch=288, loss=0.524: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.51it/s]


test_loss=0.5237, test_accuracy=82.670%
Epoch: 289


(train) Epoch=289, lr=0.0226 loss=0.458: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.22it/s]

train_loss=0.4577, train_accuracy=84.305%



(val) Epoch=289, loss=0.530: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.33it/s]

test_loss=0.5305, test_accuracy=82.150%
Epoch: 290



(train) Epoch=290, lr=0.0220 loss=0.442: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.71it/s]

train_loss=0.4416, train_accuracy=84.647%



(val) Epoch=290, loss=0.522: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.36it/s]

test_loss=0.5223, test_accuracy=82.580%
Epoch: 291



(train) Epoch=291, lr=0.0214 loss=0.456: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.47it/s]

train_loss=0.4560, train_accuracy=84.325%



(val) Epoch=291, loss=0.623: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.24it/s]

test_loss=0.6230, test_accuracy=78.940%
Epoch: 292



(train) Epoch=292, lr=0.0208 loss=0.440: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.72it/s]

train_loss=0.4396, train_accuracy=84.764%



(val) Epoch=292, loss=0.620: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.91it/s]

test_loss=0.6199, test_accuracy=78.780%
Epoch: 293



(train) Epoch=293, lr=0.0202 loss=0.447: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.32it/s]

train_loss=0.4467, train_accuracy=84.621%



(val) Epoch=293, loss=0.514: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.81it/s]


test_loss=0.5141, test_accuracy=82.670%
Epoch: 294


(train) Epoch=294, lr=0.0196 loss=0.443: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.86it/s]

train_loss=0.4435, train_accuracy=84.729%



(val) Epoch=294, loss=0.521: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.24it/s]


test_loss=0.5212, test_accuracy=82.370%
Epoch: 295


(train) Epoch=295, lr=0.0190 loss=0.434: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.15it/s]

train_loss=0.4338, train_accuracy=85.041%



(val) Epoch=295, loss=0.575: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.82it/s]

test_loss=0.5755, test_accuracy=80.850%
Epoch: 296



(train) Epoch=296, lr=0.0184 loss=0.441: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.33it/s]

train_loss=0.4408, train_accuracy=84.806%



(val) Epoch=296, loss=0.545: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.71it/s]

test_loss=0.5454, test_accuracy=81.840%
Epoch: 297



(train) Epoch=297, lr=0.0179 loss=0.438: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.33it/s]

train_loss=0.4381, train_accuracy=84.933%



(val) Epoch=297, loss=0.516: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.87it/s]

test_loss=0.5155, test_accuracy=82.580%
Epoch: 298



(train) Epoch=298, lr=0.0173 loss=0.435: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.46it/s]

train_loss=0.4347, train_accuracy=84.911%



(val) Epoch=298, loss=0.533: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.10it/s]


test_loss=0.5332, test_accuracy=82.450%
Epoch: 299


(train) Epoch=299, lr=0.0167 loss=0.425: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.12it/s]

train_loss=0.4250, train_accuracy=85.448%



(val) Epoch=299, loss=0.542: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.58it/s]

test_loss=0.5424, test_accuracy=81.910%
Epoch: 300



(train) Epoch=300, lr=0.0162 loss=0.435: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.07it/s]

train_loss=0.4346, train_accuracy=85.021%



(val) Epoch=300, loss=0.502: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.46it/s]

test_loss=0.5015, test_accuracy=83.910%
Epoch: 301



(train) Epoch=301, lr=0.0157 loss=0.431: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.37it/s]

train_loss=0.4309, train_accuracy=85.076%



(val) Epoch=301, loss=0.497: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.85it/s]


test_loss=0.4969, test_accuracy=83.000%
Epoch: 302


(train) Epoch=302, lr=0.0151 loss=0.424: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.91it/s]

train_loss=0.4242, train_accuracy=85.341%



(val) Epoch=302, loss=0.497: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.14it/s]

test_loss=0.4967, test_accuracy=83.820%
Epoch: 303



(train) Epoch=303, lr=0.0146 loss=0.422: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.58it/s]

train_loss=0.4223, train_accuracy=85.388%



(val) Epoch=303, loss=0.497: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.18it/s]

test_loss=0.4972, test_accuracy=83.640%
Epoch: 304



(train) Epoch=304, lr=0.0141 loss=0.416: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.13it/s]

train_loss=0.4163, train_accuracy=85.625%



(val) Epoch=304, loss=0.503: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.83it/s]

test_loss=0.5027, test_accuracy=83.130%
Epoch: 305



(train) Epoch=305, lr=0.0136 loss=0.414: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.17it/s]

train_loss=0.4143, train_accuracy=85.567%



(val) Epoch=305, loss=0.506: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.72it/s]

test_loss=0.5062, test_accuracy=83.190%
Epoch: 306



(train) Epoch=306, lr=0.0131 loss=0.422: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.92it/s]

train_loss=0.4224, train_accuracy=85.386%



(val) Epoch=306, loss=0.506: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.71it/s]

test_loss=0.5057, test_accuracy=83.310%
Epoch: 307



(train) Epoch=307, lr=0.0127 loss=0.417: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.64it/s]

train_loss=0.4168, train_accuracy=85.617%



(val) Epoch=307, loss=0.497: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.38it/s]

test_loss=0.4968, test_accuracy=83.720%
Epoch: 308



(train) Epoch=308, lr=0.0122 loss=0.416: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.35it/s]


train_loss=0.4158, train_accuracy=85.587%


(val) Epoch=308, loss=0.493: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.13it/s]

test_loss=0.4931, test_accuracy=83.230%
Epoch: 309



(train) Epoch=309, lr=0.0117 loss=0.417: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.50it/s]

train_loss=0.4173, train_accuracy=85.700%



(val) Epoch=309, loss=0.517: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.74it/s]

test_loss=0.5172, test_accuracy=83.200%
Epoch: 310



(train) Epoch=310, lr=0.0113 loss=0.407: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.69it/s]

train_loss=0.4069, train_accuracy=86.012%



(val) Epoch=310, loss=0.504: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.55it/s]

test_loss=0.5043, test_accuracy=83.070%
Epoch: 311



(train) Epoch=311, lr=0.0108 loss=0.412: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.03it/s]

train_loss=0.4115, train_accuracy=85.813%



(val) Epoch=311, loss=0.515: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.38it/s]

test_loss=0.5151, test_accuracy=82.610%
Epoch: 312



(train) Epoch=312, lr=0.0104 loss=0.407: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.28it/s]

train_loss=0.4075, train_accuracy=85.935%



(val) Epoch=312, loss=0.484: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.59it/s]

test_loss=0.4839, test_accuracy=83.530%
Epoch: 313



(train) Epoch=313, lr=0.0099 loss=0.412: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.02it/s]

train_loss=0.4117, train_accuracy=85.718%



(val) Epoch=313, loss=0.457: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.74it/s]

test_loss=0.4573, test_accuracy=84.780%
Epoch: 314



(train) Epoch=314, lr=0.0095 loss=0.406: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.95it/s]

train_loss=0.4064, train_accuracy=85.901%



(val) Epoch=314, loss=0.571: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.06it/s]


test_loss=0.5706, test_accuracy=80.180%
Epoch: 315


(train) Epoch=315, lr=0.0091 loss=0.405: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.23it/s]

train_loss=0.4052, train_accuracy=86.004%



(val) Epoch=315, loss=0.547: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 51.24it/s]

test_loss=0.5474, test_accuracy=82.250%
Epoch: 316



(train) Epoch=316, lr=0.0087 loss=0.404: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.93it/s]

train_loss=0.4038, train_accuracy=86.099%



(val) Epoch=316, loss=0.495: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.18it/s]


test_loss=0.4946, test_accuracy=83.610%
Epoch: 317


(train) Epoch=317, lr=0.0083 loss=0.403: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.88it/s]

train_loss=0.4031, train_accuracy=86.068%



(val) Epoch=317, loss=0.533: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.82it/s]

test_loss=0.5333, test_accuracy=81.930%
Epoch: 318



(train) Epoch=318, lr=0.0079 loss=0.402: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.98it/s]

train_loss=0.4021, train_accuracy=86.028%



(val) Epoch=318, loss=0.462: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.03it/s]

test_loss=0.4618, test_accuracy=85.390%
Epoch: 319



(train) Epoch=319, lr=0.0075 loss=0.393: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.99it/s]

train_loss=0.3930, train_accuracy=86.505%



(val) Epoch=319, loss=0.515: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.00it/s]

test_loss=0.5154, test_accuracy=82.510%
Epoch: 320



(train) Epoch=320, lr=0.0072 loss=0.401: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.47it/s]

train_loss=0.4011, train_accuracy=85.875%



(val) Epoch=320, loss=0.502: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.44it/s]

test_loss=0.5019, test_accuracy=83.210%
Epoch: 321



(train) Epoch=321, lr=0.0068 loss=0.392: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.67it/s]

train_loss=0.3916, train_accuracy=86.473%



(val) Epoch=321, loss=0.486: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.00it/s]


test_loss=0.4860, test_accuracy=84.310%
Epoch: 322


(train) Epoch=322, lr=0.0065 loss=0.391: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.77it/s]

train_loss=0.3907, train_accuracy=86.405%



(val) Epoch=322, loss=0.501: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.68it/s]

test_loss=0.5015, test_accuracy=82.440%
Epoch: 323



(train) Epoch=323, lr=0.0061 loss=0.396: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.51it/s]

train_loss=0.3961, train_accuracy=86.121%



(val) Epoch=323, loss=0.483: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.66it/s]

test_loss=0.4829, test_accuracy=84.660%
Epoch: 324



(train) Epoch=324, lr=0.0058 loss=0.388: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.28it/s]

train_loss=0.3879, train_accuracy=86.542%



(val) Epoch=324, loss=0.506: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.95it/s]

test_loss=0.5064, test_accuracy=82.430%
Epoch: 325



(train) Epoch=325, lr=0.0055 loss=0.396: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.95it/s]

train_loss=0.3964, train_accuracy=86.288%



(val) Epoch=325, loss=0.483: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.81it/s]

test_loss=0.4828, test_accuracy=84.150%
Epoch: 326



(train) Epoch=326, lr=0.0051 loss=0.387: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.91it/s]

train_loss=0.3868, train_accuracy=86.654%



(val) Epoch=326, loss=0.486: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.09it/s]

test_loss=0.4861, test_accuracy=83.700%
Epoch: 327



(train) Epoch=327, lr=0.0048 loss=0.388: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.65it/s]

train_loss=0.3881, train_accuracy=86.705%



(val) Epoch=327, loss=0.480: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.90it/s]

test_loss=0.4800, test_accuracy=83.790%
Epoch: 328



(train) Epoch=328, lr=0.0045 loss=0.385: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.94it/s]


train_loss=0.3853, train_accuracy=86.771%


(val) Epoch=328, loss=0.528: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.53it/s]

test_loss=0.5276, test_accuracy=81.790%
Epoch: 329



(train) Epoch=329, lr=0.0043 loss=0.389: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.91it/s]


train_loss=0.3890, train_accuracy=86.534%


(val) Epoch=329, loss=0.466: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.33it/s]

test_loss=0.4657, test_accuracy=84.480%
Epoch: 330



(train) Epoch=330, lr=0.0040 loss=0.385: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.51it/s]


train_loss=0.3851, train_accuracy=86.656%


(val) Epoch=330, loss=0.487: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.57it/s]

test_loss=0.4867, test_accuracy=83.210%
Epoch: 331



(train) Epoch=331, lr=0.0037 loss=0.386: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.11it/s]

train_loss=0.3858, train_accuracy=86.676%



(val) Epoch=331, loss=0.477: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.77it/s]

test_loss=0.4770, test_accuracy=83.830%
Epoch: 332



(train) Epoch=332, lr=0.0035 loss=0.385: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.34it/s]

train_loss=0.3849, train_accuracy=86.632%



(val) Epoch=332, loss=0.458: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.46it/s]

test_loss=0.4584, test_accuracy=85.020%
Epoch: 333



(train) Epoch=333, lr=0.0032 loss=0.380: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.52it/s]

train_loss=0.3800, train_accuracy=86.938%



(val) Epoch=333, loss=0.514: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.06it/s]


test_loss=0.5143, test_accuracy=83.550%
Epoch: 334


(train) Epoch=334, lr=0.0030 loss=0.382: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.95it/s]

train_loss=0.3823, train_accuracy=86.705%



(val) Epoch=334, loss=0.488: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.70it/s]

test_loss=0.4876, test_accuracy=83.980%
Epoch: 335



(train) Epoch=335, lr=0.0027 loss=0.378: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.78it/s]


train_loss=0.3776, train_accuracy=87.021%


(val) Epoch=335, loss=0.511: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.20it/s]

test_loss=0.5109, test_accuracy=82.390%
Epoch: 336



(train) Epoch=336, lr=0.0025 loss=0.375: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.33it/s]

train_loss=0.3750, train_accuracy=87.053%



(val) Epoch=336, loss=0.488: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.56it/s]

test_loss=0.4877, test_accuracy=83.520%
Epoch: 337



(train) Epoch=337, lr=0.0023 loss=0.376: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.59it/s]

train_loss=0.3758, train_accuracy=87.025%



(val) Epoch=337, loss=0.480: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.13it/s]


test_loss=0.4797, test_accuracy=83.620%
Epoch: 338


(train) Epoch=338, lr=0.0021 loss=0.367: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.09it/s]

train_loss=0.3666, train_accuracy=87.291%



(val) Epoch=338, loss=0.490: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.73it/s]


test_loss=0.4904, test_accuracy=83.840%
Epoch: 339


(train) Epoch=339, lr=0.0019 loss=0.380: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.10it/s]


train_loss=0.3800, train_accuracy=86.974%


(val) Epoch=339, loss=0.473: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.09it/s]

test_loss=0.4734, test_accuracy=83.700%
Epoch: 340



(train) Epoch=340, lr=0.0017 loss=0.374: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.78it/s]

train_loss=0.3744, train_accuracy=87.099%



(val) Epoch=340, loss=0.519: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.33it/s]

test_loss=0.5189, test_accuracy=82.080%
Epoch: 341



(train) Epoch=341, lr=0.0015 loss=0.386: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.31it/s]

train_loss=0.3864, train_accuracy=86.485%



(val) Epoch=341, loss=0.468: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.97it/s]


test_loss=0.4682, test_accuracy=84.690%
Epoch: 342


(train) Epoch=342, lr=0.0014 loss=0.375: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.43it/s]

train_loss=0.3753, train_accuracy=87.005%



(val) Epoch=342, loss=0.509: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.01it/s]

test_loss=0.5091, test_accuracy=82.840%
Epoch: 343



(train) Epoch=343, lr=0.0012 loss=0.376: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.58it/s]

train_loss=0.3765, train_accuracy=87.041%



(val) Epoch=343, loss=0.482: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.05it/s]

test_loss=0.4823, test_accuracy=84.550%
Epoch: 344



(train) Epoch=344, lr=0.0011 loss=0.377: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.01it/s]

train_loss=0.3775, train_accuracy=86.918%



(val) Epoch=344, loss=0.455: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 59.14it/s]

test_loss=0.4546, test_accuracy=85.060%
Epoch: 345



(train) Epoch=345, lr=0.0009 loss=0.371: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.69it/s]

train_loss=0.3709, train_accuracy=87.194%



(val) Epoch=345, loss=0.501: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.61it/s]

test_loss=0.5006, test_accuracy=83.310%
Epoch: 346



(train) Epoch=346, lr=0.0008 loss=0.379: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 33.96it/s]

train_loss=0.3789, train_accuracy=86.852%



(val) Epoch=346, loss=0.530: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.59it/s]

test_loss=0.5299, test_accuracy=82.860%
Epoch: 347



(train) Epoch=347, lr=0.0007 loss=0.374: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 32.96it/s]

train_loss=0.3744, train_accuracy=87.192%



(val) Epoch=347, loss=0.451: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.30it/s]

test_loss=0.4509, test_accuracy=85.260%
Epoch: 348



(train) Epoch=348, lr=0.0006 loss=0.372: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.78it/s]

train_loss=0.3723, train_accuracy=87.164%



(val) Epoch=348, loss=0.442: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.12it/s]

test_loss=0.4416, test_accuracy=85.400%
Epoch: 349



(train) Epoch=349, lr=0.0005 loss=0.374: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.59it/s]

train_loss=0.3744, train_accuracy=87.156%



(val) Epoch=349, loss=0.464: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 58.11it/s]

test_loss=0.4642, test_accuracy=84.820%
Epoch: 350



(train) Epoch=350, lr=0.0004 loss=0.374: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.84it/s]

train_loss=0.3736, train_accuracy=86.993%



(val) Epoch=350, loss=0.487: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.67it/s]

test_loss=0.4871, test_accuracy=84.070%
Epoch: 351



(train) Epoch=351, lr=0.0003 loss=0.374: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.35it/s]

train_loss=0.3744, train_accuracy=87.103%



(val) Epoch=351, loss=0.473: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.56it/s]

test_loss=0.4728, test_accuracy=84.660%
Epoch: 352



(train) Epoch=352, lr=0.0002 loss=0.377: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.23it/s]

train_loss=0.3773, train_accuracy=86.991%



(val) Epoch=352, loss=0.469: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.97it/s]

test_loss=0.4685, test_accuracy=84.020%
Epoch: 353



(train) Epoch=353, lr=0.0002 loss=0.364: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.63it/s]

train_loss=0.3641, train_accuracy=87.452%



(val) Epoch=353, loss=0.451: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.71it/s]

test_loss=0.4506, test_accuracy=85.090%
Epoch: 354



(train) Epoch=354, lr=0.0001 loss=0.375: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.76it/s]

train_loss=0.3748, train_accuracy=86.995%



(val) Epoch=354, loss=0.481: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 54.35it/s]

test_loss=0.4812, test_accuracy=83.650%
Epoch: 355



(train) Epoch=355, lr=0.0001 loss=0.374: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.65it/s]

train_loss=0.3745, train_accuracy=87.031%



(val) Epoch=355, loss=0.528: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 55.21it/s]

test_loss=0.5284, test_accuracy=81.920%
Epoch: 356



(train) Epoch=356, lr=0.0000 loss=0.372: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.35it/s]

train_loss=0.3718, train_accuracy=87.148%



(val) Epoch=356, loss=0.462: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 57.34it/s]

test_loss=0.4617, test_accuracy=84.490%
Epoch: 357



(train) Epoch=357, lr=0.0000 loss=0.376: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.86it/s]

train_loss=0.3761, train_accuracy=87.015%



(val) Epoch=357, loss=0.455: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 53.23it/s]

test_loss=0.4551, test_accuracy=84.670%
Epoch: 358



(train) Epoch=358, lr=0.0000 loss=0.375: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 35.06it/s]

train_loss=0.3746, train_accuracy=87.005%



(val) Epoch=358, loss=0.443: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 56.74it/s]

test_loss=0.4428, test_accuracy=85.680%
Epoch: 359



(train) Epoch=359, lr=0.0000 loss=0.370: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 97/97 [00:02<00:00, 34.64it/s]

train_loss=0.3695, train_accuracy=87.311%



(val) Epoch=359, loss=0.439: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 50.95it/s]

test_loss=0.4392, test_accuracy=85.600%





### Save supernet weights

In [14]:
torch.save(supernet.state_dict(), 'supernet_advanced_360.pth')