In [1]:
import os
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms, models, datasets
from efficientnet_pytorch import EfficientNet
import collections
import sys
from mpemu import mpt_emu
from mpemu import qutils
import timm

sys.path.insert(0, "./ViT-pytorch")
from models.modeling import VisionTransformer, CONFIGS
import numpy as np

# Define paths and hyperparameters
BATCH_SIZE = 24
NUM_EPOCHS = 53
LEARNING_RATE = 0.001
DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")
QUANTIZE = False
TEST_MODEL = False

# quantization
# torch.backends.cudnn.benchmark = True
# filter_module_types = [torch.nn.Conv2d, torch.nn.Linear] # Only quantizing convolution and linear modules
# exempt_modules = ["conv1","fc"]

print()
# define the EfficientNet models to use
# b0 max: 64
# b3 max: 32?
efficientnets = {
    # "b0": EfficientNet.from_pretrained("efficientnet-b0", num_classes=5),
    # "b1": EfficientNet.from_pretrained("efficientnet-b1", num_classes=5),
    # "b2": EfficientNet.from_pretrained("efficientnet-b2", num_classes=5),
    # "b3": EfficientNet.from_pretrained("efficientnet-b3", num_classes=5),
    # "b4": EfficientNet.from_pretrained("efficientnet-b4", num_classes=5),
    # "b5": EfficientNet.from_pretrained("efficientnet-b5", num_classes=5),
    # "b6": EfficientNet.from_pretrained("efficientnet-b6", num_classes=5),
    # "b7": EfficientNet.from_pretrained("efficientnet-b7", num_classes=5),
}

efficientnet_sizes = {
    "b0": 224,
    "b1": 240,
    "b2": 260,
    "b3": 300,
    "b4": 380,
    "b5": 456,
    "b6": 528,
    "b7": 600,
}
# model_name = "vit_base_r50_s16_384"
model_name = "R50-ViT-B_16"
# resnext = timm.create_model(model_name, pretrained=True, num_classes=5)
vit = VisionTransformer(CONFIGS[model_name], 384, zero_head=True, num_classes=5)
# model_ckpt = torch.load("r50/checkpoint_35.pt", map_location="cpu")
# vit.load_state_dict(model_ckpt["model_state_dict"] if "model_state_dict" in model_ckpt else model_ckpt, strict=False)
vit.load_from(np.load("R50-ViT-B_16.npz"))
vit.to(DEVICE)
models = [vit]




In [2]:
timm.list_models("*vit*")

['convit_base',
 'convit_small',
 'convit_tiny',
 'crossvit_9_240',
 'crossvit_9_dagger_240',
 'crossvit_15_240',
 'crossvit_15_dagger_240',
 'crossvit_15_dagger_408',
 'crossvit_18_240',
 'crossvit_18_dagger_240',
 'crossvit_18_dagger_408',
 'crossvit_base_240',
 'crossvit_small_240',
 'crossvit_tiny_240',
 'gcvit_base',
 'gcvit_small',
 'gcvit_tiny',
 'gcvit_xtiny',
 'gcvit_xxtiny',
 'levit_128',
 'levit_128s',
 'levit_192',
 'levit_256',
 'levit_256d',
 'levit_384',
 'maxvit_base_224',
 'maxvit_large_224',
 'maxvit_nano_rw_256',
 'maxvit_pico_rw_256',
 'maxvit_rmlp_nano_rw_256',
 'maxvit_rmlp_pico_rw_256',
 'maxvit_rmlp_small_rw_224',
 'maxvit_rmlp_small_rw_256',
 'maxvit_rmlp_tiny_rw_256',
 'maxvit_small_224',
 'maxvit_tiny_224',
 'maxvit_tiny_pm_256',
 'maxvit_tiny_rw_224',
 'maxvit_tiny_rw_256',
 'maxvit_xlarge_224',
 'maxxvit_rmlp_nano_rw_256',
 'maxxvit_rmlp_small_rw_256',
 'maxxvit_rmlp_tiny_rw_256',
 'mobilevit_s',
 'mobilevit_xs',
 'mobilevit_xxs',
 'mobilevitv2_050',
 'mobi

In [3]:
from sklearn.model_selection import train_test_split
import time
from lion_pytorch import Lion
from tqdm import tqdm
from collections import OrderedDict


def train():
    # train the models and evaluate them on the validation set
    # for model_name, model in efficientnets.items():
    for model in models:
        # define the transform for data augmentation and resizing
        # image_size = efficientnet_sizes[model_name]
        image_size = 384
        # Define data augmentations and transformations
        train_transforms = transforms.Compose(
            [
                transforms.Resize((image_size, image_size)),
                transforms.RandomHorizontalFlip(),
                transforms.RandomVerticalFlip(),
                transforms.RandomRotation(20),
                transforms.ToTensor(),
                transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),
            ]
        )
        val_transforms = transforms.Compose(
            [
                transforms.Resize((image_size, image_size)),
                # transforms.CenterCrop(224),
                transforms.ToTensor(),
                transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),
            ]
        )

        # Create train and validation datasets
        dataset = datasets.ImageFolder("data_512", transform=train_transforms)
        dataset_val = datasets.ImageFolder("data_512", transform=val_transforms)
        print(dataset.classes)

        train_idx, val_idx = train_test_split(
            list(range(len(dataset.targets))), test_size=0.2, stratify=dataset.targets
        )
        train_dataset = torch.utils.data.Subset(dataset, train_idx)
        val_dataset = torch.utils.data.Subset(dataset_val, val_idx)
        train_loader = torch.utils.data.DataLoader(
            train_dataset,
            batch_size=BATCH_SIZE,
            shuffle=True,
            num_workers=8,
            pin_memory=True,
        )
        val_loader = torch.utils.data.DataLoader(
            val_dataset,
            batch_size=BATCH_SIZE,
            shuffle=True,
            num_workers=8,
            pin_memory=True,
        )

        # Define model
        model.to(DEVICE)

        # Define loss function and optimizer
        criterion = nn.CrossEntropyLoss()
        # optimizer = Lion(model.parameters(), lr=1e-5, weight_decay=1e-2)
        #         optimizer = optim.Adam(model.parameters(), lr=1e-4)
        optimizer = torch.optim.SGD(
            model.parameters(), lr=5e-4, momentum=0.9, weight_decay=0
        )

        list_exempt_layers = ["conv1", "fc"]
        #         if "resnet" in args.arch or "resnext" in args.arch:
        #             list_exempt_layers = ["conv1","fc"]
        #         elif args.arch == "vgg19_bn":
        #             list_exempt_layers = ["features.0", "classifier.6"]
        #         elif args.arch == "inception_v3":
        #             list_exempt_layers = ["Conv2d_1a_3x3.conv", "fc"]

        # quantization
        if QUANTIZE:
            model, emulator = mpt_emu.quantize_model(
                model,
                optimizer=optimizer,
                dtype="e4m3",
                device=DEVICE,
                verbose=True,
                list_exempt_layers=list_exempt_layers,
                list_layers_output_fused=[],
            )
            emulator.set_default_inference_qconfig()
        #             filter_module_types = [torch.nn.Conv2d, torch.nn.Linear] # Only quantizing convolution and linear modules
        #             exempt_modules = ["conv1","fc"]
        #             is_training = True
        #             wt_qconfig = qutils.TensorQuantConfig("e4m3", "rne")#, "per-channel")
        #             iact_qconfig   = qutils.TensorQuantConfig("e4m3", "rne")#, "per-tensor")
        #             emb_qconfig    = qutils.TensorQuantConfig("e4m3", "rne")#, "per-channel")
        #             qconfig = qutils.ModuleQuantConfig(wt_qconfig=wt_qconfig, iact_qconfig=iact_qconfig)
        #             model_qconfig_dict  = qutils.get_or_update_model_quant_config_dict(model, filter_module_types, qconfig,
        #                                                                         exempt_modules=exempt_modules)
        #             print("Model quantization configuration")
        #             for layer,qconfig in model_qconfig_dict.items():
        #                 print(layer, qconfig)
        #             print()

        #             qutils.reset_quantization_setup(model, model_qconfig_dict)
        #             qhooks = qutils.add_quantization_hooks(model, model_qconfig_dict, is_training=is_training)
        # test the model
        if TEST_MODEL:
            if QUANTIZE:
                eval_model = emulator.fuse_bnlayers_and_quantize_model(model)
            val_loss = 0.0
            val_acc = 0.0
            with torch.no_grad():
                for images, labels in tqdm(val_loader):
                    images, labels = images.to(DEVICE), labels.to(DEVICE)
                    if QUANTIZE:
                        outputs = eval_model(images)
                    else:
                        outputs = model(images)
                    loss = criterion(outputs, labels)
                    val_loss += loss.item() * images.size(0)
                    _, predictions = torch.max(outputs, 1)
                    val_acc += torch.sum(predictions == labels.data)
            val_loss /= len(val_dataset)
            val_acc /= len(val_dataset)
            print(f"Val   loss: {val_loss:.4f}, Acc: {val_acc:.4f}")

        # Train and validate the model
        for epoch in range(NUM_EPOCHS):
            start = time.time()
            start_total = time.time()
            print(f"Epoch {epoch+1}/{NUM_EPOCHS}")

            # Train the model
            model.train()
            train_loss = 0.0
            train_acc = 0.0
            for images, labels in tqdm(train_loader):
                images, labels = images.to(DEVICE), labels.to(DEVICE)
                outputs, _ = model(images)
                loss = criterion(outputs, labels)
                loss.backward()
                optimizer.step()
                optimizer.zero_grad()
                train_loss += loss.item() * images.size(0)
                _, predictions = torch.max(outputs, 1)
                train_acc += torch.sum(predictions == labels.data)
            train_loss /= len(train_dataset)
            train_acc /= len(train_dataset)
            print(f"Train loss: {train_loss:.4f}, Acc: {train_acc:.4f}")
            print(f"Train time: {time.time() - start}")
            print(torch.cuda.memory_stats(DEVICE))

            start = time.time()
            # Validate the model
            if QUANTIZE:
                eval_model = emulator.fuse_bnlayers_and_quantize_model(model)
            val_loss = 0.0
            val_acc = 0.0
            with torch.no_grad():
                for images, labels in tqdm(val_loader):
                    images, labels = images.to(DEVICE), labels.to(DEVICE)
                    if QUANTIZE:
                        outputs = eval_model(images)
                    else:
                        outputs, _ = model(images)
                    loss = criterion(outputs, labels)
                    val_loss += loss.item() * images.size(0)
                    _, predictions = torch.max(outputs, 1)
                    val_acc += torch.sum(predictions == labels.data)
            val_loss /= len(val_dataset)
            val_acc /= len(val_dataset)
            print(f"Val   loss: {val_loss:.4f}, Acc: {val_acc:.4f}")

            # Save checkpoint
            checkpoint_path = f"checkpoint_{epoch+1}.pt"
            torch.save(
                {
                    "epoch": epoch + 1,
                    "model_state_dict": model.state_dict(),
                    "optimizer_state_dict": optimizer.state_dict(),
                    "train_loss": train_loss,
                    "train_acc": train_acc,
                    "val_loss": val_loss,
                    "val_acc": val_acc,
                },
                checkpoint_path,
            )
            total_end = time.time() - start_total

            # Save loss and accuracy values to file
            with open("loss_acc.txt", "a") as file:
                file.write(
                    f"{model_name}, {train_loss:.4f}, {train_acc:.4f}, {val_loss:.4f}, {val_acc:.4f}, {epoch}, {BATCH_SIZE}, {total_end}\n"
                )

            print(f"Val and misc time: {time.time() - start}")
            print(f"Total time: {total_end}")


if __name__ == "__main__":
    train()

['0', '1', '2', '3', '4']
Epoch 1/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:48<00:00,  1.40it/s]


Train loss: 0.6693, Acc: 0.7825
Train time: 828.0967013835907
OrderedDict([('active.all.allocated', 3735129), ('active.all.current', 721), ('active.all.freed', 3734408), ('active.all.peak', 1300), ('active.large_pool.allocated', 1434171), ('active.large_pool.current', 171), ('active.large_pool.freed', 1434000), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 2300958), ('active.small_pool.current', 550), ('active.small_pool.freed', 2300408), ('active.small_pool.peak', 922), ('active_bytes.all.allocated', 104793636515328), ('active_bytes.all.current', 814213120), ('active_bytes.all.freed', 104792822302208), ('active_bytes.all.peak', 21219655680), ('active_bytes.large_pool.allocated', 104321173530624), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 104320408840192), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 472462984704), ('active_bytes.small_pool.current', 49522688), ('active_bytes.small_pool.f

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.85it/s]


Val   loss: 0.5984, Acc: 0.8051
Val and misc time: 76.53716588020325
Total time: 904.6339330673218
Epoch 2/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.5459, Acc: 0.8235
Train time: 821.0832130908966
OrderedDict([('active.all.allocated', 7790522), ('active.all.current', 722), ('active.all.freed', 7789800), ('active.all.peak', 1301), ('active.large_pool.allocated', 3004360), ('active.large_pool.current', 171), ('active.large_pool.freed', 3004189), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 4786162), ('active.small_pool.current', 551), ('active.small_pool.freed', 4785611), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 220732397513728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 220731583300096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 219748787707392), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 219748023016960), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 983609806336), ('active_bytes.small_pool.current', 49523200), ('active_bytes.small_pool.f

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5436, Acc: 0.8242
Val and misc time: 76.03632187843323
Total time: 897.1196844577789
Epoch 3/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.5097, Acc: 0.8352
Train time: 821.170657157898
OrderedDict([('active.all.allocated', 11845915), ('active.all.current', 722), ('active.all.freed', 11845193), ('active.all.peak', 1301), ('active.large_pool.allocated', 4574549), ('active.large_pool.current', 171), ('active.large_pool.freed', 4574378), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 7271366), ('active.small_pool.current', 551), ('active.small_pool.freed', 7270815), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 336671158512128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 336670344298496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 335176401884160), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 335175637193728), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 1494756627968), ('active_bytes.small_pool.current', 49523200), ('active_bytes.small_pool

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.86it/s]


Val   loss: 0.5045, Acc: 0.8367
Val and misc time: 76.16707110404968
Total time: 897.3380889892578
Epoch 4/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.4876, Acc: 0.8436
Train time: 821.4059307575226
OrderedDict([('active.all.allocated', 15901308), ('active.all.current', 722), ('active.all.freed', 15900586), ('active.all.peak', 1301), ('active.large_pool.allocated', 6144738), ('active.large_pool.current', 171), ('active.large_pool.freed', 6144567), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 9756570), ('active.small_pool.current', 551), ('active.small_pool.freed', 9756019), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 452609919510528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 452609105296896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 450604016060928), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 450603251370496), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 2005903449600), ('active_bytes.small_pool.current', 49523200), ('active_bytes.small_poo

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4994, Acc: 0.8358
Val and misc time: 76.12552690505981
Total time: 897.5315852165222
Epoch 5/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.4734, Acc: 0.8465
Train time: 821.6019339561462
OrderedDict([('active.all.allocated', 19956701), ('active.all.current', 722), ('active.all.freed', 19955979), ('active.all.peak', 1301), ('active.large_pool.allocated', 7714927), ('active.large_pool.current', 171), ('active.large_pool.freed', 7714756), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 12241774), ('active.small_pool.current', 551), ('active.small_pool.freed', 12241223), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 568548680508928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 568547866295296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 566031630237696), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 566030865547264), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 2517050271232), ('active_bytes.small_pool.current', 49523200), ('active_bytes.small_p

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5164, Acc: 0.8384
Val and misc time: 76.06301426887512
Total time: 897.6650559902191
Epoch 6/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:44<00:00,  1.41it/s]


Train loss: 0.4605, Acc: 0.8492
Train time: 824.3451905250549
OrderedDict([('active.all.allocated', 24012094), ('active.all.current', 722), ('active.all.freed', 24011372), ('active.all.peak', 1301), ('active.large_pool.allocated', 9285116), ('active.large_pool.current', 171), ('active.large_pool.freed', 9284945), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 14726978), ('active.small_pool.current', 551), ('active.small_pool.freed', 14726427), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 684487441507328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 684486627293696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 681459244414464), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 681458479724032), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 3028197092864), ('active_bytes.small_pool.current', 49523200), ('active_bytes.small_p

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.84it/s]


Val   loss: 0.4776, Acc: 0.8433
Val and misc time: 76.59534335136414
Total time: 900.9406406879425
Epoch 7/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:43<00:00,  1.41it/s]


Train loss: 0.4483, Acc: 0.8534
Train time: 823.6371982097626
OrderedDict([('active.all.allocated', 28067487), ('active.all.current', 722), ('active.all.freed', 28066765), ('active.all.peak', 1301), ('active.large_pool.allocated', 10855305), ('active.large_pool.current', 171), ('active.large_pool.freed', 10855134), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 17212182), ('active.small_pool.current', 551), ('active.small_pool.freed', 17211631), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 800426202505728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 800425388292096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 796886858591232), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 796886093900800), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 3539343914496), ('active_bytes.small_pool.current', 49523200), ('active_bytes.small

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.85it/s]


Val   loss: 0.4770, Acc: 0.8426
Val and misc time: 76.55514073371887
Total time: 900.1924450397491
Epoch 8/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.4383, Acc: 0.8576
Train time: 821.760339975357
OrderedDict([('active.all.allocated', 32122880), ('active.all.current', 722), ('active.all.freed', 32122158), ('active.all.peak', 1301), ('active.large_pool.allocated', 12425494), ('active.large_pool.current', 171), ('active.large_pool.freed', 12425323), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 19697386), ('active.small_pool.current', 551), ('active.small_pool.freed', 19696835), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 916364963504128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 916364149290496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 912314472768000), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 912313708077568), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 4050490736128), ('active_bytes.small_pool.current', 49523200), ('active_bytes.small_

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.86it/s]


Val   loss: 0.4889, Acc: 0.8430
Val and misc time: 76.20521569252014
Total time: 897.9656646251678
Epoch 9/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.4327, Acc: 0.8578
Train time: 821.0350697040558
OrderedDict([('active.all.allocated', 36178273), ('active.all.current', 722), ('active.all.freed', 36177551), ('active.all.peak', 1301), ('active.large_pool.allocated', 13995683), ('active.large_pool.current', 171), ('active.large_pool.freed', 13995512), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 22182590), ('active.small_pool.current', 551), ('active.small_pool.freed', 22182039), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1032303724502528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1032302910288896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1027742086944768), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1027741322254336), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 4561637557760), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.86it/s]


Val   loss: 0.4732, Acc: 0.8404
Val and misc time: 76.29222583770752
Total time: 897.3274049758911
Epoch 10/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.4217, Acc: 0.8622
Train time: 820.9589908123016
OrderedDict([('active.all.allocated', 40233666), ('active.all.current', 722), ('active.all.freed', 40232944), ('active.all.peak', 1301), ('active.large_pool.allocated', 15565872), ('active.large_pool.current', 171), ('active.large_pool.freed', 15565701), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 24667794), ('active.small_pool.current', 551), ('active.small_pool.freed', 24667243), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1148242485500928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1148241671287296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1143169701121536), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1143168936431104), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 5072784379392), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4668, Acc: 0.8467
Val and misc time: 76.08257246017456
Total time: 897.0416712760925
Epoch 11/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.4148, Acc: 0.8651
Train time: 820.8920900821686
OrderedDict([('active.all.allocated', 44289059), ('active.all.current', 722), ('active.all.freed', 44288337), ('active.all.peak', 1301), ('active.large_pool.allocated', 17136061), ('active.large_pool.current', 171), ('active.large_pool.freed', 17135890), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 27152998), ('active.small_pool.current', 551), ('active.small_pool.freed', 27152447), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1264181246499328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1264180432285696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1258597315298304), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1258596550607872), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 5583931201024), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4746, Acc: 0.8430
Val and misc time: 76.08662438392639
Total time: 896.9788401126862
Epoch 12/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.4066, Acc: 0.8675
Train time: 821.0198545455933
OrderedDict([('active.all.allocated', 48344452), ('active.all.current', 722), ('active.all.freed', 48343730), ('active.all.peak', 1301), ('active.large_pool.allocated', 18706250), ('active.large_pool.current', 171), ('active.large_pool.freed', 18706079), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 29638202), ('active.small_pool.current', 551), ('active.small_pool.freed', 29637651), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1380120007497728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1380119193284096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1374024929475072), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1374024164784640), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 6095078022656), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.86it/s]


Val   loss: 0.4622, Acc: 0.8500
Val and misc time: 76.21051287651062
Total time: 897.2304751873016
Epoch 13/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.3987, Acc: 0.8664
Train time: 821.012866973877
OrderedDict([('active.all.allocated', 52399845), ('active.all.current', 722), ('active.all.freed', 52399123), ('active.all.peak', 1301), ('active.large_pool.allocated', 20276439), ('active.large_pool.current', 171), ('active.large_pool.freed', 20276268), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 32123406), ('active.small_pool.current', 551), ('active.small_pool.freed', 32122855), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1496058768496128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1496057954282496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1489452543651840), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1489451778961408), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 6606224844288), ('active_bytes.small_pool.current', 49523200), ('active_bytes.sm

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5017, Acc: 0.8308
Val and misc time: 76.07530498504639
Total time: 897.0882816314697
Epoch 14/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3871, Acc: 0.8707
Train time: 820.9666404724121
OrderedDict([('active.all.allocated', 56455238), ('active.all.current', 722), ('active.all.freed', 56454516), ('active.all.peak', 1301), ('active.large_pool.allocated', 21846628), ('active.large_pool.current', 171), ('active.large_pool.freed', 21846457), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 34608610), ('active.small_pool.current', 551), ('active.small_pool.freed', 34608059), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1611997529494528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1611996715280896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1604880157828608), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1604879393138176), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 7117371665920), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4835, Acc: 0.8400
Val and misc time: 76.12723112106323
Total time: 897.0939826965332
Epoch 15/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3859, Acc: 0.8714
Train time: 820.9385201931
OrderedDict([('active.all.allocated', 60510631), ('active.all.current', 722), ('active.all.freed', 60509909), ('active.all.peak', 1301), ('active.large_pool.allocated', 23416817), ('active.large_pool.current', 171), ('active.large_pool.freed', 23416646), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 37093814), ('active.small_pool.current', 551), ('active.small_pool.freed', 37093263), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1727936290492928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1727935476279296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1720307772005376), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1720307007314944), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 7628518487552), ('active_bytes.small_pool.current', 49523200), ('active_bytes.smal

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4816, Acc: 0.8385
Val and misc time: 76.10463690757751
Total time: 897.0432488918304
Epoch 16/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3746, Acc: 0.8753
Train time: 820.7003316879272
OrderedDict([('active.all.allocated', 64566024), ('active.all.current', 722), ('active.all.freed', 64565302), ('active.all.peak', 1301), ('active.large_pool.allocated', 24987006), ('active.large_pool.current', 171), ('active.large_pool.freed', 24986835), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 39579018), ('active.small_pool.current', 551), ('active.small_pool.freed', 39578467), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1843875051491328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1843874237277696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1835735386182144), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1835734621491712), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 8139665309184), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4717, Acc: 0.8484
Val and misc time: 76.03335499763489
Total time: 896.733740568161
Epoch 17/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3632, Acc: 0.8795
Train time: 820.8958742618561
OrderedDict([('active.all.allocated', 68621417), ('active.all.current', 722), ('active.all.freed', 68620695), ('active.all.peak', 1301), ('active.large_pool.allocated', 26557195), ('active.large_pool.current', 171), ('active.large_pool.freed', 26557024), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 42064222), ('active.small_pool.current', 551), ('active.small_pool.freed', 42063671), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 1959813812489728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 1959812998276096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 1951163000358912), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 1951162235668480), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 8650812130816), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4740, Acc: 0.8509
Val and misc time: 76.06480622291565
Total time: 896.9607727527618
Epoch 18/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3523, Acc: 0.8825
Train time: 820.9000270366669
OrderedDict([('active.all.allocated', 72676810), ('active.all.current', 722), ('active.all.freed', 72676088), ('active.all.peak', 1301), ('active.large_pool.allocated', 28127384), ('active.large_pool.current', 171), ('active.large_pool.freed', 28127213), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 44549426), ('active.small_pool.current', 551), ('active.small_pool.freed', 44548875), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 2075752573488128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 2075751759274496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2066590614535680), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2066589849845248), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 9161958952448), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4808, Acc: 0.8504
Val and misc time: 76.05574226379395
Total time: 896.9558804035187
Epoch 19/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3447, Acc: 0.8845
Train time: 820.6947486400604
OrderedDict([('active.all.allocated', 76732203), ('active.all.current', 722), ('active.all.freed', 76731481), ('active.all.peak', 1301), ('active.large_pool.allocated', 29697573), ('active.large_pool.current', 171), ('active.large_pool.freed', 29697402), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 47034630), ('active.small_pool.current', 551), ('active.small_pool.freed', 47034079), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 2191691334486528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 2191690520272896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2182018228712448), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2182017464022016), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 9673105774080), ('active_bytes.small_pool.current', 49523200), ('active_bytes.s

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4913, Acc: 0.8417
Val and misc time: 76.12102270126343
Total time: 896.815896987915
Epoch 20/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3331, Acc: 0.8883
Train time: 820.8155519962311
OrderedDict([('active.all.allocated', 80787596), ('active.all.current', 722), ('active.all.freed', 80786874), ('active.all.peak', 1301), ('active.large_pool.allocated', 31267762), ('active.large_pool.current', 171), ('active.large_pool.freed', 31267591), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 49519834), ('active.small_pool.current', 551), ('active.small_pool.freed', 49519283), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 2307630095484928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 2307629281271296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2297445842889216), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2297445078198784), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 10184252595712), ('active_bytes.small_pool.current', 49523200), ('active_bytes.

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.4810, Acc: 0.8503
Val and misc time: 76.10867214202881
Total time: 896.9243426322937
Epoch 21/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3218, Acc: 0.8908
Train time: 820.9012651443481
OrderedDict([('active.all.allocated', 84842989), ('active.all.current', 722), ('active.all.freed', 84842267), ('active.all.peak', 1301), ('active.large_pool.allocated', 32837951), ('active.large_pool.current', 171), ('active.large_pool.freed', 32837780), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 52005038), ('active.small_pool.current', 551), ('active.small_pool.freed', 52004487), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 2423568856483328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 2423568042269696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2412873457065984), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2412872692375552), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 10695399417344), ('active_bytes.small_pool.current', 49523200), ('active_bytes.

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5346, Acc: 0.8471
Val and misc time: 76.04489207267761
Total time: 896.946266412735
Epoch 22/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3165, Acc: 0.8919
Train time: 820.7938280105591
OrderedDict([('active.all.allocated', 88898382), ('active.all.current', 722), ('active.all.freed', 88897660), ('active.all.peak', 1301), ('active.large_pool.allocated', 34408140), ('active.large_pool.current', 171), ('active.large_pool.freed', 34407969), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 54490242), ('active.small_pool.current', 551), ('active.small_pool.freed', 54489691), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 2539507617481728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 2539506803268096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2528301071242752), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2528300306552320), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 11206546238976), ('active_bytes.small_pool.current', 49523200), ('active_bytes.

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5228, Acc: 0.8328
Val and misc time: 76.10575842857361
Total time: 896.8996968269348
Epoch 23/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.3030, Acc: 0.8957
Train time: 820.7186830043793
OrderedDict([('active.all.allocated', 92953775), ('active.all.current', 722), ('active.all.freed', 92953053), ('active.all.peak', 1301), ('active.large_pool.allocated', 35978329), ('active.large_pool.current', 171), ('active.large_pool.freed', 35978158), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 56975446), ('active.small_pool.current', 551), ('active.small_pool.freed', 56974895), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 2655446378480128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 2655445564266496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2643728685419520), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2643727920729088), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 11717693060608), ('active_bytes.small_pool.current', 49523200), ('active_bytes.

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5135, Acc: 0.8467
Val and misc time: 76.09814357757568
Total time: 896.8169205188751
Epoch 24/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.2929, Acc: 0.8996
Train time: 820.6701753139496
OrderedDict([('active.all.allocated', 97009168), ('active.all.current', 722), ('active.all.freed', 97008446), ('active.all.peak', 1301), ('active.large_pool.allocated', 37548518), ('active.large_pool.current', 171), ('active.large_pool.freed', 37548347), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 59460650), ('active.small_pool.current', 551), ('active.small_pool.freed', 59460099), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 2771385139478528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 2771384325264896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2759156299596288), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2759155534905856), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 12228839882240), ('active_bytes.small_pool.current', 49523200), ('active_bytes.

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5217, Acc: 0.8368
Val and misc time: 76.13501787185669
Total time: 896.8052809238434
Epoch 25/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.2773, Acc: 0.9040
Train time: 820.7856822013855
OrderedDict([('active.all.allocated', 101064561), ('active.all.current', 722), ('active.all.freed', 101063839), ('active.all.peak', 1301), ('active.large_pool.allocated', 39118707), ('active.large_pool.current', 171), ('active.large_pool.freed', 39118536), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 61945854), ('active.small_pool.current', 551), ('active.small_pool.freed', 61945303), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 2887323900476928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 2887323086263296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2874583913773056), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2874583149082624), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 12739986703872), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5436, Acc: 0.8373
Val and misc time: 76.10112452507019
Total time: 896.8869209289551
Epoch 26/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.2700, Acc: 0.9079
Train time: 820.9324929714203
OrderedDict([('active.all.allocated', 105119954), ('active.all.current', 722), ('active.all.freed', 105119232), ('active.all.peak', 1301), ('active.large_pool.allocated', 40688896), ('active.large_pool.current', 171), ('active.large_pool.freed', 40688725), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 64431058), ('active.small_pool.current', 551), ('active.small_pool.freed', 64430507), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3003262661475328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3003261847261696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 2990011527949824), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 2990010763259392), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 13251133525504), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5531, Acc: 0.8426
Val and misc time: 76.0541033744812
Total time: 896.9869222640991
Epoch 27/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.2547, Acc: 0.9103
Train time: 820.6105751991272
OrderedDict([('active.all.allocated', 109175347), ('active.all.current', 722), ('active.all.freed', 109174625), ('active.all.peak', 1301), ('active.large_pool.allocated', 42259085), ('active.large_pool.current', 171), ('active.large_pool.freed', 42258914), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 66916262), ('active.small_pool.current', 551), ('active.small_pool.freed', 66915711), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3119201422473728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3119200608260096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 3105439142126592), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 3105438377436160), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 13762280347136), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.88it/s]


Val   loss: 0.5719, Acc: 0.8272
Val and misc time: 75.98920679092407
Total time: 896.5998511314392
Epoch 28/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.2421, Acc: 0.9147
Train time: 820.9184684753418
OrderedDict([('active.all.allocated', 113230740), ('active.all.current', 722), ('active.all.freed', 113230018), ('active.all.peak', 1301), ('active.large_pool.allocated', 43829274), ('active.large_pool.current', 171), ('active.large_pool.freed', 43829103), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 69401466), ('active.small_pool.current', 551), ('active.small_pool.freed', 69400915), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3235140183472128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3235139369258496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 3220866756303360), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 3220865991612928), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 14273427168768), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5908, Acc: 0.8305
Val and misc time: 76.14598631858826
Total time: 897.0645711421967
Epoch 29/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.2229, Acc: 0.9211
Train time: 820.8542487621307
OrderedDict([('active.all.allocated', 117286133), ('active.all.current', 722), ('active.all.freed', 117285411), ('active.all.peak', 1301), ('active.large_pool.allocated', 45399463), ('active.large_pool.current', 171), ('active.large_pool.freed', 45399292), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 71886670), ('active.small_pool.current', 551), ('active.small_pool.freed', 71886119), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3351078944470528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3351078130256896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 3336294370480128), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 3336293605789696), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 14784573990400), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.5881, Acc: 0.8428
Val and misc time: 76.04613304138184
Total time: 896.9004857540131
Epoch 30/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.2192, Acc: 0.9225
Train time: 820.8145444393158
OrderedDict([('active.all.allocated', 121341526), ('active.all.current', 722), ('active.all.freed', 121340804), ('active.all.peak', 1301), ('active.large_pool.allocated', 46969652), ('active.large_pool.current', 171), ('active.large_pool.freed', 46969481), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 74371874), ('active.small_pool.current', 551), ('active.small_pool.freed', 74371323), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3467017705468928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3467016891255296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 3451721984656896), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 3451721219966464), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 15295720812032), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.6169, Acc: 0.8327
Val and misc time: 75.99613618850708
Total time: 896.8108129501343
Epoch 31/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.2040, Acc: 0.9267
Train time: 820.8001308441162
OrderedDict([('active.all.allocated', 125396919), ('active.all.current', 722), ('active.all.freed', 125396197), ('active.all.peak', 1301), ('active.large_pool.allocated', 48539841), ('active.large_pool.current', 171), ('active.large_pool.freed', 48539670), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 76857078), ('active.small_pool.current', 551), ('active.small_pool.freed', 76856527), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3582956466467328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3582955652253696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 3567149598833664), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 3567148834143232), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 15806867633664), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.6245, Acc: 0.8328
Val and misc time: 76.06471562385559
Total time: 896.8649489879608
Epoch 32/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.1903, Acc: 0.9327
Train time: 820.8048844337463
OrderedDict([('active.all.allocated', 129452312), ('active.all.current', 722), ('active.all.freed', 129451590), ('active.all.peak', 1301), ('active.large_pool.allocated', 50110030), ('active.large_pool.current', 171), ('active.large_pool.freed', 50109859), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 79342282), ('active.small_pool.current', 551), ('active.small_pool.freed', 79341731), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3698895227465728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3698894413252096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 3682577213010432), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 3682576448320000), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 16318014455296), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.6871, Acc: 0.8327
Val and misc time: 76.08464455604553
Total time: 896.8896496295929
Epoch 33/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.1777, Acc: 0.9371
Train time: 820.7079601287842
OrderedDict([('active.all.allocated', 133507705), ('active.all.current', 722), ('active.all.freed', 133506983), ('active.all.peak', 1301), ('active.large_pool.allocated', 51680219), ('active.large_pool.current', 171), ('active.large_pool.freed', 51680048), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 81827486), ('active.small_pool.current', 551), ('active.small_pool.freed', 81826935), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3814833988464128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3814833174250496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 3798004827187200), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 3798004062496768), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 16829161276928), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.6868, Acc: 0.8070
Val and misc time: 76.09748101234436
Total time: 896.8055710792542
Epoch 34/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.1649, Acc: 0.9404
Train time: 820.8106877803802
OrderedDict([('active.all.allocated', 137563098), ('active.all.current', 722), ('active.all.freed', 137562376), ('active.all.peak', 1301), ('active.large_pool.allocated', 53250408), ('active.large_pool.current', 171), ('active.large_pool.freed', 53250237), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 84312690), ('active.small_pool.current', 551), ('active.small_pool.freed', 84312139), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 3930772749462528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 3930771935248896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 3913432441363968), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 3913431676673536), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 17340308098560), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.6718, Acc: 0.8395
Val and misc time: 76.07725048065186
Total time: 896.8880546092987
Epoch 35/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.1522, Acc: 0.9458
Train time: 820.753636598587
OrderedDict([('active.all.allocated', 141618491), ('active.all.current', 722), ('active.all.freed', 141617769), ('active.all.peak', 1301), ('active.large_pool.allocated', 54820597), ('active.large_pool.current', 171), ('active.large_pool.freed', 54820426), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 86797894), ('active.small_pool.current', 551), ('active.small_pool.freed', 86797343), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4046711510460928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4046710696247296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4028860055540736), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4028859290850304), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 17851454920192), ('active_bytes.small_pool.current', 49523200), ('active_bytes

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.6797, Acc: 0.8309
Val and misc time: 76.10198068618774
Total time: 896.8557379245758
Epoch 36/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.1449, Acc: 0.9479
Train time: 820.8314535617828
OrderedDict([('active.all.allocated', 145673884), ('active.all.current', 722), ('active.all.freed', 145673162), ('active.all.peak', 1301), ('active.large_pool.allocated', 56390786), ('active.large_pool.current', 171), ('active.large_pool.freed', 56390615), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 89283098), ('active.small_pool.current', 551), ('active.small_pool.freed', 89282547), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4162650271459328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4162649457245696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4144287669717504), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4144286905027072), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 18362601741824), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.7272, Acc: 0.8400
Val and misc time: 76.06568717956543
Total time: 896.8972828388214
Epoch 37/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.1332, Acc: 0.9516
Train time: 820.8628845214844
OrderedDict([('active.all.allocated', 149729277), ('active.all.current', 722), ('active.all.freed', 149728555), ('active.all.peak', 1301), ('active.large_pool.allocated', 57960975), ('active.large_pool.current', 171), ('active.large_pool.freed', 57960804), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 91768302), ('active.small_pool.current', 551), ('active.small_pool.freed', 91767751), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4278589032457728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4278588218244096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4259715283894272), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4259714519203840), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 18873748563456), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.7569, Acc: 0.8254
Val and misc time: 76.09302282333374
Total time: 896.956038236618
Epoch 38/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.1247, Acc: 0.9567
Train time: 820.8289685249329
OrderedDict([('active.all.allocated', 153784670), ('active.all.current', 722), ('active.all.freed', 153783948), ('active.all.peak', 1301), ('active.large_pool.allocated', 59531164), ('active.large_pool.current', 171), ('active.large_pool.freed', 59530993), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 94253506), ('active.small_pool.current', 551), ('active.small_pool.freed', 94252955), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4394527793456128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4394526979242496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4375142898071040), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4375142133380608), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 19384895385088), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.7430, Acc: 0.8202
Val and misc time: 76.04985857009888
Total time: 896.8789591789246
Epoch 39/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.1176, Acc: 0.9575
Train time: 820.8395330905914
OrderedDict([('active.all.allocated', 157840063), ('active.all.current', 722), ('active.all.freed', 157839341), ('active.all.peak', 1301), ('active.large_pool.allocated', 61101353), ('active.large_pool.current', 171), ('active.large_pool.freed', 61101182), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 96738710), ('active.small_pool.current', 551), ('active.small_pool.freed', 96738159), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4510466554454528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4510465740240896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4490570512247808), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4490569747557376), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 19896042206720), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.7535, Acc: 0.8345
Val and misc time: 75.99100852012634
Total time: 896.8306634426117
Epoch 40/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.0997, Acc: 0.9635
Train time: 820.9352192878723
OrderedDict([('active.all.allocated', 161895456), ('active.all.current', 722), ('active.all.freed', 161894734), ('active.all.peak', 1301), ('active.large_pool.allocated', 62671542), ('active.large_pool.current', 171), ('active.large_pool.freed', 62671371), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 99223914), ('active.small_pool.current', 551), ('active.small_pool.freed', 99223363), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4626405315452928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4626404501239296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4605998126424576), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4605997361734144), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 20407189028352), ('active_bytes.small_pool.current', 49523200), ('active_byte

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.7952, Acc: 0.8294
Val and misc time: 76.15407204627991
Total time: 897.0894460678101
Epoch 41/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:41<00:00,  1.42it/s]


Train loss: 0.1052, Acc: 0.9622
Train time: 821.5571517944336
OrderedDict([('active.all.allocated', 165950849), ('active.all.current', 722), ('active.all.freed', 165950127), ('active.all.peak', 1301), ('active.large_pool.allocated', 64241731), ('active.large_pool.current', 171), ('active.large_pool.freed', 64241560), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 101709118), ('active.small_pool.current', 551), ('active.small_pool.freed', 101708567), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4742344076451328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4742343262237696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4721425740601344), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4721424975910912), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 20918335849984), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.85it/s]


Val   loss: 0.8011, Acc: 0.8288
Val and misc time: 76.41665458679199
Total time: 897.973906993866
Epoch 42/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:42<00:00,  1.41it/s]


Train loss: 0.0873, Acc: 0.9671
Train time: 822.230226278305
OrderedDict([('active.all.allocated', 170006242), ('active.all.current', 722), ('active.all.freed', 170005520), ('active.all.peak', 1301), ('active.large_pool.allocated', 65811920), ('active.large_pool.current', 171), ('active.large_pool.freed', 65811749), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 104194322), ('active.small_pool.current', 551), ('active.small_pool.freed', 104193771), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4858282837449728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4858282023236096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4836853354778112), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4836852590087680), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 21429482671616), ('active_bytes.small_pool.current', 49523200), ('active_byt

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.7985, Acc: 0.8299
Val and misc time: 76.1208848953247
Total time: 898.3512480258942
Epoch 43/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:42<00:00,  1.41it/s]


Train loss: 0.0815, Acc: 0.9707
Train time: 822.2654049396515
OrderedDict([('active.all.allocated', 174061635), ('active.all.current', 722), ('active.all.freed', 174060913), ('active.all.peak', 1301), ('active.large_pool.allocated', 67382109), ('active.large_pool.current', 171), ('active.large_pool.freed', 67381938), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 106679526), ('active.small_pool.current', 551), ('active.small_pool.freed', 106678975), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 4974221598448128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 4974220784234496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 4952280968954880), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 4952280204264448), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 21940629493248), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.85it/s]


Val   loss: 0.8169, Acc: 0.8265
Val and misc time: 76.53830885887146
Total time: 898.8038153648376
Epoch 44/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.0739, Acc: 0.9735
Train time: 820.6315505504608
OrderedDict([('active.all.allocated', 178117028), ('active.all.current', 722), ('active.all.freed', 178116306), ('active.all.peak', 1301), ('active.large_pool.allocated', 68952298), ('active.large_pool.current', 171), ('active.large_pool.freed', 68952127), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 109164730), ('active.small_pool.current', 551), ('active.small_pool.freed', 109164179), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 5090160359446528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 5090159545232896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5067708583131648), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5067707818441216), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 22451776314880), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.8645, Acc: 0.8397
Val and misc time: 76.05574107170105
Total time: 896.6874523162842
Epoch 45/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.0713, Acc: 0.9742
Train time: 820.2877140045166
OrderedDict([('active.all.allocated', 182172421), ('active.all.current', 722), ('active.all.freed', 182171699), ('active.all.peak', 1301), ('active.large_pool.allocated', 70522487), ('active.large_pool.current', 171), ('active.large_pool.freed', 70522316), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 111649934), ('active.small_pool.current', 551), ('active.small_pool.freed', 111649383), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 5206099120444928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 5206098306231296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5183136197308416), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5183135432617984), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 22962923136512), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.8505, Acc: 0.8268
Val and misc time: 76.03252363204956
Total time: 896.32040143013
Epoch 46/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:43<00:00,  1.41it/s]


Train loss: 0.0730, Acc: 0.9732
Train time: 823.0740849971771
OrderedDict([('active.all.allocated', 186227814), ('active.all.current', 722), ('active.all.freed', 186227092), ('active.all.peak', 1301), ('active.large_pool.allocated', 72092676), ('active.large_pool.current', 171), ('active.large_pool.freed', 72092505), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 114135138), ('active.small_pool.current', 551), ('active.small_pool.freed', 114134587), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 5322037881443328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 5322037067229696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5298563811485184), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5298563046794752), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 23474069958144), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.85it/s]


Val   loss: 0.8863, Acc: 0.8355
Val and misc time: 76.52568888664246
Total time: 899.5999195575714
Epoch 47/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.0615, Acc: 0.9794
Train time: 820.5730464458466
OrderedDict([('active.all.allocated', 190283207), ('active.all.current', 722), ('active.all.freed', 190282485), ('active.all.peak', 1301), ('active.large_pool.allocated', 73662865), ('active.large_pool.current', 171), ('active.large_pool.freed', 73662694), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 116620342), ('active.small_pool.current', 551), ('active.small_pool.freed', 116619791), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 5437976642441728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 5437975828228096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5413991425661952), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5413990660971520), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 23985216779776), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:16<00:00,  3.83it/s]


Val   loss: 0.8680, Acc: 0.8109
Val and misc time: 76.90937805175781
Total time: 897.4827687740326
Epoch 48/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:42<00:00,  1.41it/s]


Train loss: 0.0591, Acc: 0.9792
Train time: 822.6042592525482
OrderedDict([('active.all.allocated', 194338600), ('active.all.current', 722), ('active.all.freed', 194337878), ('active.all.peak', 1301), ('active.large_pool.allocated', 75233054), ('active.large_pool.current', 171), ('active.large_pool.freed', 75232883), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 119105546), ('active.small_pool.current', 551), ('active.small_pool.freed', 119104995), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 5553915403440128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 5553914589226496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5529419039838720), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5529418275148288), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 24496363601408), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.85it/s]


Val   loss: 0.9214, Acc: 0.8375
Val and misc time: 76.48055219650269
Total time: 899.0849061012268
Epoch 49/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:42<00:00,  1.41it/s]


Train loss: 0.0527, Acc: 0.9814
Train time: 822.7321627140045
OrderedDict([('active.all.allocated', 198393993), ('active.all.current', 722), ('active.all.freed', 198393271), ('active.all.peak', 1301), ('active.large_pool.allocated', 76803243), ('active.large_pool.current', 171), ('active.large_pool.freed', 76803072), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 121590750), ('active.small_pool.current', 551), ('active.small_pool.freed', 121590199), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 5669854164438528), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 5669853350224896), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5644846654015488), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5644845889325056), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 25007510423040), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.84it/s]


Val   loss: 0.9567, Acc: 0.8347
Val and misc time: 76.62625694274902
Total time: 899.358549118042
Epoch 50/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:42<00:00,  1.41it/s]


Train loss: 0.0474, Acc: 0.9834
Train time: 822.5926477909088
OrderedDict([('active.all.allocated', 202449386), ('active.all.current', 722), ('active.all.freed', 202448664), ('active.all.peak', 1301), ('active.large_pool.allocated', 78373432), ('active.large_pool.current', 171), ('active.large_pool.freed', 78373261), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 124075954), ('active.small_pool.current', 551), ('active.small_pool.freed', 124075403), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 5785792925436928), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 5785792111223296), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5760274268192256), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5760273503501824), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 25518657244672), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.85it/s]


Val   loss: 0.9596, Acc: 0.8215
Val and misc time: 76.56263256072998
Total time: 899.1554102897644
Epoch 51/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:42<00:00,  1.41it/s]


Train loss: 0.0539, Acc: 0.9814
Train time: 822.0551908016205
OrderedDict([('active.all.allocated', 206504779), ('active.all.current', 722), ('active.all.freed', 206504057), ('active.all.peak', 1301), ('active.large_pool.allocated', 79943621), ('active.large_pool.current', 171), ('active.large_pool.freed', 79943450), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 126561158), ('active.small_pool.current', 551), ('active.small_pool.freed', 126560607), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 5901731686435328), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 5901730872221696), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5875701882369024), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5875701117678592), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 26029804066304), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.9517, Acc: 0.8232
Val and misc time: 76.14763474464417
Total time: 898.2029271125793
Epoch 52/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:40<00:00,  1.42it/s]


Train loss: 0.0447, Acc: 0.9837
Train time: 820.9856390953064
OrderedDict([('active.all.allocated', 210560172), ('active.all.current', 722), ('active.all.freed', 210559450), ('active.all.peak', 1301), ('active.large_pool.allocated', 81513810), ('active.large_pool.current', 171), ('active.large_pool.freed', 81513639), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 129046362), ('active.small_pool.current', 551), ('active.small_pool.freed', 129045811), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 6017670447433728), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 6017669633220096), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 5991129496545792), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 5991128731855360), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 26540950887936), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.87it/s]


Val   loss: 0.9961, Acc: 0.8292
Val and misc time: 76.20550847053528
Total time: 897.1912567615509
Epoch 53/53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1163/1163 [13:42<00:00,  1.41it/s]


Train loss: 0.0388, Acc: 0.9866
Train time: 822.2370665073395
OrderedDict([('active.all.allocated', 214615565), ('active.all.current', 722), ('active.all.freed', 214614843), ('active.all.peak', 1301), ('active.large_pool.allocated', 83083999), ('active.large_pool.current', 171), ('active.large_pool.freed', 83083828), ('active.large_pool.peak', 455), ('active.small_pool.allocated', 131531566), ('active.small_pool.current', 551), ('active.small_pool.freed', 131531015), ('active.small_pool.peak', 923), ('active_bytes.all.allocated', 6133609208432128), ('active_bytes.all.current', 814213632), ('active_bytes.all.freed', 6133608394218496), ('active_bytes.all.peak', 21219656192), ('active_bytes.large_pool.allocated', 6106557110722560), ('active_bytes.large_pool.current', 764690432), ('active_bytes.large_pool.freed', 6106556346032128), ('active_bytes.large_pool.peak', 21118613504), ('active_bytes.small_pool.allocated', 27052097709568), ('active_bytes.small_pool.current', 49523200), ('active_by

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 291/291 [01:15<00:00,  3.84it/s]


Val   loss: 0.9841, Acc: 0.8391
Val and misc time: 76.66597294807434
Total time: 898.9031765460968
