In [11]:
#!pip install timm
#!pip install pytorch-accelerated
!pip list | grep -E 'timm|accelerated'

pytorch-accelerated       0.1.47
timm                      0.9.16


In [19]:
#!wget 'https://s3.amazonaws.com/fast-ai-imageclas/imagenette2-320.tgz'
#!tar xvzf imagenette2-320.tgz
# train 갯수를 짝수로 맞춤
#!rm imagenette2-320/train/n03888257/n03888257_9997.JPEG

In [1]:
import glob
import numpy as np
from pathlib import Path
import shutil

def create_pcb_train_val_test(data_dir='PCBData',
                              train_dir='PCBData/train',
                              val_dir='PCBData/val',
                              test_dir='PCBData/test'
                             ):
    #all_files = glob.glob(data_dir+'/@(NG|OK)/*.jpg', flags=pathlib.GLOBSTAR | pathlib.EXTGLOB)
    ng_files = sorted(glob.glob(data_dir+"/NG/*.jpg"))
    n_ng = len(ng_files)
    ok_files = sorted(glob.glob(data_dir+"/OK/*.jpg"))
    n_ok = len(ok_files)
    #creating a new directory called pythondirectory
    Path(train_dir+'/OK').mkdir(parents=True, exist_ok=True)
    Path(train_dir+'/NG').mkdir(parents=True, exist_ok=True)
    Path(val_dir+'/OK').mkdir(parents=True, exist_ok=True)
    Path(val_dir+'/NG').mkdir(parents=True, exist_ok=True)
    np.random.seed(42)
    perm = np.random.permutation(n_ng)
    n_train = int(n_ng*0.9)
    if n_train%2 == 1:
        n_train -= 1
    src_files = ng_files
    
    train_idx = perm[:n_train]
    val_idx = perm[n_train:]
    for i in train_idx:
        src = src_files[i]
        dst = train_dir+src.replace(data_dir, '')
        shutil.copyfile(src, dst)
    for i in val_idx:
        src = src_files[i]
        dst = val_dir+src.replace(data_dir, '')
        shutil.copyfile(src, dst)
        
    perm = np.random.permutation(n_ok)
    n_train = int(n_ok*0.9)
    if n_train%2 == 1:
        n_train -= 1
    src_files = ok_files
    
    train_idx = perm[:n_train]
    val_idx = perm[n_train:]
    for i in train_idx:
        src = src_files[i]
        dst = train_dir+src.replace(data_dir, '')
        shutil.copyfile(src, dst)
    for i in val_idx:
        src = src_files[i]
        dst = val_dir+src.replace(data_dir, '')
        shutil.copyfile(src, dst)
        
#create_pcb_train_val_test()

In [1]:
import argparse
from pathlib import Path

import timm
import timm.data
import timm.loss
import timm.optim
import timm.utils
import torch
import torchmetrics
from timm.scheduler import CosineLRScheduler

from pytorch_accelerated.callbacks import SaveBestModelCallback
from pytorch_accelerated.trainer import Trainer, DEFAULT_CALLBACKS


def create_datasets(image_size, data_mean, data_std, train_path, val_path):
    train_transforms = timm.data.create_transform(
        input_size=image_size,
        is_training=True,
        mean=data_mean,
        std=data_std,
        #auto_augment="rand-m7-mstd0.5-inc1",
    )

    eval_transforms = timm.data.create_transform(
        input_size=image_size, mean=data_mean, std=data_std
    )

    train_dataset = timm.data.dataset.ImageDataset(
        train_path, transform=train_transforms
    )
    eval_dataset = timm.data.dataset.ImageDataset(val_path, transform=eval_transforms)

    return train_dataset, eval_dataset


class TimmMixupTrainer(Trainer):
    def __init__(self, eval_loss_fn, mixup_args, num_classes, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.eval_loss_fn = eval_loss_fn
        self.num_updates = None
        self.mixup_fn = timm.data.Mixup(**mixup_args)

        self.accuracy = torchmetrics.Accuracy(num_classes=num_classes, task="multiclass")
        self.ema_accuracy = torchmetrics.Accuracy(num_classes=num_classes, task="multiclass")
        self.ema_model = None

    def create_scheduler(self):
        return timm.scheduler.CosineLRScheduler(
            self.optimizer,
            t_initial=self.run_config.num_epochs,
            cycle_decay=0.5,
            lr_min=1e-6,
            t_in_epochs=True,
            warmup_t=3,
            warmup_lr_init=1e-4,
            cycle_limit=1,
        )

    def training_run_start(self):
        # Model EMA requires the model without a DDP wrapper and before sync batchnorm conversion
        self.ema_model = timm.utils.ModelEmaV2(
            self._accelerator.unwrap_model(self.model), decay=0.9
        )
        if self.run_config.is_distributed:
            self.model = torch.nn.SyncBatchNorm.convert_sync_batchnorm(self.model)

    def train_epoch_start(self):
        super().train_epoch_start()
        self.num_updates = self.run_history.current_epoch * len(self._train_dataloader)

    def calculate_train_batch_loss(self, batch):
        xb, yb = batch
        #print('### batch_size =', len(batch), len(xb), len(yb))
        mixup_xb, mixup_yb = self.mixup_fn(xb, yb)
        return super().calculate_train_batch_loss((mixup_xb, mixup_yb))

    def train_epoch_end(
        self,
    ):
        self.ema_model.update(self.model)
        self.ema_model.eval()

        if hasattr(self.optimizer, "sync_lookahead"):
            self.optimizer.sync_lookahead()

    def scheduler_step(self):
        self.num_updates += 1
        if self.scheduler is not None:
            self.scheduler.step_update(num_updates=self.num_updates)

    def calculate_eval_batch_loss(self, batch):
        with torch.no_grad():
            xb, yb = batch
            outputs = self.model(xb)
            val_loss = self.eval_loss_fn(outputs, yb)
            self.accuracy.update(outputs.argmax(-1), yb)

            ema_model_preds = self.ema_model.module(xb).argmax(-1)
            self.ema_accuracy.update(ema_model_preds, yb)

        return {"loss": val_loss, "model_outputs": outputs, "batch_size": xb.size(0)}

    def eval_epoch_end(self):
        super().eval_epoch_end()

        if self.scheduler is not None:
            self.scheduler.step(self.run_history.current_epoch + 1)

        self.run_history.update_metric("accuracy", self.accuracy.compute().cpu())
        self.run_history.update_metric(
            "ema_model_accuracy", self.ema_accuracy.compute().cpu()
        )
        self.accuracy.reset()
        self.ema_accuracy.reset()


def main(data_path):

    # Set training arguments, hardcoded here for clarity
    image_size = (224, 224)
    lr = 5e-3
    smoothing = 0.1
    mixup = 0.2
    cutmix = 1.0
    batch_size = 32
    bce_target_thresh = 0.2
    num_epochs = 40

    data_path = Path(data_path)
    train_path = data_path / "train"
    val_path = data_path / "val"

    num_classes = len(list(train_path.iterdir()))

    mixup_args = dict(
        mixup_alpha=mixup,
        cutmix_alpha=cutmix,
        label_smoothing=smoothing,
        num_classes=num_classes,
    )

    # Create model using timm
    model = timm.create_model(
        "resnet50d", pretrained=True, num_classes=num_classes, drop_path_rate=0.05
    )

    # Load data config associated with the model to use in data augmentation pipeline
    data_config = timm.data.resolve_data_config({}, model=model, verbose=True)
    data_mean = data_config["mean"]
    data_std = data_config["std"]

    # Create training and validation datasets
    train_dataset, eval_dataset = create_datasets(
        train_path=train_path,
        val_path=val_path,
        image_size=image_size,
        data_mean=data_mean,
        data_std=data_std,
    )

    # Create optimizer
    optimizer = timm.optim.create_optimizer_v2(
        model, opt="lookahead_AdamW", lr=lr, weight_decay=0.01
    )

    # As we are using Mixup, we can use BCE during training and CE for evaluation
    train_loss_fn = timm.loss.BinaryCrossEntropy(
        target_threshold=bce_target_thresh, smoothing=smoothing
    )
    validate_loss_fn = torch.nn.CrossEntropyLoss()

    # Create trainer and start training
    trainer = TimmMixupTrainer(
        model=model,
        optimizer=optimizer,
        loss_func=train_loss_fn,
        eval_loss_fn=validate_loss_fn,
        mixup_args=mixup_args,
        num_classes=num_classes,
        callbacks=[
            *DEFAULT_CALLBACKS,
            SaveBestModelCallback(watch_metric="accuracy", greater_is_better=True),
        ],
    )

    trainer.train(
        per_device_batch_size=batch_size,
        train_dataset=train_dataset,
        eval_dataset=eval_dataset,
        num_epochs=num_epochs,
        create_scheduler_fn=trainer.create_scheduler,
    )


if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Simple example of training script using timm.")
    parser.add_argument("--data_dir", required=True, help="The data folder on disk.")
    #args = parser.parse_args(args=['--data_dir=imagenette2-320'])
    args = parser.parse_args(args=['--data_dir=PCBData'])
    main(args.data_dir)


Starting training run

Starting epoch 1


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.73it/s]



train_loss_epoch: 0.4047023057937622


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.07it/s]



eval_loss_epoch: 0.19410289824008942

accuracy: 0.9139280319213867

ema_model_accuracy: 0.693270742893219

Starting epoch 2


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 12.02it/s]



train_loss_epoch: 0.38452500104904175


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.68it/s]



eval_loss_epoch: 0.2393694967031479

accuracy: 0.9123630523681641

ema_model_accuracy: 0.7942097187042236

Starting epoch 3


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.3550090491771698


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.61it/s]



eval_loss_epoch: 0.2217443287372589

accuracy: 0.9162754416465759

ema_model_accuracy: 0.7949921488761902

Starting epoch 4


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 12.01it/s]



train_loss_epoch: 0.33537983894348145


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.49it/s]



eval_loss_epoch: 0.2271302342414856

accuracy: 0.922535240650177

ema_model_accuracy: 0.8262910842895508

Starting epoch 5


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.3241303563117981


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.67it/s]



eval_loss_epoch: 0.20236581563949585

accuracy: 0.9366196990013123

ema_model_accuracy: 0.8685445785522461

Starting epoch 6


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.3078845143318176


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.81it/s]



eval_loss_epoch: 0.18436121940612793

accuracy: 0.9413145780563354

ema_model_accuracy: 0.876369297504425

Starting epoch 7


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.3021332621574402


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.69it/s]



eval_loss_epoch: 0.2691986560821533

accuracy: 0.9154929518699646

ema_model_accuracy: 0.8661971688270569

Starting epoch 8


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.3116254210472107


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.58it/s]



eval_loss_epoch: 0.16765761375427246

accuracy: 0.9311423897743225

ema_model_accuracy: 0.8755868673324585

Starting epoch 9


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.301202654838562


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.62it/s]



eval_loss_epoch: 0.17072969675064087

accuracy: 0.9389671087265015

ema_model_accuracy: 0.8826290965080261

Starting epoch 10


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.29900750517845154


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.71it/s]



eval_loss_epoch: 0.17649336159229279

accuracy: 0.9413145780563354

ema_model_accuracy: 0.8826290965080261

Starting epoch 11


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.2920399606227875


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.68it/s]



eval_loss_epoch: 0.18892902135849

accuracy: 0.9389671087265015

ema_model_accuracy: 0.886541485786438

Starting epoch 12


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.29068976640701294


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.57it/s]



eval_loss_epoch: 0.16215580701828003

accuracy: 0.9444444179534912

ema_model_accuracy: 0.8904538154602051

Starting epoch 13


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.29067692160606384


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.64it/s]



eval_loss_epoch: 0.18504874408245087

accuracy: 0.9389671087265015

ema_model_accuracy: 0.8935837149620056

Starting epoch 14


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.2737693786621094


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.86it/s]



eval_loss_epoch: 0.19205333292484283

accuracy: 0.9436619877815247

ema_model_accuracy: 0.8974961042404175

Starting epoch 15


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.28746795654296875


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.01it/s]



eval_loss_epoch: 0.15886752307415009

accuracy: 0.9405320882797241

ema_model_accuracy: 0.900626003742218

Starting epoch 16


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.2812126874923706


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.72it/s]



eval_loss_epoch: 0.1689070612192154

accuracy: 0.9381846785545349

ema_model_accuracy: 0.9053208231925964

Starting epoch 17


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.2817866802215576


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.39it/s]



eval_loss_epoch: 0.1785554736852646

accuracy: 0.9381846785545349

ema_model_accuracy: 0.9139280319213867

Starting epoch 18


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.2699515223503113


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.58it/s]



eval_loss_epoch: 0.1888512372970581

accuracy: 0.9460093975067139

ema_model_accuracy: 0.9186228513717651

Starting epoch 19


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.27045127749443054


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.64it/s]



eval_loss_epoch: 0.18046145141124725

accuracy: 0.9428794980049133

ema_model_accuracy: 0.9233176708221436

Starting epoch 20


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.26251474022865295


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.63it/s]



eval_loss_epoch: 0.1704493910074234

accuracy: 0.942097008228302

ema_model_accuracy: 0.9264475703239441

Starting epoch 21


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.2595018446445465


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.49it/s]



eval_loss_epoch: 0.16557317972183228

accuracy: 0.9428794980049133

ema_model_accuracy: 0.9327073693275452

Starting epoch 22


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.25192028284072876


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.81it/s]



eval_loss_epoch: 0.16151872277259827

accuracy: 0.9428794980049133

ema_model_accuracy: 0.934272289276123

Starting epoch 23


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.25100815296173096


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.60it/s]



eval_loss_epoch: 0.14843043684959412

accuracy: 0.9467918872833252

ema_model_accuracy: 0.9350547790527344

Starting epoch 24


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.24904514849185944


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.65it/s]



eval_loss_epoch: 0.15574301779270172

accuracy: 0.9491392970085144

ema_model_accuracy: 0.9389671087265015

Starting epoch 25


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.25276535749435425


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.58it/s]



eval_loss_epoch: 0.15061870217323303

accuracy: 0.9546166062355042

ema_model_accuracy: 0.9405320882797241

Starting epoch 26


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.24387751519680023


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.66it/s]



eval_loss_epoch: 0.15695635974407196

accuracy: 0.9444444179534912

ema_model_accuracy: 0.942097008228302

Starting epoch 27


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.24345102906227112


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.56it/s]



eval_loss_epoch: 0.1435985416173935

accuracy: 0.9514867067337036

ema_model_accuracy: 0.9428794980049133

Starting epoch 28


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.95it/s]



train_loss_epoch: 0.24127651751041412


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.46it/s]



eval_loss_epoch: 0.15644381940364838

accuracy: 0.949921727180481

ema_model_accuracy: 0.9436619877815247

Starting epoch 29


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.97it/s]



train_loss_epoch: 0.2374706119298935


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.71it/s]



eval_loss_epoch: 0.15002906322479248

accuracy: 0.9514867067337036

ema_model_accuracy: 0.9452269077301025

Starting epoch 30


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.2334495186805725


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.62it/s]



eval_loss_epoch: 0.15314719080924988

accuracy: 0.9530516266822815

ema_model_accuracy: 0.9467918872833252

Starting epoch 31


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.23645073175430298


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.40it/s]



eval_loss_epoch: 0.14968925714492798

accuracy: 0.9538341164588928

ema_model_accuracy: 0.9460093975067139

Starting epoch 32


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.23066464066505432


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.72it/s]



eval_loss_epoch: 0.13815557956695557

accuracy: 0.9569640159606934

ema_model_accuracy: 0.9467918872833252

Starting epoch 33


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.23686285316944122


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.58it/s]



eval_loss_epoch: 0.13745954632759094

accuracy: 0.9553990364074707

ema_model_accuracy: 0.9491392970085144

Starting epoch 34


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.23006770014762878


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.65it/s]



eval_loss_epoch: 0.13319893181324005

accuracy: 0.956181526184082

ema_model_accuracy: 0.9507042169570923

Starting epoch 35


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.21969768404960632


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.75it/s]



eval_loss_epoch: 0.13475796580314636

accuracy: 0.956181526184082

ema_model_accuracy: 0.9522691965103149

Starting epoch 36


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.98it/s]



train_loss_epoch: 0.2281387448310852


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.73it/s]



eval_loss_epoch: 0.133697047829628

accuracy: 0.956181526184082

ema_model_accuracy: 0.9530516266822815

Starting epoch 37


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.22596308588981628


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.52it/s]



eval_loss_epoch: 0.13507629930973053

accuracy: 0.9553990364074707

ema_model_accuracy: 0.9538341164588928

Starting epoch 38


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.22371047735214233


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.61it/s]



eval_loss_epoch: 0.1352347731590271

accuracy: 0.956181526184082

ema_model_accuracy: 0.9553990364074707

Starting epoch 39


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:30<00:00, 11.96it/s]



train_loss_epoch: 0.2189575433731079


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.37it/s]



eval_loss_epoch: 0.13211044669151306

accuracy: 0.956181526184082

ema_model_accuracy: 0.956181526184082

Starting epoch 40


100%|███████████████████████████████████████████████████████████████████████████| 359/359 [00:29<00:00, 11.97it/s]



train_loss_epoch: 0.22398482263088226


100%|█████████████████████████████████████████████████████████████████████████████| 40/40 [00:02<00:00, 17.51it/s]



eval_loss_epoch: 0.13113710284233093

accuracy: 0.9546166062355042

ema_model_accuracy: 0.9553990364074707
Finishing training run
Loading checkpoint with accuracy: 0.9569640159606934 from epoch 32


In [50]:
len(train_ds)

11481

In [51]:
train_ds[10000]

(tensor([[[-0.9534, -0.9534, -0.9363,  ..., -0.8507, -0.8507, -0.8507],
          [-0.9534, -0.9363, -0.9363,  ..., -0.8507, -0.8507, -0.8507],
          [-0.9363, -0.9192, -0.9534,  ..., -0.8678, -0.8507, -0.8507],
          ...,
          [-0.7993, -0.8507, -0.8507,  ..., -0.9020, -0.9020, -0.8849],
          [-0.7993, -0.8507, -0.8507,  ..., -0.9192, -0.9192, -0.8849],
          [-0.7993, -0.8507, -0.8507,  ..., -0.9363, -0.9192, -0.8849]],
 
         [[-0.7227, -0.7052, -0.7052,  ..., -0.7227, -0.7227, -0.7227],
          [-0.7227, -0.7052, -0.7052,  ..., -0.7227, -0.7227, -0.7227],
          [-0.7052, -0.6877, -0.7052,  ..., -0.7227, -0.7227, -0.7227],
          ...,
          [-0.6877, -0.6877, -0.6877,  ..., -0.7052, -0.7227, -0.7227],
          [-0.6877, -0.6877, -0.7052,  ..., -0.7052, -0.7052, -0.7052],
          [-0.6877, -0.6877, -0.7227,  ..., -0.7052, -0.7052, -0.7052]],
 
         [[-0.4624, -0.4624, -0.4798,  ..., -0.4973, -0.4973, -0.4973],
          [-0.4450, -0.4450,