In [1]:
import os
os.environ['CUDA_LAUNCH_BLOCKING'] = "1"
os.environ['TORCH_USE_CUDA_DSA'] = "1"

In [2]:
%env CUDA_LAUNCH_BLOCKING=1

env: CUDA_LAUNCH_BLOCKING=1


In [3]:
import torch
# setting device on GPU if available, else CPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print('Using device:', device)
print()

#Additional Info when using cuda
if device.type == 'cuda':
    print(torch.cuda.get_device_name(0))
    print('CUDA version:', torch.version.cuda)
    print('Memory Usage:') 
    print('Allocated:', round(torch.cuda.memory_allocated(0)/1024**3,1), 'GB')
    print('Cached:   ', round(torch.cuda.memory_reserved(0)/1024**3,1), 'GB')

Using device: cuda

NVIDIA GeForce GTX 960
CUDA version: 11.7
Memory Usage:
Allocated: 0.0 GB
Cached:    0.0 GB


In [4]:
import numpy as np
import PIL
from PIL import Image
import datasets
import evaluate
import torch
import json
import codecs
import os
from os import sys

from transformers import SegformerImageProcessor, AutoModelForSemanticSegmentation, TrainingArguments, Trainer, EarlyStoppingCallback

  from .autonotebook import tqdm as notebook_tqdm


In [5]:
module_path = os.path.abspath(os.path.join('./src'))
if module_path not in sys.path:
    sys.path.append(module_path)
from data_prepossessing import create_datasets_for_plants, get_labels
from constants import *

In [6]:
checkpoint = "nvidia/mit-b0"
image_processor = SegformerImageProcessor.from_pretrained(checkpoint)
image_processor



SegformerImageProcessor {
  "do_normalize": true,
  "do_reduce_labels": false,
  "do_rescale": true,
  "do_resize": true,
  "feature_extractor_type": "SegformerFeatureExtractor",
  "image_mean": [
    0.485,
    0.456,
    0.406
  ],
  "image_processor_type": "SegformerImageProcessor",
  "image_std": [
    0.229,
    0.224,
    0.225
  ],
  "resample": 2,
  "rescale_factor": 0.00392156862745098,
  "size": {
    "height": 512,
    "width": 512
  }
}

In [7]:
def train_transforms(example_batch):
    images = [x for x in example_batch["image"]]
    labels = [x for x in example_batch["annotation"]]
    inputs = image_processor(images, labels)
    return inputs

In [8]:
metric = evaluate.load("mean_iou")

In [9]:
def compute_metrics(num_labels, eval_pred):
    with torch.no_grad():
        logits, labels = eval_pred
        logits_tensor = torch.from_numpy(logits)
        logits_tensor = torch.nn.functional.interpolate(
            logits_tensor,
            size=labels.shape[-2:],
            mode="bilinear",
            align_corners=False,
        ).argmax(dim=1)

        pred_labels = logits_tensor.detach().cpu().numpy()
        metrics = metric.compute(
            predictions=pred_labels,
            references=labels,
            num_labels=num_labels,
            ignore_index=255,
            reduce_labels=False,
        )
        for key, value in metrics.items():
            if type(value) is np.ndarray:
                metrics[key] = value.tolist()
        return metrics

In [10]:
training_args = TrainingArguments(
    output_dir="segformer-b0-scene-parse-150",
    learning_rate=6e-5,
    num_train_epochs=5,
    per_device_train_batch_size=6,
    per_device_eval_batch_size=6,
    save_total_limit=3,
    evaluation_strategy="steps",
    save_strategy="steps",
    save_steps=200,
    eval_steps=200,
    logging_steps=1,
    remove_unused_columns=False,
    load_best_model_at_end=True,
    seed=seed,
)

In [11]:
def initialize_trainer(model, num_labels, train_ds, test_ds) :
    trainer = Trainer(
        model=model,
        args=training_args,
        train_dataset=train_ds,
        eval_dataset=test_ds,
        compute_metrics=lambda eval_pred: compute_metrics(num_labels, eval_pred),
        callbacks=[EarlyStoppingCallback(early_stopping_patience=3)]
    )

    return trainer

In [12]:
def train_model_of_type_for_crop(model_type, crop):
    model_plant_names = [crop] + weed_plants
    train_ds, val_ds, test_ds = create_datasets_for_plants(model_plant_names, model_type, crop)

    print("Training subset number of images: " + str(train_ds.num_rows))
    print("Validation subset number of images: " + str(val_ds.num_rows))
    print("Test subset number of images: " + str(test_ds.num_rows))

    train_ds.set_transform(train_transforms)
    val_ds.set_transform(train_transforms)
    test_ds.set_transform(train_transforms)

    id2label, label2id = get_labels(crop, model_type)

    print('Number of classes:', len(id2label))
    print('id2label:', id2label)
    print('label2id:', label2id)

    model = AutoModelForSemanticSegmentation.from_pretrained(checkpoint, id2label=id2label, label2id=label2id)
    trainer = initialize_trainer(model, len(id2label), train_ds, val_ds)
    trainer.train()

    # Save the trained model, so that it can be used for inference later.
    # Save the log history, so that it can be used for plotting later.
    trainer.save_model('models/' + model_type + '/' + crop)
    with open('models/' + model_type + '/' + crop + '/log_history.json', 'w') as file:
        log_history = trainer.state.log_history
        json.dump(log_history, file)

    test_metric = trainer.evaluate(test_ds)

    with open('models/' + model_type + '/' + crop + '/test_metric.json', 'w') as file:
        json.dump(test_metric, file)

In [13]:
# 210 images
# train_model_of_type_for_crop("multiclass", "broad_bean")
train_model_of_type_for_crop("binary", "broad_bean")

# 137 images
# train_model_of_type_for_crop("multiclass", "common_buckwheat")
# train_model_of_type_for_crop("binary", "common_buckwheat")

# 207 images
# train_model_of_type_for_crop("multiclass", "pea")
# train_model_of_type_for_crop("binary", "pea")

# 403 images
# train_model_of_type_for_crop("multiclass", "corn")
# train_model_of_type_for_crop("binary", "corn")

# 303 images
# train_model_of_type_for_crop("multiclass", "soybean")
# train_model_of_type_for_crop("binary", "soybean")

# 135 images
# train_model_of_type_for_crop("multiclass", "sunflower")
# train_model_of_type_for_crop("binary", "sunflower")

# 410 images
# train_model_of_type_for_crop("multiclass", "sugar_beet")
# train_model_of_type_for_crop("binary", "sugar_beet")

Training subset number of images: 428
Validation subset number of images: 213
Test subset number of images: 215
Number of classes: 4
id2label: {0: 'void', 1: 'soil', 2: 'broad_bean', 3: 'weeds'}
label2id: {'void': 0, 'soil': 1, 'broad_bean': 2, 'weeds': 3}


Some weights of SegformerForSemanticSegmentation were not initialized from the model checkpoint at nvidia/mit-b0 and are newly initialized: ['decode_head.linear_fuse.weight', 'decode_head.linear_c.2.proj.bias', 'decode_head.batch_norm.bias', 'decode_head.linear_c.0.proj.weight', 'decode_head.linear_c.0.proj.bias', 'decode_head.classifier.bias', 'decode_head.batch_norm.weight', 'decode_head.linear_c.3.proj.weight', 'decode_head.linear_c.1.proj.bias', 'decode_head.batch_norm.running_mean', 'decode_head.linear_c.3.proj.bias', 'decode_head.batch_norm.running_var', 'decode_head.linear_c.2.proj.weight', 'decode_head.linear_c.1.proj.weight', 'decode_head.classifier.weight', 'decode_head.batch_norm.num_batches_tracked']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
  0%|          | 1/360 [00:04<23:57,  4.01s/it]

{'loss': 1.4671, 'learning_rate': 5.9833333333333335e-05, 'epoch': 0.01}


  1%|          | 2/360 [00:06<18:55,  3.17s/it]

{'loss': 1.4505, 'learning_rate': 5.966666666666667e-05, 'epoch': 0.03}


  1%|          | 3/360 [00:09<18:37,  3.13s/it]

{'loss': 1.4341, 'learning_rate': 5.95e-05, 'epoch': 0.04}


  1%|          | 4/360 [00:12<17:12,  2.90s/it]

{'loss': 1.4388, 'learning_rate': 5.933333333333334e-05, 'epoch': 0.06}


  1%|▏         | 5/360 [00:14<16:23,  2.77s/it]

{'loss': 1.4238, 'learning_rate': 5.916666666666667e-05, 'epoch': 0.07}


  2%|▏         | 6/360 [00:17<15:51,  2.69s/it]

{'loss': 1.354, 'learning_rate': 5.9e-05, 'epoch': 0.08}


  2%|▏         | 7/360 [00:19<15:34,  2.65s/it]

{'loss': 1.3681, 'learning_rate': 5.883333333333333e-05, 'epoch': 0.1}


  2%|▏         | 8/360 [00:22<15:12,  2.59s/it]

{'loss': 1.3136, 'learning_rate': 5.8666666666666665e-05, 'epoch': 0.11}


  2%|▎         | 9/360 [00:24<15:01,  2.57s/it]

{'loss': 1.3114, 'learning_rate': 5.85e-05, 'epoch': 0.12}


  3%|▎         | 10/360 [00:27<14:50,  2.55s/it]

{'loss': 1.2868, 'learning_rate': 5.833333333333333e-05, 'epoch': 0.14}


  3%|▎         | 11/360 [00:29<14:44,  2.53s/it]

{'loss': 1.3157, 'learning_rate': 5.8166666666666667e-05, 'epoch': 0.15}


  3%|▎         | 12/360 [00:32<14:41,  2.53s/it]

{'loss': 1.2642, 'learning_rate': 5.8e-05, 'epoch': 0.17}


  4%|▎         | 13/360 [00:34<14:43,  2.55s/it]

{'loss': 1.2666, 'learning_rate': 5.7833333333333334e-05, 'epoch': 0.18}


  4%|▍         | 14/360 [00:37<14:46,  2.56s/it]

{'loss': 1.2939, 'learning_rate': 5.766666666666667e-05, 'epoch': 0.19}


  4%|▍         | 15/360 [00:40<14:46,  2.57s/it]

{'loss': 1.1755, 'learning_rate': 5.75e-05, 'epoch': 0.21}


  4%|▍         | 16/360 [00:42<14:45,  2.57s/it]

{'loss': 1.2606, 'learning_rate': 5.7333333333333336e-05, 'epoch': 0.22}


  5%|▍         | 17/360 [00:45<14:40,  2.57s/it]

{'loss': 1.1711, 'learning_rate': 5.716666666666666e-05, 'epoch': 0.24}


  5%|▌         | 18/360 [00:47<14:39,  2.57s/it]

{'loss': 1.2016, 'learning_rate': 5.6999999999999996e-05, 'epoch': 0.25}


  5%|▌         | 19/360 [00:50<14:38,  2.58s/it]

{'loss': 1.1474, 'learning_rate': 5.683333333333333e-05, 'epoch': 0.26}


  6%|▌         | 20/360 [00:53<14:36,  2.58s/it]

{'loss': 1.1435, 'learning_rate': 5.6666666666666664e-05, 'epoch': 0.28}


  6%|▌         | 21/360 [00:55<14:34,  2.58s/it]

{'loss': 1.0905, 'learning_rate': 5.65e-05, 'epoch': 0.29}


  6%|▌         | 22/360 [00:58<14:30,  2.58s/it]

{'loss': 1.1043, 'learning_rate': 5.633333333333333e-05, 'epoch': 0.31}


  6%|▋         | 23/360 [01:00<14:37,  2.61s/it]

{'loss': 1.1235, 'learning_rate': 5.6166666666666665e-05, 'epoch': 0.32}


  7%|▋         | 24/360 [01:03<14:28,  2.58s/it]

{'loss': 1.0654, 'learning_rate': 5.6e-05, 'epoch': 0.33}


  7%|▋         | 25/360 [01:05<14:24,  2.58s/it]

{'loss': 1.0532, 'learning_rate': 5.583333333333333e-05, 'epoch': 0.35}


  7%|▋         | 26/360 [01:08<14:21,  2.58s/it]

{'loss': 1.2033, 'learning_rate': 5.5666666666666674e-05, 'epoch': 0.36}


  8%|▊         | 27/360 [01:11<14:20,  2.58s/it]

{'loss': 1.2016, 'learning_rate': 5.550000000000001e-05, 'epoch': 0.38}


  8%|▊         | 28/360 [01:13<14:16,  2.58s/it]

{'loss': 1.2122, 'learning_rate': 5.533333333333334e-05, 'epoch': 0.39}


  8%|▊         | 29/360 [01:16<14:16,  2.59s/it]

{'loss': 1.0602, 'learning_rate': 5.516666666666667e-05, 'epoch': 0.4}


  8%|▊         | 30/360 [01:18<14:10,  2.58s/it]

{'loss': 0.9966, 'learning_rate': 5.5e-05, 'epoch': 0.42}


  9%|▊         | 31/360 [01:21<14:05,  2.57s/it]

{'loss': 1.0216, 'learning_rate': 5.4833333333333336e-05, 'epoch': 0.43}


  9%|▉         | 32/360 [01:24<14:05,  2.58s/it]

{'loss': 0.9833, 'learning_rate': 5.466666666666667e-05, 'epoch': 0.44}


  9%|▉         | 33/360 [01:26<14:03,  2.58s/it]

{'loss': 0.9725, 'learning_rate': 5.45e-05, 'epoch': 0.46}


  9%|▉         | 34/360 [01:29<14:00,  2.58s/it]

{'loss': 0.9839, 'learning_rate': 5.433333333333334e-05, 'epoch': 0.47}


 10%|▉         | 35/360 [01:31<13:58,  2.58s/it]

{'loss': 0.984, 'learning_rate': 5.416666666666667e-05, 'epoch': 0.49}


 10%|█         | 36/360 [01:34<13:53,  2.57s/it]

{'loss': 0.9737, 'learning_rate': 5.4000000000000005e-05, 'epoch': 0.5}


 10%|█         | 37/360 [01:36<13:48,  2.57s/it]

{'loss': 0.9673, 'learning_rate': 5.383333333333334e-05, 'epoch': 0.51}


 11%|█         | 38/360 [01:39<13:44,  2.56s/it]

{'loss': 0.9146, 'learning_rate': 5.366666666666667e-05, 'epoch': 0.53}


 11%|█         | 39/360 [01:41<13:44,  2.57s/it]

{'loss': 0.9481, 'learning_rate': 5.3500000000000006e-05, 'epoch': 0.54}


 11%|█         | 40/360 [01:44<13:43,  2.57s/it]

{'loss': 0.8952, 'learning_rate': 5.333333333333333e-05, 'epoch': 0.56}


 11%|█▏        | 41/360 [01:47<13:39,  2.57s/it]

{'loss': 0.8634, 'learning_rate': 5.316666666666667e-05, 'epoch': 0.57}


 12%|█▏        | 42/360 [01:49<13:32,  2.55s/it]

{'loss': 0.863, 'learning_rate': 5.3e-05, 'epoch': 0.58}


 12%|█▏        | 43/360 [01:52<13:44,  2.60s/it]

{'loss': 0.9874, 'learning_rate': 5.2833333333333335e-05, 'epoch': 0.6}


 12%|█▏        | 44/360 [01:55<14:09,  2.69s/it]

{'loss': 0.8443, 'learning_rate': 5.266666666666667e-05, 'epoch': 0.61}


 12%|█▎        | 45/360 [01:57<13:47,  2.63s/it]

{'loss': 0.8752, 'learning_rate': 5.25e-05, 'epoch': 0.62}


 13%|█▎        | 46/360 [02:00<13:33,  2.59s/it]

{'loss': 0.8429, 'learning_rate': 5.2333333333333336e-05, 'epoch': 0.64}


 13%|█▎        | 47/360 [02:02<13:23,  2.57s/it]

{'loss': 0.8346, 'learning_rate': 5.216666666666667e-05, 'epoch': 0.65}


 13%|█▎        | 48/360 [02:05<13:16,  2.55s/it]

{'loss': 0.8157, 'learning_rate': 5.2000000000000004e-05, 'epoch': 0.67}


 14%|█▎        | 49/360 [02:07<13:14,  2.56s/it]

{'loss': 0.9564, 'learning_rate': 5.183333333333334e-05, 'epoch': 0.68}


 14%|█▍        | 50/360 [02:10<13:10,  2.55s/it]

{'loss': 0.8177, 'learning_rate': 5.166666666666667e-05, 'epoch': 0.69}


 14%|█▍        | 51/360 [02:12<13:08,  2.55s/it]

{'loss': 0.8741, 'learning_rate': 5.15e-05, 'epoch': 0.71}


 14%|█▍        | 52/360 [02:15<13:04,  2.55s/it]

{'loss': 0.8134, 'learning_rate': 5.133333333333333e-05, 'epoch': 0.72}


 15%|█▍        | 53/360 [02:17<13:00,  2.54s/it]

{'loss': 0.8042, 'learning_rate': 5.1166666666666666e-05, 'epoch': 0.74}


 15%|█▌        | 54/360 [02:20<12:59,  2.55s/it]

{'loss': 0.7743, 'learning_rate': 5.1e-05, 'epoch': 0.75}


 15%|█▌        | 55/360 [02:23<12:53,  2.54s/it]

{'loss': 0.8092, 'learning_rate': 5.0833333333333333e-05, 'epoch': 0.76}


 16%|█▌        | 56/360 [02:25<12:52,  2.54s/it]

{'loss': 0.9961, 'learning_rate': 5.066666666666667e-05, 'epoch': 0.78}


 16%|█▌        | 57/360 [02:28<12:44,  2.52s/it]

{'loss': 0.8534, 'learning_rate': 5.05e-05, 'epoch': 0.79}


 16%|█▌        | 58/360 [02:30<12:39,  2.52s/it]

{'loss': 0.7865, 'learning_rate': 5.0333333333333335e-05, 'epoch': 0.81}


 16%|█▋        | 59/360 [02:33<12:39,  2.52s/it]

{'loss': 0.7433, 'learning_rate': 5.016666666666667e-05, 'epoch': 0.82}


 17%|█▋        | 60/360 [02:35<12:42,  2.54s/it]

{'loss': 0.7752, 'learning_rate': 5e-05, 'epoch': 0.83}


 17%|█▋        | 61/360 [02:38<12:40,  2.54s/it]

{'loss': 0.7416, 'learning_rate': 4.9833333333333336e-05, 'epoch': 0.85}


 17%|█▋        | 62/360 [02:40<12:42,  2.56s/it]

{'loss': 0.7573, 'learning_rate': 4.966666666666666e-05, 'epoch': 0.86}


 18%|█▊        | 63/360 [02:43<12:50,  2.59s/it]

{'loss': 0.8539, 'learning_rate': 4.95e-05, 'epoch': 0.88}


 18%|█▊        | 64/360 [02:46<12:58,  2.63s/it]

{'loss': 0.7356, 'learning_rate': 4.933333333333333e-05, 'epoch': 0.89}


 18%|█▊        | 65/360 [02:48<12:51,  2.62s/it]

{'loss': 0.7544, 'learning_rate': 4.9166666666666665e-05, 'epoch': 0.9}


 18%|█▊        | 66/360 [02:51<12:46,  2.61s/it]

{'loss': 0.764, 'learning_rate': 4.9e-05, 'epoch': 0.92}


 19%|█▊        | 67/360 [02:53<12:38,  2.59s/it]

{'loss': 0.741, 'learning_rate': 4.883333333333333e-05, 'epoch': 0.93}


 19%|█▉        | 68/360 [02:56<12:32,  2.58s/it]

{'loss': 0.7129, 'learning_rate': 4.8666666666666666e-05, 'epoch': 0.94}


 19%|█▉        | 69/360 [02:59<12:27,  2.57s/it]

{'loss': 0.6829, 'learning_rate': 4.85e-05, 'epoch': 0.96}


 19%|█▉        | 70/360 [03:01<12:28,  2.58s/it]

{'loss': 0.7451, 'learning_rate': 4.8333333333333334e-05, 'epoch': 0.97}


 20%|█▉        | 71/360 [03:03<11:45,  2.44s/it]

{'loss': 0.7008, 'learning_rate': 4.816666666666667e-05, 'epoch': 0.99}


 20%|██        | 72/360 [03:04<09:17,  1.94s/it]

{'loss': 0.7607, 'learning_rate': 4.8e-05, 'epoch': 1.0}


 20%|██        | 73/360 [03:07<11:05,  2.32s/it]

{'loss': 0.7692, 'learning_rate': 4.7833333333333335e-05, 'epoch': 1.01}


 21%|██        | 74/360 [03:10<11:25,  2.40s/it]

{'loss': 0.7047, 'learning_rate': 4.766666666666666e-05, 'epoch': 1.03}


 21%|██        | 75/360 [03:12<11:36,  2.45s/it]

{'loss': 0.6739, 'learning_rate': 4.7499999999999996e-05, 'epoch': 1.04}


 21%|██        | 76/360 [03:15<11:40,  2.47s/it]

{'loss': 0.6569, 'learning_rate': 4.733333333333333e-05, 'epoch': 1.06}


 21%|██▏       | 77/360 [03:18<11:49,  2.51s/it]

{'loss': 0.6404, 'learning_rate': 4.7166666666666663e-05, 'epoch': 1.07}


 22%|██▏       | 78/360 [03:20<11:51,  2.52s/it]

{'loss': 0.658, 'learning_rate': 4.7000000000000004e-05, 'epoch': 1.08}


 22%|██▏       | 79/360 [03:23<11:50,  2.53s/it]

{'loss': 0.7931, 'learning_rate': 4.683333333333334e-05, 'epoch': 1.1}


 22%|██▏       | 80/360 [03:25<11:43,  2.51s/it]

{'loss': 0.6872, 'learning_rate': 4.666666666666667e-05, 'epoch': 1.11}


 22%|██▎       | 81/360 [03:28<11:39,  2.51s/it]

{'loss': 0.6306, 'learning_rate': 4.6500000000000005e-05, 'epoch': 1.12}


 23%|██▎       | 82/360 [03:30<11:44,  2.54s/it]

{'loss': 0.6853, 'learning_rate': 4.633333333333334e-05, 'epoch': 1.14}


 23%|██▎       | 83/360 [03:33<11:57,  2.59s/it]

{'loss': 0.6977, 'learning_rate': 4.616666666666667e-05, 'epoch': 1.15}


 23%|██▎       | 84/360 [03:36<11:58,  2.60s/it]

{'loss': 0.647, 'learning_rate': 4.600000000000001e-05, 'epoch': 1.17}


 24%|██▎       | 85/360 [03:38<11:53,  2.59s/it]

{'loss': 0.71, 'learning_rate': 4.5833333333333334e-05, 'epoch': 1.18}


 24%|██▍       | 86/360 [03:41<11:50,  2.59s/it]

{'loss': 0.7263, 'learning_rate': 4.566666666666667e-05, 'epoch': 1.19}


 24%|██▍       | 87/360 [03:43<11:44,  2.58s/it]

{'loss': 0.6467, 'learning_rate': 4.55e-05, 'epoch': 1.21}


 24%|██▍       | 88/360 [03:46<11:39,  2.57s/it]

{'loss': 0.6556, 'learning_rate': 4.5333333333333335e-05, 'epoch': 1.22}


 25%|██▍       | 89/360 [03:48<11:35,  2.57s/it]

{'loss': 0.656, 'learning_rate': 4.516666666666667e-05, 'epoch': 1.24}


 25%|██▌       | 90/360 [03:51<11:32,  2.56s/it]

{'loss': 0.6118, 'learning_rate': 4.5e-05, 'epoch': 1.25}


 25%|██▌       | 91/360 [03:53<11:26,  2.55s/it]

{'loss': 0.6154, 'learning_rate': 4.483333333333334e-05, 'epoch': 1.26}


 26%|██▌       | 92/360 [03:56<11:23,  2.55s/it]

{'loss': 0.6608, 'learning_rate': 4.466666666666667e-05, 'epoch': 1.28}


 26%|██▌       | 93/360 [03:59<11:20,  2.55s/it]

{'loss': 0.6736, 'learning_rate': 4.4500000000000004e-05, 'epoch': 1.29}


 26%|██▌       | 94/360 [04:01<11:18,  2.55s/it]

{'loss': 0.6408, 'learning_rate': 4.433333333333334e-05, 'epoch': 1.31}


 26%|██▋       | 95/360 [04:04<11:17,  2.56s/it]

{'loss': 0.6053, 'learning_rate': 4.416666666666667e-05, 'epoch': 1.32}


 27%|██▋       | 96/360 [04:06<11:13,  2.55s/it]

{'loss': 0.6113, 'learning_rate': 4.4e-05, 'epoch': 1.33}


 27%|██▋       | 97/360 [04:09<11:16,  2.57s/it]

{'loss': 0.6545, 'learning_rate': 4.383333333333333e-05, 'epoch': 1.35}


 27%|██▋       | 98/360 [04:11<11:09,  2.56s/it]

{'loss': 0.5683, 'learning_rate': 4.3666666666666666e-05, 'epoch': 1.36}


 28%|██▊       | 99/360 [04:14<11:05,  2.55s/it]

{'loss': 0.6364, 'learning_rate': 4.35e-05, 'epoch': 1.38}


 28%|██▊       | 100/360 [04:16<11:01,  2.55s/it]

{'loss': 0.5398, 'learning_rate': 4.3333333333333334e-05, 'epoch': 1.39}


 28%|██▊       | 101/360 [04:19<11:01,  2.56s/it]

{'loss': 0.5727, 'learning_rate': 4.316666666666667e-05, 'epoch': 1.4}


 28%|██▊       | 102/360 [04:22<10:58,  2.55s/it]

{'loss': 0.6834, 'learning_rate': 4.3e-05, 'epoch': 1.42}


 29%|██▊       | 103/360 [04:24<10:55,  2.55s/it]

{'loss': 0.7945, 'learning_rate': 4.2833333333333335e-05, 'epoch': 1.43}


 29%|██▉       | 104/360 [04:27<10:51,  2.54s/it]

{'loss': 0.5433, 'learning_rate': 4.266666666666667e-05, 'epoch': 1.44}


 29%|██▉       | 105/360 [04:29<10:47,  2.54s/it]

{'loss': 0.583, 'learning_rate': 4.25e-05, 'epoch': 1.46}


 29%|██▉       | 106/360 [04:32<10:48,  2.55s/it]

{'loss': 0.5931, 'learning_rate': 4.233333333333334e-05, 'epoch': 1.47}


 30%|██▉       | 107/360 [04:34<10:43,  2.55s/it]

{'loss': 0.8193, 'learning_rate': 4.2166666666666664e-05, 'epoch': 1.49}


 30%|███       | 108/360 [04:37<10:41,  2.54s/it]

{'loss': 0.5679, 'learning_rate': 4.2e-05, 'epoch': 1.5}


 30%|███       | 109/360 [04:39<10:36,  2.54s/it]

{'loss': 0.6355, 'learning_rate': 4.183333333333333e-05, 'epoch': 1.51}


 31%|███       | 110/360 [04:42<10:32,  2.53s/it]

{'loss': 0.5363, 'learning_rate': 4.1666666666666665e-05, 'epoch': 1.53}


 31%|███       | 111/360 [04:44<10:29,  2.53s/it]

{'loss': 0.6493, 'learning_rate': 4.15e-05, 'epoch': 1.54}


 31%|███       | 112/360 [04:47<10:25,  2.52s/it]

{'loss': 0.5978, 'learning_rate': 4.133333333333333e-05, 'epoch': 1.56}


 31%|███▏      | 113/360 [04:49<10:22,  2.52s/it]

{'loss': 0.6434, 'learning_rate': 4.116666666666667e-05, 'epoch': 1.57}


 32%|███▏      | 114/360 [04:52<10:19,  2.52s/it]

{'loss': 0.5878, 'learning_rate': 4.1e-05, 'epoch': 1.58}


 32%|███▏      | 115/360 [04:54<10:18,  2.52s/it]

{'loss': 0.553, 'learning_rate': 4.0833333333333334e-05, 'epoch': 1.6}


 32%|███▏      | 116/360 [04:57<10:16,  2.53s/it]

{'loss': 0.5434, 'learning_rate': 4.066666666666667e-05, 'epoch': 1.61}


 32%|███▎      | 117/360 [04:59<10:14,  2.53s/it]

{'loss': 0.5956, 'learning_rate': 4.05e-05, 'epoch': 1.62}


 33%|███▎      | 118/360 [05:02<10:12,  2.53s/it]

{'loss': 0.5107, 'learning_rate': 4.0333333333333336e-05, 'epoch': 1.64}


 33%|███▎      | 119/360 [05:05<10:09,  2.53s/it]

{'loss': 0.5949, 'learning_rate': 4.016666666666666e-05, 'epoch': 1.65}


 33%|███▎      | 120/360 [05:07<10:07,  2.53s/it]

{'loss': 0.6699, 'learning_rate': 3.9999999999999996e-05, 'epoch': 1.67}


 34%|███▎      | 121/360 [05:10<10:05,  2.53s/it]

{'loss': 0.5308, 'learning_rate': 3.983333333333333e-05, 'epoch': 1.68}


 34%|███▍      | 122/360 [05:12<10:02,  2.53s/it]

{'loss': 0.5151, 'learning_rate': 3.9666666666666664e-05, 'epoch': 1.69}


 34%|███▍      | 123/360 [05:15<09:57,  2.52s/it]

{'loss': 0.5422, 'learning_rate': 3.95e-05, 'epoch': 1.71}


 34%|███▍      | 124/360 [05:17<09:54,  2.52s/it]

{'loss': 0.5721, 'learning_rate': 3.933333333333333e-05, 'epoch': 1.72}


 35%|███▍      | 125/360 [05:20<09:51,  2.52s/it]

{'loss': 0.5298, 'learning_rate': 3.9166666666666665e-05, 'epoch': 1.74}


 35%|███▌      | 126/360 [05:22<09:48,  2.51s/it]

{'loss': 0.7369, 'learning_rate': 3.9e-05, 'epoch': 1.75}


 35%|███▌      | 127/360 [05:25<09:48,  2.53s/it]

{'loss': 0.5441, 'learning_rate': 3.883333333333333e-05, 'epoch': 1.76}


 36%|███▌      | 128/360 [05:27<09:45,  2.52s/it]

{'loss': 0.5615, 'learning_rate': 3.866666666666667e-05, 'epoch': 1.78}


 36%|███▌      | 129/360 [05:30<09:42,  2.52s/it]

{'loss': 0.611, 'learning_rate': 3.850000000000001e-05, 'epoch': 1.79}


 36%|███▌      | 130/360 [05:32<09:39,  2.52s/it]

{'loss': 0.6293, 'learning_rate': 3.8333333333333334e-05, 'epoch': 1.81}


 36%|███▋      | 131/360 [05:35<09:36,  2.52s/it]

{'loss': 0.4808, 'learning_rate': 3.816666666666667e-05, 'epoch': 1.82}


 37%|███▋      | 132/360 [05:37<09:34,  2.52s/it]

{'loss': 0.5696, 'learning_rate': 3.8e-05, 'epoch': 1.83}


 37%|███▋      | 133/360 [05:40<09:31,  2.52s/it]

{'loss': 0.4826, 'learning_rate': 3.7833333333333336e-05, 'epoch': 1.85}


 37%|███▋      | 134/360 [05:42<09:28,  2.52s/it]

{'loss': 0.625, 'learning_rate': 3.766666666666667e-05, 'epoch': 1.86}


 38%|███▊      | 135/360 [05:45<09:26,  2.52s/it]

{'loss': 0.4775, 'learning_rate': 3.7500000000000003e-05, 'epoch': 1.88}


 38%|███▊      | 136/360 [05:47<09:24,  2.52s/it]

{'loss': 0.5696, 'learning_rate': 3.733333333333334e-05, 'epoch': 1.89}


 38%|███▊      | 137/360 [05:50<09:22,  2.52s/it]

{'loss': 0.5248, 'learning_rate': 3.716666666666667e-05, 'epoch': 1.9}


 38%|███▊      | 138/360 [05:52<09:19,  2.52s/it]

{'loss': 0.5002, 'learning_rate': 3.7000000000000005e-05, 'epoch': 1.92}


 39%|███▊      | 139/360 [05:55<09:16,  2.52s/it]

{'loss': 0.5868, 'learning_rate': 3.683333333333334e-05, 'epoch': 1.93}


 39%|███▉      | 140/360 [05:57<09:15,  2.52s/it]

{'loss': 0.5173, 'learning_rate': 3.666666666666667e-05, 'epoch': 1.94}


 39%|███▉      | 141/360 [06:00<09:13,  2.53s/it]

{'loss': 0.477, 'learning_rate': 3.65e-05, 'epoch': 1.96}


 39%|███▉      | 142/360 [06:03<09:09,  2.52s/it]

{'loss': 0.4974, 'learning_rate': 3.633333333333333e-05, 'epoch': 1.97}


 40%|███▉      | 143/360 [06:05<08:38,  2.39s/it]

{'loss': 0.5034, 'learning_rate': 3.616666666666667e-05, 'epoch': 1.99}


 40%|████      | 144/360 [06:05<06:48,  1.89s/it]

{'loss': 0.4427, 'learning_rate': 3.6e-05, 'epoch': 2.0}


 40%|████      | 145/360 [06:09<08:10,  2.28s/it]

{'loss': 0.4963, 'learning_rate': 3.5833333333333335e-05, 'epoch': 2.01}


 41%|████      | 146/360 [06:11<08:23,  2.35s/it]

{'loss': 0.4895, 'learning_rate': 3.566666666666667e-05, 'epoch': 2.03}


 41%|████      | 147/360 [06:14<08:32,  2.40s/it]

{'loss': 0.4664, 'learning_rate': 3.55e-05, 'epoch': 2.04}


 41%|████      | 148/360 [06:16<08:37,  2.44s/it]

{'loss': 0.4764, 'learning_rate': 3.5333333333333336e-05, 'epoch': 2.06}


 41%|████▏     | 149/360 [06:19<08:39,  2.46s/it]

{'loss': 0.5787, 'learning_rate': 3.516666666666667e-05, 'epoch': 2.07}


 42%|████▏     | 150/360 [06:21<08:41,  2.48s/it]

{'loss': 0.5609, 'learning_rate': 3.5000000000000004e-05, 'epoch': 2.08}


 42%|████▏     | 151/360 [06:24<08:40,  2.49s/it]

{'loss': 0.5033, 'learning_rate': 3.483333333333334e-05, 'epoch': 2.1}


 42%|████▏     | 152/360 [06:26<08:41,  2.51s/it]

{'loss': 0.5371, 'learning_rate': 3.4666666666666665e-05, 'epoch': 2.11}


 42%|████▎     | 153/360 [06:29<08:41,  2.52s/it]

{'loss': 0.5345, 'learning_rate': 3.45e-05, 'epoch': 2.12}


 43%|████▎     | 154/360 [06:31<08:39,  2.52s/it]

{'loss': 0.4427, 'learning_rate': 3.433333333333333e-05, 'epoch': 2.14}


 43%|████▎     | 155/360 [06:34<08:36,  2.52s/it]

{'loss': 0.4406, 'learning_rate': 3.4166666666666666e-05, 'epoch': 2.15}


 43%|████▎     | 156/360 [06:36<08:35,  2.53s/it]

{'loss': 0.5291, 'learning_rate': 3.4e-05, 'epoch': 2.17}


 44%|████▎     | 157/360 [06:39<08:32,  2.53s/it]

{'loss': 0.5361, 'learning_rate': 3.3833333333333334e-05, 'epoch': 2.18}


 44%|████▍     | 158/360 [06:41<08:30,  2.53s/it]

{'loss': 0.5205, 'learning_rate': 3.366666666666667e-05, 'epoch': 2.19}


 44%|████▍     | 159/360 [06:44<08:26,  2.52s/it]

{'loss': 0.4451, 'learning_rate': 3.35e-05, 'epoch': 2.21}


 44%|████▍     | 160/360 [06:46<08:24,  2.52s/it]

{'loss': 0.526, 'learning_rate': 3.3333333333333335e-05, 'epoch': 2.22}


 45%|████▍     | 161/360 [06:49<08:21,  2.52s/it]

{'loss': 0.6428, 'learning_rate': 3.316666666666667e-05, 'epoch': 2.24}


 45%|████▌     | 162/360 [06:51<08:18,  2.52s/it]

{'loss': 0.4877, 'learning_rate': 3.3e-05, 'epoch': 2.25}


 45%|████▌     | 163/360 [06:54<08:16,  2.52s/it]

{'loss': 0.4292, 'learning_rate': 3.2833333333333336e-05, 'epoch': 2.26}


 46%|████▌     | 164/360 [06:56<08:13,  2.52s/it]

{'loss': 0.5124, 'learning_rate': 3.266666666666666e-05, 'epoch': 2.28}


 46%|████▌     | 165/360 [06:59<08:10,  2.52s/it]

{'loss': 0.4258, 'learning_rate': 3.25e-05, 'epoch': 2.29}


 46%|████▌     | 166/360 [07:02<08:08,  2.52s/it]

{'loss': 0.4356, 'learning_rate': 3.233333333333333e-05, 'epoch': 2.31}


 46%|████▋     | 167/360 [07:04<08:05,  2.52s/it]

{'loss': 0.4407, 'learning_rate': 3.2166666666666665e-05, 'epoch': 2.32}


 47%|████▋     | 168/360 [07:07<08:03,  2.52s/it]

{'loss': 0.5501, 'learning_rate': 3.2e-05, 'epoch': 2.33}


 47%|████▋     | 169/360 [07:09<08:00,  2.52s/it]

{'loss': 0.4587, 'learning_rate': 3.183333333333333e-05, 'epoch': 2.35}


 47%|████▋     | 170/360 [07:12<07:58,  2.52s/it]

{'loss': 0.4811, 'learning_rate': 3.1666666666666666e-05, 'epoch': 2.36}


 48%|████▊     | 171/360 [07:14<07:55,  2.52s/it]

{'loss': 0.4155, 'learning_rate': 3.15e-05, 'epoch': 2.38}


 48%|████▊     | 172/360 [07:17<07:52,  2.52s/it]

{'loss': 0.5149, 'learning_rate': 3.1333333333333334e-05, 'epoch': 2.39}


 48%|████▊     | 173/360 [07:19<07:50,  2.52s/it]

{'loss': 0.4531, 'learning_rate': 3.116666666666667e-05, 'epoch': 2.4}


 48%|████▊     | 174/360 [07:22<07:48,  2.52s/it]

{'loss': 0.561, 'learning_rate': 3.1e-05, 'epoch': 2.42}


 49%|████▊     | 175/360 [07:24<07:46,  2.52s/it]

{'loss': 0.4824, 'learning_rate': 3.083333333333333e-05, 'epoch': 2.43}


 49%|████▉     | 176/360 [07:27<07:43,  2.52s/it]

{'loss': 0.4176, 'learning_rate': 3.066666666666666e-05, 'epoch': 2.44}


 49%|████▉     | 177/360 [07:29<07:41,  2.52s/it]

{'loss': 0.4784, 'learning_rate': 3.05e-05, 'epoch': 2.46}


 49%|████▉     | 178/360 [07:32<07:39,  2.53s/it]

{'loss': 0.4232, 'learning_rate': 3.0333333333333333e-05, 'epoch': 2.47}


 50%|████▉     | 179/360 [07:34<07:36,  2.52s/it]

{'loss': 0.4345, 'learning_rate': 3.0166666666666667e-05, 'epoch': 2.49}


 50%|█████     | 180/360 [07:37<07:34,  2.53s/it]

{'loss': 0.5011, 'learning_rate': 3e-05, 'epoch': 2.5}


 50%|█████     | 181/360 [07:39<07:32,  2.53s/it]

{'loss': 0.4141, 'learning_rate': 2.9833333333333335e-05, 'epoch': 2.51}


 51%|█████     | 182/360 [07:42<07:30,  2.53s/it]

{'loss': 0.439, 'learning_rate': 2.966666666666667e-05, 'epoch': 2.53}


 51%|█████     | 183/360 [07:44<07:27,  2.53s/it]

{'loss': 0.4602, 'learning_rate': 2.95e-05, 'epoch': 2.54}


 51%|█████     | 184/360 [07:47<07:24,  2.53s/it]

{'loss': 0.4067, 'learning_rate': 2.9333333333333333e-05, 'epoch': 2.56}


 51%|█████▏    | 185/360 [07:49<07:22,  2.53s/it]

{'loss': 0.3831, 'learning_rate': 2.9166666666666666e-05, 'epoch': 2.57}


 52%|█████▏    | 186/360 [07:52<07:20,  2.53s/it]

{'loss': 0.4672, 'learning_rate': 2.9e-05, 'epoch': 2.58}


 52%|█████▏    | 187/360 [07:54<07:16,  2.52s/it]

{'loss': 0.4481, 'learning_rate': 2.8833333333333334e-05, 'epoch': 2.6}


 52%|█████▏    | 188/360 [07:57<07:14,  2.52s/it]

{'loss': 0.4296, 'learning_rate': 2.8666666666666668e-05, 'epoch': 2.61}


 52%|█████▎    | 189/360 [08:00<07:11,  2.52s/it]

{'loss': 0.597, 'learning_rate': 2.8499999999999998e-05, 'epoch': 2.62}


 53%|█████▎    | 190/360 [08:02<07:09,  2.53s/it]

{'loss': 0.5266, 'learning_rate': 2.8333333333333332e-05, 'epoch': 2.64}


 53%|█████▎    | 191/360 [08:05<07:06,  2.53s/it]

{'loss': 0.4176, 'learning_rate': 2.8166666666666666e-05, 'epoch': 2.65}


 53%|█████▎    | 192/360 [08:07<07:05,  2.53s/it]

{'loss': 0.403, 'learning_rate': 2.8e-05, 'epoch': 2.67}


 54%|█████▎    | 193/360 [08:10<07:01,  2.52s/it]

{'loss': 0.387, 'learning_rate': 2.7833333333333337e-05, 'epoch': 2.68}


 54%|█████▍    | 194/360 [08:12<06:59,  2.53s/it]

{'loss': 0.3866, 'learning_rate': 2.766666666666667e-05, 'epoch': 2.69}


 54%|█████▍    | 195/360 [08:15<06:55,  2.52s/it]

{'loss': 0.4021, 'learning_rate': 2.75e-05, 'epoch': 2.71}


 54%|█████▍    | 196/360 [08:17<06:53,  2.52s/it]

{'loss': 0.4565, 'learning_rate': 2.7333333333333335e-05, 'epoch': 2.72}


 55%|█████▍    | 197/360 [08:20<06:51,  2.52s/it]

{'loss': 0.3525, 'learning_rate': 2.716666666666667e-05, 'epoch': 2.74}


 55%|█████▌    | 198/360 [08:22<06:48,  2.52s/it]

{'loss': 0.4617, 'learning_rate': 2.7000000000000002e-05, 'epoch': 2.75}


 55%|█████▌    | 199/360 [08:25<06:46,  2.53s/it]

{'loss': 0.4438, 'learning_rate': 2.6833333333333336e-05, 'epoch': 2.76}


 56%|█████▌    | 200/360 [08:27<06:44,  2.53s/it]

{'loss': 0.3533, 'learning_rate': 2.6666666666666667e-05, 'epoch': 2.78}


Trainer is attempting to log a value of "[0.0, 0.9876038475359412, 0.5611103196607234, 0.375262675086216]" of type <class 'list'> for key "eval/per_category_iou" as a scalar. This invocation of Tensorboard's writer.add_scalar() is incorrect so we dropped this attribute.
Trainer is attempting to log a value of "[0.0, 0.9959291315889102, 0.7076758288271168, 0.4679557247168881]" of type <class 'list'> for key "eval/per_category_accuracy" as a scalar. This invocation of Tensorboard's writer.add_scalar() is incorrect so we dropped this attribute.
                                                 
 56%|█████▌    | 200/360 [11:35<06:44,  2.53s/it]

{'eval_loss': 0.3531736135482788, 'eval_mean_iou': 0.48099421057072017, 'eval_mean_accuracy': 0.5428901712832288, 'eval_overall_accuracy': 0.9869859364111099, 'eval_per_category_iou': [0.0, 0.9876038475359412, 0.5611103196607234, 0.375262675086216], 'eval_per_category_accuracy': [0.0, 0.9959291315889102, 0.7076758288271168, 0.4679557247168881], 'eval_runtime': 187.605, 'eval_samples_per_second': 1.135, 'eval_steps_per_second': 0.192, 'epoch': 2.78}


 56%|█████▌    | 201/360 [11:38<2:35:57, 58.85s/it]

{'loss': 0.4615, 'learning_rate': 2.65e-05, 'epoch': 2.79}


 56%|█████▌    | 202/360 [11:40<1:50:29, 41.96s/it]

{'loss': 0.3669, 'learning_rate': 2.6333333333333334e-05, 'epoch': 2.81}


 56%|█████▋    | 203/360 [11:43<1:18:51, 30.13s/it]

{'loss': 0.3933, 'learning_rate': 2.6166666666666668e-05, 'epoch': 2.82}


 57%|█████▋    | 204/360 [11:45<56:50, 21.86s/it]  

{'loss': 0.4714, 'learning_rate': 2.6000000000000002e-05, 'epoch': 2.83}


 57%|█████▋    | 205/360 [11:48<41:30, 16.07s/it]

{'loss': 0.4007, 'learning_rate': 2.5833333333333336e-05, 'epoch': 2.85}


 57%|█████▋    | 206/360 [11:50<30:48, 12.00s/it]

{'loss': 0.4073, 'learning_rate': 2.5666666666666666e-05, 'epoch': 2.86}


 57%|█████▊    | 207/360 [11:53<23:22,  9.17s/it]

{'loss': 0.3713, 'learning_rate': 2.55e-05, 'epoch': 2.88}


 58%|█████▊    | 208/360 [11:55<18:12,  7.19s/it]

{'loss': 0.4241, 'learning_rate': 2.5333333333333334e-05, 'epoch': 2.89}


 58%|█████▊    | 209/360 [11:58<14:34,  5.79s/it]

{'loss': 0.4174, 'learning_rate': 2.5166666666666667e-05, 'epoch': 2.9}


 58%|█████▊    | 210/360 [12:01<12:02,  4.82s/it]

{'loss': 0.4042, 'learning_rate': 2.5e-05, 'epoch': 2.92}


 59%|█████▊    | 211/360 [12:03<10:15,  4.13s/it]

{'loss': 0.3795, 'learning_rate': 2.483333333333333e-05, 'epoch': 2.93}


 59%|█████▉    | 212/360 [12:06<09:00,  3.65s/it]

{'loss': 0.4317, 'learning_rate': 2.4666666666666665e-05, 'epoch': 2.94}


 59%|█████▉    | 213/360 [12:08<08:11,  3.35s/it]

{'loss': 0.434, 'learning_rate': 2.45e-05, 'epoch': 2.96}


 59%|█████▉    | 214/360 [12:11<07:37,  3.14s/it]

{'loss': 0.35, 'learning_rate': 2.4333333333333333e-05, 'epoch': 2.97}


 60%|█████▉    | 215/360 [12:13<06:50,  2.83s/it]

{'loss': 0.4468, 'learning_rate': 2.4166666666666667e-05, 'epoch': 2.99}


 60%|██████    | 216/360 [12:14<05:17,  2.20s/it]

{'loss': 0.5848, 'learning_rate': 2.4e-05, 'epoch': 3.0}


 60%|██████    | 217/360 [12:17<06:00,  2.52s/it]

{'loss': 0.5013, 'learning_rate': 2.383333333333333e-05, 'epoch': 3.01}


 61%|██████    | 218/360 [12:20<05:59,  2.53s/it]

{'loss': 0.5271, 'learning_rate': 2.3666666666666665e-05, 'epoch': 3.03}


 61%|██████    | 219/360 [12:22<05:57,  2.54s/it]

{'loss': 0.4172, 'learning_rate': 2.3500000000000002e-05, 'epoch': 3.04}


 61%|██████    | 220/360 [12:25<05:56,  2.55s/it]

{'loss': 0.4796, 'learning_rate': 2.3333333333333336e-05, 'epoch': 3.06}


 61%|██████▏   | 221/360 [12:27<05:54,  2.55s/it]

{'loss': 0.5309, 'learning_rate': 2.316666666666667e-05, 'epoch': 3.07}


 62%|██████▏   | 222/360 [12:30<05:51,  2.55s/it]

{'loss': 0.5292, 'learning_rate': 2.3000000000000003e-05, 'epoch': 3.08}


 62%|██████▏   | 223/360 [12:32<05:48,  2.54s/it]

{'loss': 0.3813, 'learning_rate': 2.2833333333333334e-05, 'epoch': 3.1}


 62%|██████▏   | 224/360 [12:35<05:47,  2.55s/it]

{'loss': 0.5434, 'learning_rate': 2.2666666666666668e-05, 'epoch': 3.11}


 62%|██████▎   | 225/360 [12:37<05:45,  2.56s/it]

{'loss': 0.5949, 'learning_rate': 2.25e-05, 'epoch': 3.12}


 63%|██████▎   | 226/360 [12:40<05:42,  2.56s/it]

{'loss': 0.51, 'learning_rate': 2.2333333333333335e-05, 'epoch': 3.14}


 63%|██████▎   | 227/360 [12:43<05:40,  2.56s/it]

{'loss': 0.449, 'learning_rate': 2.216666666666667e-05, 'epoch': 3.15}


 63%|██████▎   | 228/360 [12:45<05:37,  2.56s/it]

{'loss': 0.4854, 'learning_rate': 2.2e-05, 'epoch': 3.17}


 64%|██████▎   | 229/360 [12:48<05:36,  2.57s/it]

{'loss': 0.3965, 'learning_rate': 2.1833333333333333e-05, 'epoch': 3.18}


 64%|██████▍   | 230/360 [12:50<05:34,  2.57s/it]

{'loss': 0.5778, 'learning_rate': 2.1666666666666667e-05, 'epoch': 3.19}


 64%|██████▍   | 231/360 [12:53<05:33,  2.59s/it]

{'loss': 0.501, 'learning_rate': 2.15e-05, 'epoch': 3.21}


 64%|██████▍   | 232/360 [12:55<05:28,  2.57s/it]

{'loss': 0.4052, 'learning_rate': 2.1333333333333335e-05, 'epoch': 3.22}


 65%|██████▍   | 233/360 [12:58<05:26,  2.57s/it]

{'loss': 0.441, 'learning_rate': 2.116666666666667e-05, 'epoch': 3.24}


 65%|██████▌   | 234/360 [13:01<05:23,  2.56s/it]

{'loss': 0.4348, 'learning_rate': 2.1e-05, 'epoch': 3.25}


 65%|██████▌   | 235/360 [13:03<05:19,  2.56s/it]

{'loss': 0.3741, 'learning_rate': 2.0833333333333333e-05, 'epoch': 3.26}


 66%|██████▌   | 236/360 [13:06<05:17,  2.56s/it]

{'loss': 0.331, 'learning_rate': 2.0666666666666666e-05, 'epoch': 3.28}


 66%|██████▌   | 237/360 [13:08<05:17,  2.58s/it]

{'loss': 0.432, 'learning_rate': 2.05e-05, 'epoch': 3.29}


 66%|██████▌   | 238/360 [13:11<05:14,  2.58s/it]

{'loss': 0.3451, 'learning_rate': 2.0333333333333334e-05, 'epoch': 3.31}


 66%|██████▋   | 239/360 [13:13<05:09,  2.56s/it]

{'loss': 0.4992, 'learning_rate': 2.0166666666666668e-05, 'epoch': 3.32}


 67%|██████▋   | 240/360 [13:16<05:04,  2.54s/it]

{'loss': 0.4867, 'learning_rate': 1.9999999999999998e-05, 'epoch': 3.33}


 67%|██████▋   | 241/360 [13:18<05:00,  2.53s/it]

{'loss': 0.3687, 'learning_rate': 1.9833333333333332e-05, 'epoch': 3.35}


 67%|██████▋   | 242/360 [13:21<04:59,  2.54s/it]

{'loss': 0.3849, 'learning_rate': 1.9666666666666666e-05, 'epoch': 3.36}


 68%|██████▊   | 243/360 [13:23<04:56,  2.53s/it]

{'loss': 0.4273, 'learning_rate': 1.95e-05, 'epoch': 3.38}


 68%|██████▊   | 244/360 [13:26<04:53,  2.53s/it]

{'loss': 0.3002, 'learning_rate': 1.9333333333333333e-05, 'epoch': 3.39}


 68%|██████▊   | 245/360 [13:28<04:49,  2.52s/it]

{'loss': 0.4006, 'learning_rate': 1.9166666666666667e-05, 'epoch': 3.4}


 68%|██████▊   | 246/360 [13:31<04:46,  2.51s/it]

{'loss': 0.3356, 'learning_rate': 1.9e-05, 'epoch': 3.42}


 69%|██████▊   | 247/360 [13:34<04:47,  2.54s/it]

{'loss': 0.3169, 'learning_rate': 1.8833333333333335e-05, 'epoch': 3.43}


 69%|██████▉   | 248/360 [13:36<04:45,  2.55s/it]

{'loss': 0.4213, 'learning_rate': 1.866666666666667e-05, 'epoch': 3.44}


 69%|██████▉   | 249/360 [13:39<04:42,  2.55s/it]

{'loss': 0.5548, 'learning_rate': 1.8500000000000002e-05, 'epoch': 3.46}


 69%|██████▉   | 250/360 [13:41<04:42,  2.57s/it]

{'loss': 0.4049, 'learning_rate': 1.8333333333333336e-05, 'epoch': 3.47}


 70%|██████▉   | 251/360 [13:44<04:45,  2.62s/it]

{'loss': 0.5367, 'learning_rate': 1.8166666666666667e-05, 'epoch': 3.49}


 70%|███████   | 252/360 [13:47<04:40,  2.59s/it]

{'loss': 0.3704, 'learning_rate': 1.8e-05, 'epoch': 3.5}


 70%|███████   | 253/360 [13:49<04:35,  2.58s/it]

{'loss': 0.3506, 'learning_rate': 1.7833333333333334e-05, 'epoch': 3.51}


 71%|███████   | 254/360 [13:52<04:33,  2.58s/it]

{'loss': 0.4233, 'learning_rate': 1.7666666666666668e-05, 'epoch': 3.53}


 71%|███████   | 255/360 [13:54<04:29,  2.57s/it]

{'loss': 0.3969, 'learning_rate': 1.7500000000000002e-05, 'epoch': 3.54}


 71%|███████   | 256/360 [13:57<04:23,  2.53s/it]

{'loss': 0.3942, 'learning_rate': 1.7333333333333332e-05, 'epoch': 3.56}


 71%|███████▏  | 257/360 [13:59<04:17,  2.50s/it]

{'loss': 0.3508, 'learning_rate': 1.7166666666666666e-05, 'epoch': 3.57}


 72%|███████▏  | 258/360 [14:02<04:12,  2.48s/it]

{'loss': 0.3444, 'learning_rate': 1.7e-05, 'epoch': 3.58}


 72%|███████▏  | 259/360 [14:04<04:09,  2.47s/it]

{'loss': 0.4097, 'learning_rate': 1.6833333333333334e-05, 'epoch': 3.6}


 72%|███████▏  | 260/360 [14:06<04:08,  2.48s/it]

{'loss': 0.5753, 'learning_rate': 1.6666666666666667e-05, 'epoch': 3.61}


 72%|███████▎  | 261/360 [14:09<04:08,  2.51s/it]

{'loss': 0.3119, 'learning_rate': 1.65e-05, 'epoch': 3.62}


 73%|███████▎  | 262/360 [14:12<04:06,  2.51s/it]

{'loss': 0.3704, 'learning_rate': 1.633333333333333e-05, 'epoch': 3.64}


 73%|███████▎  | 263/360 [14:14<04:03,  2.51s/it]

{'loss': 0.3683, 'learning_rate': 1.6166666666666665e-05, 'epoch': 3.65}


 73%|███████▎  | 264/360 [14:17<04:02,  2.52s/it]

{'loss': 0.3654, 'learning_rate': 1.6e-05, 'epoch': 3.67}


 74%|███████▎  | 265/360 [14:19<04:01,  2.54s/it]

{'loss': 0.3262, 'learning_rate': 1.5833333333333333e-05, 'epoch': 3.68}


 74%|███████▍  | 266/360 [14:22<03:59,  2.54s/it]

{'loss': 0.3671, 'learning_rate': 1.5666666666666667e-05, 'epoch': 3.69}


 74%|███████▍  | 267/360 [14:24<03:56,  2.54s/it]

{'loss': 0.4183, 'learning_rate': 1.55e-05, 'epoch': 3.71}


 74%|███████▍  | 268/360 [14:27<03:55,  2.56s/it]

{'loss': 0.3652, 'learning_rate': 1.533333333333333e-05, 'epoch': 3.72}


 75%|███████▍  | 269/360 [14:29<03:51,  2.55s/it]

{'loss': 0.34, 'learning_rate': 1.5166666666666667e-05, 'epoch': 3.74}


 75%|███████▌  | 270/360 [14:32<03:49,  2.55s/it]

{'loss': 0.3087, 'learning_rate': 1.5e-05, 'epoch': 3.75}


 75%|███████▌  | 271/360 [14:35<03:46,  2.55s/it]

{'loss': 0.295, 'learning_rate': 1.4833333333333334e-05, 'epoch': 3.76}


 76%|███████▌  | 272/360 [14:37<03:43,  2.54s/it]

{'loss': 0.3126, 'learning_rate': 1.4666666666666666e-05, 'epoch': 3.78}


 76%|███████▌  | 273/360 [14:40<03:40,  2.54s/it]

{'loss': 0.3163, 'learning_rate': 1.45e-05, 'epoch': 3.79}


 76%|███████▌  | 274/360 [14:42<03:38,  2.53s/it]

{'loss': 0.3451, 'learning_rate': 1.4333333333333334e-05, 'epoch': 3.81}


 76%|███████▋  | 275/360 [14:45<03:35,  2.53s/it]

{'loss': 0.332, 'learning_rate': 1.4166666666666666e-05, 'epoch': 3.82}


 77%|███████▋  | 276/360 [14:47<03:32,  2.53s/it]

{'loss': 0.3683, 'learning_rate': 1.4e-05, 'epoch': 3.83}


 77%|███████▋  | 277/360 [14:50<03:30,  2.53s/it]

{'loss': 0.3529, 'learning_rate': 1.3833333333333335e-05, 'epoch': 3.85}


 77%|███████▋  | 278/360 [14:52<03:27,  2.53s/it]

{'loss': 0.3394, 'learning_rate': 1.3666666666666667e-05, 'epoch': 3.86}


 78%|███████▊  | 279/360 [14:55<03:25,  2.54s/it]

{'loss': 0.3748, 'learning_rate': 1.3500000000000001e-05, 'epoch': 3.88}


 78%|███████▊  | 280/360 [14:57<03:23,  2.55s/it]

{'loss': 0.3967, 'learning_rate': 1.3333333333333333e-05, 'epoch': 3.89}


 78%|███████▊  | 281/360 [15:00<03:22,  2.56s/it]

{'loss': 0.5054, 'learning_rate': 1.3166666666666667e-05, 'epoch': 3.9}


 78%|███████▊  | 282/360 [15:03<03:20,  2.57s/it]

{'loss': 0.4639, 'learning_rate': 1.3000000000000001e-05, 'epoch': 3.92}


 79%|███████▊  | 283/360 [15:05<03:17,  2.57s/it]

{'loss': 0.3198, 'learning_rate': 1.2833333333333333e-05, 'epoch': 3.93}


 79%|███████▉  | 284/360 [15:08<03:14,  2.56s/it]

{'loss': 0.348, 'learning_rate': 1.2666666666666667e-05, 'epoch': 3.94}


 79%|███████▉  | 285/360 [15:10<03:11,  2.55s/it]

{'loss': 0.3676, 'learning_rate': 1.25e-05, 'epoch': 3.96}


 79%|███████▉  | 286/360 [15:13<03:08,  2.55s/it]

{'loss': 0.4214, 'learning_rate': 1.2333333333333333e-05, 'epoch': 3.97}


 80%|███████▉  | 287/360 [15:15<02:56,  2.41s/it]

{'loss': 0.2942, 'learning_rate': 1.2166666666666667e-05, 'epoch': 3.99}


 80%|████████  | 288/360 [15:16<02:17,  1.91s/it]

{'loss': 0.3844, 'learning_rate': 1.2e-05, 'epoch': 4.0}


 80%|████████  | 289/360 [15:19<02:44,  2.31s/it]

{'loss': 0.3654, 'learning_rate': 1.1833333333333332e-05, 'epoch': 4.01}


 81%|████████  | 290/360 [15:21<02:46,  2.38s/it]

{'loss': 0.4545, 'learning_rate': 1.1666666666666668e-05, 'epoch': 4.03}


 81%|████████  | 291/360 [15:24<02:48,  2.44s/it]

{'loss': 0.3555, 'learning_rate': 1.1500000000000002e-05, 'epoch': 4.04}


 81%|████████  | 292/360 [15:26<02:47,  2.46s/it]

{'loss': 0.3828, 'learning_rate': 1.1333333333333334e-05, 'epoch': 4.06}


 81%|████████▏ | 293/360 [15:29<02:46,  2.48s/it]

{'loss': 0.3551, 'learning_rate': 1.1166666666666668e-05, 'epoch': 4.07}


 82%|████████▏ | 294/360 [15:31<02:44,  2.50s/it]

{'loss': 0.3307, 'learning_rate': 1.1e-05, 'epoch': 4.08}


 82%|████████▏ | 295/360 [15:34<02:43,  2.52s/it]

{'loss': 0.3258, 'learning_rate': 1.0833333333333334e-05, 'epoch': 4.1}


 82%|████████▏ | 296/360 [15:37<02:41,  2.52s/it]

{'loss': 0.3846, 'learning_rate': 1.0666666666666667e-05, 'epoch': 4.11}


 82%|████████▎ | 297/360 [15:39<02:38,  2.51s/it]

{'loss': 0.3214, 'learning_rate': 1.05e-05, 'epoch': 4.12}


 83%|████████▎ | 298/360 [15:42<02:37,  2.54s/it]

{'loss': 0.3372, 'learning_rate': 1.0333333333333333e-05, 'epoch': 4.14}


 83%|████████▎ | 299/360 [15:44<02:35,  2.54s/it]

{'loss': 0.3254, 'learning_rate': 1.0166666666666667e-05, 'epoch': 4.15}


 83%|████████▎ | 300/360 [15:47<02:32,  2.55s/it]

{'loss': 0.3081, 'learning_rate': 9.999999999999999e-06, 'epoch': 4.17}


 84%|████████▎ | 301/360 [15:49<02:30,  2.56s/it]

{'loss': 0.4135, 'learning_rate': 9.833333333333333e-06, 'epoch': 4.18}


 84%|████████▍ | 302/360 [15:52<02:28,  2.56s/it]

{'loss': 0.2894, 'learning_rate': 9.666666666666667e-06, 'epoch': 4.19}


 84%|████████▍ | 303/360 [15:54<02:25,  2.56s/it]

{'loss': 0.3226, 'learning_rate': 9.5e-06, 'epoch': 4.21}


 84%|████████▍ | 304/360 [15:57<02:22,  2.55s/it]

{'loss': 0.3052, 'learning_rate': 9.333333333333334e-06, 'epoch': 4.22}


 85%|████████▍ | 305/360 [16:00<02:19,  2.54s/it]

{'loss': 0.3583, 'learning_rate': 9.166666666666668e-06, 'epoch': 4.24}


 85%|████████▌ | 306/360 [16:02<02:17,  2.54s/it]

{'loss': 0.3382, 'learning_rate': 9e-06, 'epoch': 4.25}


 85%|████████▌ | 307/360 [16:05<02:14,  2.55s/it]

{'loss': 0.3437, 'learning_rate': 8.833333333333334e-06, 'epoch': 4.26}


 86%|████████▌ | 308/360 [16:07<02:12,  2.54s/it]

{'loss': 0.3139, 'learning_rate': 8.666666666666666e-06, 'epoch': 4.28}


 86%|████████▌ | 309/360 [16:10<02:09,  2.54s/it]

{'loss': 0.3159, 'learning_rate': 8.5e-06, 'epoch': 4.29}


 86%|████████▌ | 310/360 [16:12<02:06,  2.54s/it]

{'loss': 0.4305, 'learning_rate': 8.333333333333334e-06, 'epoch': 4.31}


 86%|████████▋ | 311/360 [16:15<02:03,  2.53s/it]

{'loss': 0.34, 'learning_rate': 8.166666666666666e-06, 'epoch': 4.32}


 87%|████████▋ | 312/360 [16:17<02:01,  2.53s/it]

{'loss': 0.2618, 'learning_rate': 8e-06, 'epoch': 4.33}


 87%|████████▋ | 313/360 [16:20<01:58,  2.52s/it]

{'loss': 0.2857, 'learning_rate': 7.833333333333333e-06, 'epoch': 4.35}


 87%|████████▋ | 314/360 [16:22<01:55,  2.52s/it]

{'loss': 0.3695, 'learning_rate': 7.666666666666666e-06, 'epoch': 4.36}


 88%|████████▊ | 315/360 [16:25<01:53,  2.52s/it]

{'loss': 0.3334, 'learning_rate': 7.5e-06, 'epoch': 4.38}


 88%|████████▊ | 316/360 [16:27<01:50,  2.52s/it]

{'loss': 0.336, 'learning_rate': 7.333333333333333e-06, 'epoch': 4.39}


 88%|████████▊ | 317/360 [16:30<01:48,  2.52s/it]

{'loss': 0.3022, 'learning_rate': 7.166666666666667e-06, 'epoch': 4.4}


 88%|████████▊ | 318/360 [16:32<01:45,  2.52s/it]

{'loss': 0.3262, 'learning_rate': 7e-06, 'epoch': 4.42}


 89%|████████▊ | 319/360 [16:35<01:43,  2.53s/it]

{'loss': 0.2516, 'learning_rate': 6.833333333333334e-06, 'epoch': 4.43}


 89%|████████▉ | 320/360 [16:37<01:41,  2.53s/it]

{'loss': 0.3417, 'learning_rate': 6.666666666666667e-06, 'epoch': 4.44}


 89%|████████▉ | 321/360 [16:40<01:38,  2.52s/it]

{'loss': 0.3277, 'learning_rate': 6.5000000000000004e-06, 'epoch': 4.46}


 89%|████████▉ | 322/360 [16:42<01:35,  2.52s/it]

{'loss': 0.3119, 'learning_rate': 6.333333333333333e-06, 'epoch': 4.47}


 90%|████████▉ | 323/360 [16:45<01:33,  2.52s/it]

{'loss': 0.321, 'learning_rate': 6.166666666666666e-06, 'epoch': 4.49}


 90%|█████████ | 324/360 [16:48<01:30,  2.53s/it]

{'loss': 0.3096, 'learning_rate': 6e-06, 'epoch': 4.5}


 90%|█████████ | 325/360 [16:50<01:28,  2.53s/it]

{'loss': 0.3111, 'learning_rate': 5.833333333333334e-06, 'epoch': 4.51}


 91%|█████████ | 326/360 [16:53<01:25,  2.53s/it]

{'loss': 0.3048, 'learning_rate': 5.666666666666667e-06, 'epoch': 4.53}


 91%|█████████ | 327/360 [16:55<01:23,  2.53s/it]

{'loss': 0.3594, 'learning_rate': 5.5e-06, 'epoch': 4.54}


 91%|█████████ | 328/360 [16:58<01:20,  2.52s/it]

{'loss': 0.3077, 'learning_rate': 5.333333333333334e-06, 'epoch': 4.56}


 91%|█████████▏| 329/360 [17:00<01:18,  2.52s/it]

{'loss': 0.3821, 'learning_rate': 5.166666666666667e-06, 'epoch': 4.57}


 92%|█████████▏| 330/360 [17:03<01:15,  2.52s/it]

{'loss': 0.3332, 'learning_rate': 4.9999999999999996e-06, 'epoch': 4.58}


 92%|█████████▏| 331/360 [17:05<01:13,  2.53s/it]

{'loss': 0.3296, 'learning_rate': 4.833333333333333e-06, 'epoch': 4.6}


 92%|█████████▏| 332/360 [17:08<01:10,  2.52s/it]

{'loss': 0.3029, 'learning_rate': 4.666666666666667e-06, 'epoch': 4.61}


 92%|█████████▎| 333/360 [17:10<01:08,  2.52s/it]

{'loss': 0.4271, 'learning_rate': 4.5e-06, 'epoch': 4.62}


 93%|█████████▎| 334/360 [17:13<01:06,  2.54s/it]

{'loss': 0.3622, 'learning_rate': 4.333333333333333e-06, 'epoch': 4.64}


 93%|█████████▎| 335/360 [17:15<01:03,  2.54s/it]

{'loss': 0.2965, 'learning_rate': 4.166666666666667e-06, 'epoch': 4.65}


 93%|█████████▎| 336/360 [17:18<01:02,  2.61s/it]

{'loss': 0.363, 'learning_rate': 4e-06, 'epoch': 4.67}


 94%|█████████▎| 337/360 [17:21<01:00,  2.62s/it]

{'loss': 0.32, 'learning_rate': 3.833333333333333e-06, 'epoch': 4.68}


 94%|█████████▍| 338/360 [17:23<00:58,  2.64s/it]

{'loss': 0.3265, 'learning_rate': 3.6666666666666666e-06, 'epoch': 4.69}


 94%|█████████▍| 339/360 [17:26<00:55,  2.63s/it]

{'loss': 0.2863, 'learning_rate': 3.5e-06, 'epoch': 4.71}


 94%|█████████▍| 340/360 [17:29<00:52,  2.61s/it]

{'loss': 0.3229, 'learning_rate': 3.3333333333333333e-06, 'epoch': 4.72}


 95%|█████████▍| 341/360 [17:31<00:49,  2.59s/it]

{'loss': 0.279, 'learning_rate': 3.1666666666666667e-06, 'epoch': 4.74}


 95%|█████████▌| 342/360 [17:34<00:46,  2.59s/it]

{'loss': 0.286, 'learning_rate': 3e-06, 'epoch': 4.75}


 95%|█████████▌| 343/360 [17:36<00:43,  2.57s/it]

{'loss': 0.3106, 'learning_rate': 2.8333333333333335e-06, 'epoch': 4.76}


 96%|█████████▌| 344/360 [17:39<00:41,  2.60s/it]

{'loss': 0.3023, 'learning_rate': 2.666666666666667e-06, 'epoch': 4.78}


 96%|█████████▌| 345/360 [17:42<00:38,  2.59s/it]

{'loss': 0.2554, 'learning_rate': 2.4999999999999998e-06, 'epoch': 4.79}


 96%|█████████▌| 346/360 [17:44<00:36,  2.61s/it]

{'loss': 0.3451, 'learning_rate': 2.3333333333333336e-06, 'epoch': 4.81}


 96%|█████████▋| 347/360 [17:47<00:33,  2.59s/it]

{'loss': 0.5203, 'learning_rate': 2.1666666666666665e-06, 'epoch': 4.82}


 97%|█████████▋| 348/360 [17:49<00:31,  2.58s/it]

{'loss': 0.3, 'learning_rate': 2e-06, 'epoch': 4.83}


 97%|█████████▋| 349/360 [17:52<00:28,  2.59s/it]

{'loss': 0.3329, 'learning_rate': 1.8333333333333333e-06, 'epoch': 4.85}


 97%|█████████▋| 350/360 [17:55<00:26,  2.65s/it]

{'loss': 0.3301, 'learning_rate': 1.6666666666666667e-06, 'epoch': 4.86}


 98%|█████████▊| 351/360 [17:57<00:23,  2.64s/it]

{'loss': 0.2826, 'learning_rate': 1.5e-06, 'epoch': 4.88}


 98%|█████████▊| 352/360 [18:00<00:21,  2.66s/it]

{'loss': 0.3416, 'learning_rate': 1.3333333333333334e-06, 'epoch': 4.89}


 98%|█████████▊| 353/360 [18:03<00:18,  2.64s/it]

{'loss': 0.2997, 'learning_rate': 1.1666666666666668e-06, 'epoch': 4.9}


 98%|█████████▊| 354/360 [18:05<00:15,  2.62s/it]

{'loss': 0.2873, 'learning_rate': 1e-06, 'epoch': 4.92}


 99%|█████████▊| 355/360 [18:08<00:13,  2.60s/it]

{'loss': 0.2609, 'learning_rate': 8.333333333333333e-07, 'epoch': 4.93}


 99%|█████████▉| 356/360 [18:11<00:10,  2.65s/it]

{'loss': 0.3978, 'learning_rate': 6.666666666666667e-07, 'epoch': 4.94}


 99%|█████████▉| 357/360 [18:13<00:07,  2.62s/it]

{'loss': 0.367, 'learning_rate': 5e-07, 'epoch': 4.96}


 99%|█████████▉| 358/360 [18:16<00:05,  2.59s/it]

{'loss': 0.3209, 'learning_rate': 3.3333333333333335e-07, 'epoch': 4.97}


100%|█████████▉| 359/360 [18:18<00:02,  2.45s/it]

{'loss': 0.3271, 'learning_rate': 1.6666666666666668e-07, 'epoch': 4.99}


100%|██████████| 360/360 [18:18<00:00,  3.05s/it]


{'loss': 0.2501, 'learning_rate': 0.0, 'epoch': 5.0}
{'train_runtime': 1098.9485, 'train_samples_per_second': 1.947, 'train_steps_per_second': 0.328, 'train_loss': 0.5628945537739329, 'epoch': 5.0}


100%|██████████| 36/36 [00:31<00:00,  1.45it/s]Trainer is attempting to log a value of "[0.0, 0.9863662482263283, 0.5662711137650831, 0.39059447742195674]" of type <class 'list'> for key "eval/per_category_iou" as a scalar. This invocation of Tensorboard's writer.add_scalar() is incorrect so we dropped this attribute.
Trainer is attempting to log a value of "[0.0, 0.9952738754277685, 0.7088374175958062, 0.49284520007087784]" of type <class 'list'> for key "eval/per_category_accuracy" as a scalar. This invocation of Tensorboard's writer.add_scalar() is incorrect so we dropped this attribute.
100%|██████████| 36/36 [03:16<00:00,  5.47s/it]


In [14]:
# import subprocess
# from typing import NoReturn

# def shutdown_windows() -> NoReturn:
#     subprocess.run(["shutdown", "/s", "/t", "0"])

# shutdown_windows()