In [1]:
%load_ext autoreload
%autoreload 2
import torch
import torch.nn as nn
from torchvision import transforms
from torch.utils.data import DataLoader
from dl_utils.utils.dataset import viz_dataloader, split_train_valid, hdf5_dataset
from dl_utils.training.build_model import xcit_small
from dl_utils.training.trainer import Trainer, accuracy
from dl_utils.packed_functions import benchmark_task

ds_path_info = {'imagenet': '../../datasets/imagenet_v5_rot_10m_fix_vector.h5',
                'noise': '../../datasets/noise_v5_rot_1m_fix_vector.h5',
                'atom': '../../datasets/atom_v5_rot_1m_fix_vector.h5',
                'viz_dataloader': False}

training_specs = {'batch_size': 400, 
                  'num_workers': 12, 
                  'device_ids': [1,2,3], 
                  'shuffle': True,
                  'learning_rate': 1e-3,
                  'validation_times': 200,
                  'training_image_count': 10000000*20, # 20 epochs of 10 million images of full imagenet dataset
                  'efficient_print': True,
                  'model_path': '../../models/XCiT/'
                  }


config = {'loss_func': 'CrossEntropyLoss', # nn.MSELoss()
          'optimizer': 'Adam',
          'scheduler': 'OneCycleLR'}
    
wandb_specs = {'config': config,
                'project': 'Understanding-Experimental-Images-by-Identifying-Symmetries-with-Deep-Learning',
                'entity': 'yig319',
                'group': 'test',
                'save_code': True,
                'resume': 'allow'}

model = xcit_small(in_channels=3, n_classes=17)
task_name = '03132025-XCiT-benchmark'

  from .autonotebook import tqdm as notebook_tqdm


### 500K dataset

In [2]:
training_specs['ds_size'] = 500000
training_specs['folder_name'] = task_name + '-500k'
model, history = benchmark_task(task_name, model, training_specs=training_specs, ds_path_info=ds_path_info, wandb_specs=wandb_specs)

[34m[1mwandb[0m: Using wandb-core as the SDK backend.  Please refer to https://wandb.me/wandb-core for more information.
[34m[1mwandb[0m: Currently logged in as: [33myig319[0m to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256, 258, 260, 262, 264, 266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286, 288, 290, 292, 294, 296, 298, 300, 302, 304, 306, 308, 310, 312, 314, 316, 318, 320, 322, 324, 326, 328, 330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 370, 372, 374, 376, 378, 380, 382, 384, 386, 388, 390, 392, 394, 396, 398]
Epoch: 1/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:35<00:00,  1.80s/it]


train_loss: 1.4459, train_accuracy: 50.51%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.45it/s]


valid_loss: 0.5741, valid_accuracy: 79.40%
Model saved at epoch 0
Saved new best model at epoch 0 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]


noise_loss: 2.2826, noise_accuracy: 31.13%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]


atom_loss: 2.0498, atom_accuracy: 36.98%
Model saved at epoch 2
Epoch: 3/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:36<00:00,  1.80s/it]


train_loss: 0.3203, train_accuracy: 88.63%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:37<00:00,  1.44it/s]


valid_loss: 0.2951, valid_accuracy: 89.52%
Model saved at epoch 2
Saved new best model at epoch 2 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 1.5839, noise_accuracy: 50.05%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


atom_loss: 1.5228, atom_accuracy: 53.03%
Model saved at epoch 4
Epoch: 5/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:34<00:00,  1.80s/it]


train_loss: 0.2077, train_accuracy: 92.77%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.44it/s]


valid_loss: 0.2206, valid_accuracy: 92.38%
Model saved at epoch 4
Saved new best model at epoch 4 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 1.6293, noise_accuracy: 51.31%


Valid:  90%|████████████████████████████████████████████████████████████████▋       | 1122/1250 [12:49<01:28,  1.44it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)



Model saved at epoch 10
Epoch: 11/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:31<00:00,  1.80s/it]


train_loss: 0.1029, train_accuracy: 96.35%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.1562, valid_accuracy: 94.88%
Model saved at epoch 10
Saved new best model at epoch 10 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


noise_loss: 1.5715, noise_accuracy: 58.19%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]


atom_loss: 1.2580, atom_accuracy: 69.45%
Model saved at epoch 12
Epoch: 13/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:33<00:00,  1.80s/it]


train_loss: 0.0892, train_accuracy: 96.84%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.1518, valid_accuracy: 95.07%
Model saved at epoch 12
Saved new best model at epoch 12 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 1.0453, noise_accuracy: 69.33%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


atom_loss: 1.1698, atom_accuracy: 72.16%
Model saved at epoch 14
Epoch: 15/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:31<00:00,  1.80s/it]


train_loss: 0.0820, train_accuracy: 97.08%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.1495, valid_accuracy: 95.23%
Model saved at epoch 14
Saved new best model at epoch 14 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


noise_loss: 0.9997, noise_accuracy: 70.93%


Valid:  46%|█████████████████████████████████▊                                       | 580/1250 [06:38<07:36,  1.47it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)



Model saved at epoch 28
Epoch: 29/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:44<00:00,  1.81s/it]


train_loss: 0.0596, train_accuracy: 97.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.44it/s]


valid_loss: 0.1092, valid_accuracy: 96.54%
Model saved at epoch 28
Saved new best model at epoch 28 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:22<00:00,  1.45it/s]


noise_loss: 0.7712, noise_accuracy: 78.69%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:20<00:00,  1.45it/s]

atom_loss: 1.5449, atom_accuracy: 71.30%





Model saved at epoch 30
Epoch: 31/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:37<00:00,  1.81s/it]


train_loss: 0.0581, train_accuracy: 97.93%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:37<00:00,  1.44it/s]


valid_loss: 0.1015, valid_accuracy: 96.66%
Model saved at epoch 30
Saved new best model at epoch 30 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]


noise_loss: 0.6083, noise_accuracy: 80.41%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


atom_loss: 1.0508, atom_accuracy: 77.44%
Model saved at epoch 32
Epoch: 33/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:44<00:00,  1.81s/it]


train_loss: 0.0566, train_accuracy: 97.98%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.45it/s]


valid_loss: 0.0974, valid_accuracy: 96.88%
Model saved at epoch 32
Saved new best model at epoch 32 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:22<00:00,  1.45it/s]


noise_loss: 0.5206, noise_accuracy: 83.67%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:20<00:00,  1.45it/s]

atom_loss: 1.7335, atom_accuracy: 68.90%





Model saved at epoch 34
Epoch: 35/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:37<00:00,  1.81s/it]


train_loss: 0.0554, train_accuracy: 98.04%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:40<00:00,  1.42it/s]


valid_loss: 0.1060, valid_accuracy: 96.73%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 0.5798, noise_accuracy: 84.25%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]


atom_loss: 1.6970, atom_accuracy: 70.49%
Model saved at epoch 36
Epoch: 37/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:37<00:00,  1.81s/it]


train_loss: 0.0537, train_accuracy: 98.10%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:37<00:00,  1.44it/s]


valid_loss: 0.0915, valid_accuracy: 97.01%
Model saved at epoch 36
Saved new best model at epoch 36 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]


noise_loss: 0.5701, noise_accuracy: 83.06%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


atom_loss: 1.0898, atom_accuracy: 76.57%
Model saved at epoch 38
Epoch: 39/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:37<00:00,  1.81s/it]


train_loss: 0.0535, train_accuracy: 98.08%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:40<00:00,  1.42it/s]


valid_loss: 0.0907, valid_accuracy: 97.05%
Model saved at epoch 38
Saved new best model at epoch 38 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]


noise_loss: 0.5154, noise_accuracy: 84.18%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


atom_loss: 1.1757, atom_accuracy: 77.19%
Model saved at epoch 40
Epoch: 41/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:34<00:00,  1.80s/it]


train_loss: 0.0512, train_accuracy: 98.19%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0889, valid_accuracy: 97.23%
Model saved at epoch 40
Saved new best model at epoch 40 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


noise_loss: 0.4360, noise_accuracy: 88.02%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


atom_loss: 1.2375, atom_accuracy: 77.39%
Model saved at epoch 42
Epoch: 43/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:37<00:00,  1.81s/it]


train_loss: 0.0509, train_accuracy: 98.18%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.46it/s]


valid_loss: 0.0946, valid_accuracy: 97.10%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


noise_loss: 0.4814, noise_accuracy: 86.73%


Valid:  51%|█████████████████████████████████████▎                                   | 639/1250 [07:18<06:52,  1.48it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)



Model saved at epoch 54
Epoch: 55/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:38<00:00,  1.81s/it]


train_loss: 0.0462, train_accuracy: 98.34%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.45it/s]


valid_loss: 0.0705, valid_accuracy: 97.71%
Model saved at epoch 54
Saved new best model at epoch 54 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]


noise_loss: 0.3418, noise_accuracy: 89.72%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


atom_loss: 1.1088, atom_accuracy: 80.61%
Model saved at epoch 56
Epoch: 57/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:39<00:00,  1.81s/it]


train_loss: 0.0452, train_accuracy: 98.38%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:37<00:00,  1.44it/s]


valid_loss: 0.0711, valid_accuracy: 97.67%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:22<00:00,  1.45it/s]


noise_loss: 0.3719, noise_accuracy: 89.75%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:30<00:00,  1.44it/s]

atom_loss: 1.1174, atom_accuracy: 76.28%





Model saved at epoch 58
Epoch: 59/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:42<00:00,  1.81s/it]


train_loss: 0.0438, train_accuracy: 98.42%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:32<00:00,  1.47it/s]


valid_loss: 0.0770, valid_accuracy: 97.58%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:07<00:00,  1.47it/s]


noise_loss: 0.3304, noise_accuracy: 90.80%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:09<00:00,  1.47it/s]

atom_loss: 1.3887, atom_accuracy: 76.35%





Model saved at epoch 60
Epoch: 61/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:35<00:00,  1.80s/it]


train_loss: 0.0430, train_accuracy: 98.45%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0670, valid_accuracy: 97.84%
Model saved at epoch 60
Saved new best model at epoch 60 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:31<00:00,  1.43it/s]


noise_loss: 0.3964, noise_accuracy: 89.32%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:42<00:00,  1.42it/s]


atom_loss: 1.2475, atom_accuracy: 79.09%
Model saved at epoch 62
Epoch: 63/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:33<00:00,  1.80s/it]


train_loss: 0.0421, train_accuracy: 98.48%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0713, valid_accuracy: 97.79%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:13<00:00,  1.46it/s]


noise_loss: 0.4080, noise_accuracy: 89.07%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]

atom_loss: 1.2457, atom_accuracy: 80.51%





Model saved at epoch 64
Epoch: 65/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:28<00:00,  1.80s/it]


train_loss: 0.0415, train_accuracy: 98.51%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0708, valid_accuracy: 97.77%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:10<00:00,  1.47it/s]


noise_loss: 0.2379, noise_accuracy: 92.99%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:09<00:00,  1.47it/s]

atom_loss: 1.2530, atom_accuracy: 77.90%





Model saved at epoch 66
Epoch: 67/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:25<00:00,  1.80s/it]


train_loss: 0.0411, train_accuracy: 98.51%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:33<00:00,  1.47it/s]


valid_loss: 0.0653, valid_accuracy: 98.00%
Model saved at epoch 66
Saved new best model at epoch 66 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:10<00:00,  1.47it/s]


noise_loss: 0.2839, noise_accuracy: 92.30%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:10<00:00,  1.47it/s]

atom_loss: 1.2340, atom_accuracy: 80.62%





Model saved at epoch 68
Epoch: 69/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:29<00:00,  1.80s/it]


train_loss: 0.0411, train_accuracy: 98.51%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0624, valid_accuracy: 98.02%
Model saved at epoch 68
Saved new best model at epoch 68 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:20<00:00,  1.45it/s]


noise_loss: 0.3072, noise_accuracy: 92.02%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:23<00:00,  1.45it/s]


atom_loss: 1.0073, atom_accuracy: 82.76%
Model saved at epoch 70
Epoch: 71/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:30<00:00,  1.80s/it]


train_loss: 0.0399, train_accuracy: 98.55%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:33<00:00,  1.47it/s]


valid_loss: 0.0629, valid_accuracy: 97.96%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:00<00:00,  1.49it/s]


noise_loss: 0.2781, noise_accuracy: 91.77%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:58<00:00,  1.49it/s]

atom_loss: 0.9608, atom_accuracy: 82.51%





Model saved at epoch 72
Epoch: 73/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:00<00:00,  1.78s/it]


train_loss: 0.0398, train_accuracy: 98.56%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:28<00:00,  1.50it/s]


valid_loss: 0.0647, valid_accuracy: 97.97%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:49<00:00,  1.51it/s]


noise_loss: 0.2525, noise_accuracy: 93.04%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:48<00:00,  1.51it/s]

atom_loss: 1.1795, atom_accuracy: 79.61%





Model saved at epoch 74
Epoch: 75/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:02<00:00,  1.78s/it]


train_loss: 0.0457, train_accuracy: 98.37%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:28<00:00,  1.50it/s]


valid_loss: 0.0667, valid_accuracy: 97.94%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:47<00:00,  1.51it/s]


noise_loss: 0.4572, noise_accuracy: 90.19%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:47<00:00,  1.51it/s]


atom_loss: 0.9865, atom_accuracy: 81.26%
Model saved at epoch 76
Epoch: 77/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [36:59<00:00,  1.78s/it]


train_loss: 0.0387, train_accuracy: 98.60%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:28<00:00,  1.50it/s]


valid_loss: 0.0657, valid_accuracy: 97.98%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:48<00:00,  1.51it/s]


noise_loss: 0.2635, noise_accuracy: 92.63%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:51<00:00,  1.50it/s]


atom_loss: 1.0136, atom_accuracy: 82.90%
Model saved at epoch 78
Epoch: 79/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:02<00:00,  1.78s/it]


train_loss: 0.0387, train_accuracy: 98.60%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:27<00:00,  1.51it/s]


valid_loss: 0.0612, valid_accuracy: 98.01%
Model saved at epoch 78
Saved new best model at epoch 78 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:47<00:00,  1.51it/s]


noise_loss: 0.3821, noise_accuracy: 89.82%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [13:47<00:00,  1.51it/s]

atom_loss: 1.0638, atom_accuracy: 83.56%





Model saved at epoch 80
Epoch: 81/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:01<00:00,  1.78s/it]


train_loss: 0.0386, train_accuracy: 98.61%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:27<00:00,  1.50it/s]


valid_loss: 0.0620, valid_accuracy: 98.04%
Model saved at epoch 80
Saved new best model at epoch 80 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:05<00:00,  1.48it/s]


noise_loss: 0.2882, noise_accuracy: 92.79%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:04<00:00,  1.48it/s]

atom_loss: 1.1216, atom_accuracy: 79.78%





Model saved at epoch 82
Epoch: 83/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:40<00:00,  1.81s/it]


train_loss: 0.0373, train_accuracy: 98.65%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0645, valid_accuracy: 98.10%
Model saved at epoch 82
Saved new best model at epoch 82 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:12<00:00,  1.47it/s]


noise_loss: 0.2639, noise_accuracy: 93.44%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:23<00:00,  1.45it/s]


atom_loss: 1.2844, atom_accuracy: 80.82%
Model saved at epoch 84
Epoch: 85/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [38:01<00:00,  1.83s/it]


train_loss: 0.0374, train_accuracy: 98.64%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:42<00:00,  1.40it/s]


valid_loss: 0.0624, valid_accuracy: 98.11%
Model saved at epoch 84
Saved new best model at epoch 84 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:28<00:00,  1.44it/s]


noise_loss: 0.2950, noise_accuracy: 92.34%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:26<00:00,  1.44it/s]

atom_loss: 0.9967, atom_accuracy: 87.39%





Model saved at epoch 86
Epoch: 87/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [38:00<00:00,  1.82s/it]


train_loss: 0.0372, train_accuracy: 98.65%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0610, valid_accuracy: 98.12%
Model saved at epoch 86
Saved new best model at epoch 86 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:31<00:00,  1.43it/s]


noise_loss: 0.2627, noise_accuracy: 92.77%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:20<00:00,  1.45it/s]

atom_loss: 0.7809, atom_accuracy: 86.09%





Model saved at epoch 88
Epoch: 89/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:28<00:00,  1.80s/it]


train_loss: 0.0374, train_accuracy: 98.65%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:33<00:00,  1.46it/s]


valid_loss: 0.0600, valid_accuracy: 98.13%
Model saved at epoch 88
Saved new best model at epoch 88 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:10<00:00,  1.47it/s]


noise_loss: 0.2522, noise_accuracy: 93.48%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:12<00:00,  1.47it/s]

atom_loss: 1.1098, atom_accuracy: 84.42%





Model saved at epoch 90
Epoch: 91/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:28<00:00,  1.80s/it]


train_loss: 0.0369, train_accuracy: 98.67%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0568, valid_accuracy: 98.17%
Model saved at epoch 90
Saved new best model at epoch 90 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:12<00:00,  1.47it/s]


noise_loss: 0.2210, noise_accuracy: 93.61%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:13<00:00,  1.47it/s]

atom_loss: 0.7650, atom_accuracy: 86.05%





Model saved at epoch 92
Epoch: 93/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:26<00:00,  1.80s/it]


train_loss: 0.0363, train_accuracy: 98.68%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:33<00:00,  1.46it/s]


valid_loss: 0.0600, valid_accuracy: 98.11%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]


noise_loss: 0.3179, noise_accuracy: 92.00%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:13<00:00,  1.46it/s]

atom_loss: 0.9820, atom_accuracy: 83.06%





Model saved at epoch 94
Epoch: 95/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:26<00:00,  1.80s/it]


train_loss: 0.0362, train_accuracy: 98.68%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0619, valid_accuracy: 98.09%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]


noise_loss: 0.2013, noise_accuracy: 94.87%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:12<00:00,  1.47it/s]


atom_loss: 1.1985, atom_accuracy: 82.53%
Model saved at epoch 96
Epoch: 97/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:27<00:00,  1.80s/it]


train_loss: 0.0359, train_accuracy: 98.70%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0571, valid_accuracy: 98.19%
Model saved at epoch 96
Saved new best model at epoch 96 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:10<00:00,  1.47it/s]


noise_loss: 0.2199, noise_accuracy: 93.82%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:09<00:00,  1.47it/s]

atom_loss: 0.8032, atom_accuracy: 88.58%





Model saved at epoch 98
Epoch: 99/400


Train:  82%|██████████████████████████████████████████████████████████▋             | 1019/1250 [30:37<07:04,  1.84s/it]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:24<00:00,  1.45it/s]

atom_loss: 1.5370, atom_accuracy: 81.87%





Model saved at epoch 108
Epoch: 109/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:33<00:00,  1.80s/it]


train_loss: 0.0345, train_accuracy: 98.75%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.46it/s]


valid_loss: 0.0598, valid_accuracy: 98.25%
Model saved at epoch 108
Saved new best model at epoch 108 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


noise_loss: 0.2377, noise_accuracy: 94.12%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]

atom_loss: 1.1901, atom_accuracy: 85.00%





Model saved at epoch 110
Epoch: 111/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:33<00:00,  1.80s/it]


train_loss: 0.0349, train_accuracy: 98.73%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0539, valid_accuracy: 98.30%
Model saved at epoch 110
Saved new best model at epoch 110 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


noise_loss: 0.2676, noise_accuracy: 93.22%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]

atom_loss: 1.1512, atom_accuracy: 83.03%





Model saved at epoch 112
Epoch: 113/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:31<00:00,  1.80s/it]


train_loss: 0.0345, train_accuracy: 98.76%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0625, valid_accuracy: 98.17%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


noise_loss: 0.2091, noise_accuracy: 94.43%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]

atom_loss: 1.2989, atom_accuracy: 81.69%





Model saved at epoch 114
Epoch: 115/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:30<00:00,  1.80s/it]


train_loss: 0.0344, train_accuracy: 98.76%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0558, valid_accuracy: 98.26%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:13<00:00,  1.46it/s]


noise_loss: 0.3567, noise_accuracy: 91.88%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


atom_loss: 0.8434, atom_accuracy: 88.42%
Model saved at epoch 116
Epoch: 117/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:32<00:00,  1.80s/it]


train_loss: 0.0341, train_accuracy: 98.78%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0597, valid_accuracy: 98.22%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


noise_loss: 0.2296, noise_accuracy: 94.48%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]

atom_loss: 1.2600, atom_accuracy: 82.93%





Model saved at epoch 118
Epoch: 119/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:35<00:00,  1.80s/it]


train_loss: 0.0343, train_accuracy: 98.76%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0589, valid_accuracy: 98.18%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


noise_loss: 0.2006, noise_accuracy: 94.47%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]

atom_loss: 1.4981, atom_accuracy: 78.93%





Model saved at epoch 120
Epoch: 121/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:32<00:00,  1.80s/it]


train_loss: 0.0341, train_accuracy: 98.77%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0578, valid_accuracy: 98.19%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:21<00:00,  1.45it/s]


noise_loss: 0.3373, noise_accuracy: 92.12%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]

atom_loss: 1.0126, atom_accuracy: 85.62%





Model saved at epoch 122
Epoch: 123/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:32<00:00,  1.80s/it]


train_loss: 0.0339, train_accuracy: 98.78%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0597, valid_accuracy: 98.24%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]


noise_loss: 0.3164, noise_accuracy: 93.46%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:20<00:00,  1.45it/s]

atom_loss: 1.3470, atom_accuracy: 85.22%





Model saved at epoch 124
Epoch: 125/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [38:02<00:00,  1.83s/it]


train_loss: 0.0333, train_accuracy: 98.80%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:42<00:00,  1.41it/s]


valid_loss: 0.0649, valid_accuracy: 98.10%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:40<00:00,  1.42it/s]


noise_loss: 0.2234, noise_accuracy: 94.82%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:39<00:00,  1.42it/s]


atom_loss: 1.6381, atom_accuracy: 79.79%
Model saved at epoch 126
Epoch: 127/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [38:06<00:00,  1.83s/it]


train_loss: 0.0330, train_accuracy: 98.81%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:39<00:00,  1.43it/s]


valid_loss: 0.0605, valid_accuracy: 98.24%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:37<00:00,  1.42it/s]


noise_loss: 0.3226, noise_accuracy: 93.03%


Valid:  41%|█████████████████████████████▌                                           | 507/1250 [05:57<08:37,  1.43it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]

atom_loss: 1.0105, atom_accuracy: 84.52%





Model saved at epoch 150
Epoch: 151/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:36<00:00,  1.81s/it]


train_loss: 0.0323, train_accuracy: 98.84%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0564, valid_accuracy: 98.32%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


noise_loss: 0.2154, noise_accuracy: 93.96%


Valid:   7%|█████▍                                                                    | 91/1250 [01:03<13:10,  1.47it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]

atom_loss: 1.1567, atom_accuracy: 83.59%





Model saved at epoch 162
Epoch: 163/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:38<00:00,  1.81s/it]


train_loss: 0.0318, train_accuracy: 98.86%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.45it/s]


valid_loss: 0.0597, valid_accuracy: 98.35%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 0.2243, noise_accuracy: 95.09%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]

atom_loss: 1.4166, atom_accuracy: 86.21%





Model saved at epoch 164
Epoch: 165/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:34<00:00,  1.80s/it]


train_loss: 0.0318, train_accuracy: 98.86%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0608, valid_accuracy: 98.36%
Model saved at epoch 164
Saved new best model at epoch 164 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.46it/s]


noise_loss: 0.1816, noise_accuracy: 95.58%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]

atom_loss: 1.2578, atom_accuracy: 86.87%





Model saved at epoch 166
Epoch: 167/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:34<00:00,  1.80s/it]


train_loss: 0.0316, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0569, valid_accuracy: 98.32%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]


noise_loss: 0.3257, noise_accuracy: 93.22%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]

atom_loss: 1.3066, atom_accuracy: 86.24%





Model saved at epoch 168
Epoch: 169/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:34<00:00,  1.80s/it]


train_loss: 0.0315, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0596, valid_accuracy: 98.33%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]


noise_loss: 0.2576, noise_accuracy: 94.96%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]

atom_loss: 1.3096, atom_accuracy: 85.97%





Model saved at epoch 170
Epoch: 171/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:36<00:00,  1.81s/it]


train_loss: 0.0318, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0550, valid_accuracy: 98.31%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 0.2637, noise_accuracy: 94.03%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


atom_loss: 1.1302, atom_accuracy: 86.26%
Model saved at epoch 172
Epoch: 173/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:33<00:00,  1.80s/it]


train_loss: 0.0315, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.45it/s]


valid_loss: 0.0661, valid_accuracy: 98.31%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 0.2393, noise_accuracy: 95.07%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]

atom_loss: 1.6899, atom_accuracy: 85.39%





Model saved at epoch 174
Epoch: 175/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:33<00:00,  1.80s/it]


train_loss: 0.0315, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.45it/s]


valid_loss: 0.0597, valid_accuracy: 98.34%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]


noise_loss: 0.2255, noise_accuracy: 94.74%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]

atom_loss: 1.8811, atom_accuracy: 81.64%





Model saved at epoch 176
Epoch: 177/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:32<00:00,  1.80s/it]


train_loss: 0.0315, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.46it/s]


valid_loss: 0.0597, valid_accuracy: 98.37%
Model saved at epoch 176
Saved new best model at epoch 176 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:13<00:00,  1.46it/s]


noise_loss: 0.2920, noise_accuracy: 94.03%


Valid:  38%|████████████████████████████                                             | 480/1250 [05:29<08:46,  1.46it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)



Model saved at epoch 188
Epoch: 189/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:31<00:00,  1.80s/it]


train_loss: 0.0312, train_accuracy: 98.89%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0602, valid_accuracy: 98.32%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]


noise_loss: 0.1860, noise_accuracy: 95.78%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]

atom_loss: 1.1251, atom_accuracy: 87.24%





Model saved at epoch 190
Epoch: 191/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:32<00:00,  1.80s/it]


train_loss: 0.0313, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0603, valid_accuracy: 98.38%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:00<00:00,  1.49it/s]


noise_loss: 0.2261, noise_accuracy: 95.20%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:29<00:00,  1.44it/s]

atom_loss: 1.0705, atom_accuracy: 87.98%





Model saved at epoch 192
Epoch: 193/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:47<00:00,  1.81s/it]


train_loss: 0.0313, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:39<00:00,  1.43it/s]


valid_loss: 0.0576, valid_accuracy: 98.38%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:41<00:00,  1.42it/s]


noise_loss: 0.1856, noise_accuracy: 95.55%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:44<00:00,  1.41it/s]

atom_loss: 1.2117, atom_accuracy: 85.59%





Model saved at epoch 194
Epoch: 195/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:54<00:00,  1.82s/it]


train_loss: 0.0312, train_accuracy: 98.89%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:40<00:00,  1.42it/s]


valid_loss: 0.0575, valid_accuracy: 98.35%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:30<00:00,  1.44it/s]


noise_loss: 0.2123, noise_accuracy: 95.20%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:33<00:00,  1.43it/s]

atom_loss: 1.4155, atom_accuracy: 86.71%





Model saved at epoch 196
Epoch: 197/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:55<00:00,  1.82s/it]


train_loss: 0.0311, train_accuracy: 98.89%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:45<00:00,  1.39it/s]


valid_loss: 0.0589, valid_accuracy: 98.36%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:41<00:00,  1.42it/s]


noise_loss: 0.4077, noise_accuracy: 93.14%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:40<00:00,  1.42it/s]


atom_loss: 1.7698, atom_accuracy: 83.02%
Model saved at epoch 198
Epoch: 199/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:29<00:00,  1.80s/it]


train_loss: 0.0312, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0554, valid_accuracy: 98.39%
Model saved at epoch 198
Saved new best model at epoch 198 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]


noise_loss: 0.1810, noise_accuracy: 95.74%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:12<00:00,  1.47it/s]


atom_loss: 1.3676, atom_accuracy: 87.15%
Model saved at epoch 200
Epoch: 201/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:29<00:00,  1.80s/it]


train_loss: 0.0311, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0617, valid_accuracy: 98.38%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 0.2771, noise_accuracy: 94.75%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]

atom_loss: 1.4120, atom_accuracy: 85.52%





Model saved at epoch 202
Epoch: 203/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:32<00:00,  1.80s/it]


train_loss: 0.0309, train_accuracy: 98.89%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0596, valid_accuracy: 98.37%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 0.2120, noise_accuracy: 95.46%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]

atom_loss: 1.3474, atom_accuracy: 87.41%





Model saved at epoch 204
Epoch: 205/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:34<00:00,  1.80s/it]


train_loss: 0.0310, train_accuracy: 98.89%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.45it/s]


valid_loss: 0.0642, valid_accuracy: 98.33%


Valid:   0%|▏                                                                          | 4/1250 [00:03<17:42,  1.17it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:29<00:00,  1.80s/it]


train_loss: 0.0306, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0616, valid_accuracy: 98.42%
Model saved at epoch 218
Saved new best model at epoch 218 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


noise_loss: 0.2830, noise_accuracy: 94.42%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


atom_loss: 1.4453, atom_accuracy: 85.45%
Model saved at epoch 220
Epoch: 221/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:28<00:00,  1.80s/it]


train_loss: 0.0310, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0614, valid_accuracy: 98.38%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


noise_loss: 0.3358, noise_accuracy: 94.17%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]

atom_loss: 1.4779, atom_accuracy: 83.97%





Model saved at epoch 222
Epoch: 223/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:34<00:00,  1.80s/it]


train_loss: 0.0309, train_accuracy: 98.89%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.45it/s]


valid_loss: 0.0608, valid_accuracy: 98.38%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:21<00:00,  1.45it/s]


noise_loss: 0.1735, noise_accuracy: 96.02%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:20<00:00,  1.45it/s]


atom_loss: 1.2743, atom_accuracy: 87.32%
Model saved at epoch 224
Epoch: 225/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:31<00:00,  1.80s/it]


train_loss: 0.0307, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:33<00:00,  1.47it/s]


valid_loss: 0.0622, valid_accuracy: 98.43%
Model saved at epoch 224
Saved new best model at epoch 224 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:13<00:00,  1.46it/s]


noise_loss: 0.2748, noise_accuracy: 95.09%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:13<00:00,  1.47it/s]

atom_loss: 1.5016, atom_accuracy: 88.41%





Model saved at epoch 226
Epoch: 227/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:24<00:00,  1.80s/it]


train_loss: 0.0308, train_accuracy: 98.89%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0605, valid_accuracy: 98.38%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:24<00:00,  1.45it/s]


noise_loss: 0.2621, noise_accuracy: 94.97%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:24<00:00,  1.45it/s]

atom_loss: 1.2569, atom_accuracy: 87.24%





Model saved at epoch 228
Epoch: 229/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:36<00:00,  1.81s/it]


train_loss: 0.0307, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.44it/s]


valid_loss: 0.0633, valid_accuracy: 98.36%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 0.2063, noise_accuracy: 95.39%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]

atom_loss: 1.4007, atom_accuracy: 83.97%





Model saved at epoch 230
Epoch: 231/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:32<00:00,  1.80s/it]


train_loss: 0.0309, train_accuracy: 98.89%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0626, valid_accuracy: 98.36%


Valid:  49%|████████████████████████████████████                                     | 618/1250 [07:04<07:11,  1.47it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)



Model saved at epoch 242
Epoch: 243/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:31<00:00,  1.80s/it]


train_loss: 0.0305, train_accuracy: 98.91%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0617, valid_accuracy: 98.41%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]


noise_loss: 0.3176, noise_accuracy: 94.78%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]

atom_loss: 1.7859, atom_accuracy: 84.24%





Model saved at epoch 244
Epoch: 245/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:49<00:00,  1.82s/it]


train_loss: 0.0305, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:35<00:00,  1.45it/s]


valid_loss: 0.0660, valid_accuracy: 98.42%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:19<00:00,  1.45it/s]


noise_loss: 0.3632, noise_accuracy: 94.49%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:13<00:00,  1.46it/s]


atom_loss: 1.7254, atom_accuracy: 85.11%
Model saved at epoch 246
Epoch: 247/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:37<00:00,  1.81s/it]


train_loss: 0.0305, train_accuracy: 98.91%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.44it/s]


valid_loss: 0.0602, valid_accuracy: 98.39%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:24<00:00,  1.45it/s]


noise_loss: 0.2329, noise_accuracy: 95.24%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:21<00:00,  1.45it/s]


atom_loss: 1.4042, atom_accuracy: 87.03%
Model saved at epoch 248
Epoch: 249/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:39<00:00,  1.81s/it]


train_loss: 0.0305, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.44it/s]


valid_loss: 0.0616, valid_accuracy: 98.40%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:21<00:00,  1.45it/s]


noise_loss: 0.2599, noise_accuracy: 95.06%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:18<00:00,  1.46it/s]

atom_loss: 1.6081, atom_accuracy: 84.87%





Model saved at epoch 250
Epoch: 251/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:16<00:00,  1.79s/it]


train_loss: 0.0306, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:32<00:00,  1.47it/s]


valid_loss: 0.0635, valid_accuracy: 98.33%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:09<00:00,  1.47it/s]


noise_loss: 0.2304, noise_accuracy: 95.74%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]


atom_loss: 1.3875, atom_accuracy: 84.87%
Model saved at epoch 252
Epoch: 253/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:31<00:00,  1.80s/it]


train_loss: 0.0307, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0637, valid_accuracy: 98.39%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


noise_loss: 0.2361, noise_accuracy: 95.48%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


atom_loss: 1.5619, atom_accuracy: 86.85%
Model saved at epoch 254
Epoch: 255/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:33<00:00,  1.80s/it]


train_loss: 0.0306, train_accuracy: 98.90%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0611, valid_accuracy: 98.41%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:17<00:00,  1.46it/s]


noise_loss: 0.2779, noise_accuracy: 95.32%


Valid:  93%|███████████████████████████████████████████████████████████████████▏    | 1167/1250 [13:20<00:56,  1.47it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:34<00:00,  1.43it/s]


noise_loss: 0.2671, noise_accuracy: 95.52%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:28<00:00,  1.44it/s]


atom_loss: 1.6138, atom_accuracy: 88.16%
Model saved at epoch 268
Epoch: 269/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:48<00:00,  1.82s/it]


train_loss: 0.0304, train_accuracy: 98.91%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:39<00:00,  1.43it/s]


valid_loss: 0.0624, valid_accuracy: 98.39%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:23<00:00,  1.45it/s]


noise_loss: 0.2131, noise_accuracy: 95.63%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]

atom_loss: 1.5349, atom_accuracy: 83.76%





Model saved at epoch 270
Epoch: 271/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:33<00:00,  1.80s/it]


train_loss: 0.0303, train_accuracy: 98.92%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:39<00:00,  1.43it/s]


valid_loss: 0.0662, valid_accuracy: 98.39%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:20<00:00,  1.45it/s]


noise_loss: 0.1969, noise_accuracy: 96.12%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]


atom_loss: 1.3011, atom_accuracy: 87.89%
Model saved at epoch 272
Epoch: 273/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:35<00:00,  1.80s/it]


train_loss: 0.0304, train_accuracy: 98.91%


Valid:  76%|████████████████████████████████████████████████████████▌                 | 239/313 [02:46<00:50,  1.45it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:41<00:00,  1.81s/it]


train_loss: 0.0303, train_accuracy: 98.91%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:33<00:00,  1.47it/s]


valid_loss: 0.0678, valid_accuracy: 98.42%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:15<00:00,  1.46it/s]


noise_loss: 0.3538, noise_accuracy: 94.54%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:21<00:00,  1.45it/s]

atom_loss: 1.5494, atom_accuracy: 89.54%





Model saved at epoch 276
Epoch: 277/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:29<00:00,  1.80s/it]


train_loss: 0.0303, train_accuracy: 98.91%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0709, valid_accuracy: 98.43%
Model saved at epoch 276
Saved new best model at epoch 276 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]


noise_loss: 0.3580, noise_accuracy: 94.46%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]

atom_loss: 1.3957, atom_accuracy: 89.48%





Model saved at epoch 278
Epoch: 279/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:42<00:00,  1.81s/it]


train_loss: 0.0304, train_accuracy: 98.91%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:41<00:00,  1.41it/s]


valid_loss: 0.0662, valid_accuracy: 98.38%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:34<00:00,  1.43it/s]


noise_loss: 0.1843, noise_accuracy: 96.04%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:27<00:00,  1.44it/s]

atom_loss: 1.7159, atom_accuracy: 87.02%





Model saved at epoch 280
Epoch: 281/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:30<00:00,  1.80s/it]


train_loss: 0.0303, train_accuracy: 98.92%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:36<00:00,  1.44it/s]


valid_loss: 0.0669, valid_accuracy: 98.44%
Model saved at epoch 280
Saved new best model at epoch 280 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:16<00:00,  1.46it/s]


noise_loss: 0.2745, noise_accuracy: 95.53%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:09<00:00,  1.47it/s]

atom_loss: 1.7670, atom_accuracy: 87.82%





Model saved at epoch 282
Epoch: 283/400


Train: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [37:29<00:00,  1.80s/it]


train_loss: 0.0304, train_accuracy: 98.91%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 313/313 [03:34<00:00,  1.46it/s]


valid_loss: 0.0651, valid_accuracy: 98.42%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]


noise_loss: 0.2392, noise_accuracy: 95.85%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 1250/1250 [14:14<00:00,  1.46it/s]

atom_loss: 1.8635, atom_accuracy: 86.37%





KeyboardInterrupt: 

### 5 million dataset

In [None]:
training_specs['ds_size'] = 5000000
training_specs['folder_name'] = task_name + '-5m'
model.load_state_dict(torch.load('../../models/XCiT/03132025-XCiT-benchmark-5m/epoch_14.pth', weights_only=True, map_location=torch.device('cpu')))
training_specs['epoch_start'] = 14

model, history = benchmark_task(task_name, model, training_specs=training_specs, ds_path_info=ds_path_info, wandb_specs=wandb_specs)

[34m[1mwandb[0m: Using wandb-core as the SDK backend.  Please refer to https://wandb.me/wandb-core for more information.
[34m[1mwandb[0m: Currently logged in as: [33myig319[0m to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


[14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39]
Epoch: 15/40


Train:   0%|▎                                                                      | 61/12500 [01:55<6:12:59,  1.80s/it]