In [1]:
%load_ext autoreload
%autoreload 2
import torch
import torch.nn as nn
from torchvision import transforms
from torch.utils.data import DataLoader
from dl_utils.utils.dataset import viz_dataloader, split_train_valid, hdf5_dataset
from dl_utils.training.build_model import xcit_small
from dl_utils.training.trainer import Trainer, accuracy
from dl_utils.packed_functions import benchmark_task

ds_path_info = {'imagenet': '../../datasets/imagenet_v5_rot_10m_fix_vector.h5',
                'noise': '../../datasets/noise_v5_rot_1m_fix_vector.h5',
                'atom': '../../datasets/atom_v5_rot_1m_fix_vector.h5',
                'viz_dataloader': False}

training_specs = {'batch_size': 380, 
                  'num_workers': 12, 
                  'device_ids': [4,5,6], 
                  'shuffle': True,
                  'learning_rate': 1e-3,
                  'validation_times': 200,
                  'training_image_count': 10000000*20, # 20 epochs of 10 million images of full imagenet dataset
                  'efficient_print': True,
                  'model_path': '../../models/XCiT/'
                  }

config = {'loss_func': 'CrossEntropyLoss', # nn.MSELoss()
          'optimizer': 'Adam',
          'scheduler': 'OneCycleLR'}
    
wandb_specs = {'config': config,
                'project': 'Understanding-Experimental-Images-by-Identifying-Symmetries-with-Deep-Learning',
                'entity': 'yig319',
                'group': 'test',
                'save_code': True,
                'resume': 'allow'}

model = xcit_small(in_channels=3, n_classes=17)
task_name = '03132025-XCiT-benchmark'

  from .autonotebook import tqdm as notebook_tqdm


### 1 million dataset

In [None]:
training_specs['ds_size'] = 1000000
model.load_state_dict(torch.load('../../models/XCiT/03132025-XCiT-benchmark-1m/epoch_67.pth', weights_only=True, map_location=torch.device('cpu')))
training_specs['epoch_start'] = 67
training_specs['folder_name'] = task_name + '-1m'
model, history = benchmark_task(task_name, model, training_specs=training_specs, ds_path_info=ds_path_info, wandb_specs=wandb_specs)

[34m[1mwandb[0m: Using wandb-core as the SDK backend.  Please refer to https://wandb.me/wandb-core for more information.
[34m[1mwandb[0m: Currently logged in as: [33myig319[0m to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


[67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199]
Epoch: 68/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:13:51<00:00,  1.68s/it]


train_loss: 0.0324, train_accuracy: 98.82%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:53<00:00,  1.59it/s]


valid_loss: 0.0406, valid_accuracy: 98.63%
Model saved at epoch 67
Saved new best model at epoch 67 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:27<00:00,  1.60it/s]


noise_loss: 0.1147, noise_accuracy: 96.91%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:30<00:00,  1.59it/s]


atom_loss: 0.8431, atom_accuracy: 86.32%
Model saved at epoch 68
Epoch: 69/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:20<00:00,  1.69s/it]


train_loss: 0.0316, train_accuracy: 98.85%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:55<00:00,  1.58it/s]


valid_loss: 0.0416, valid_accuracy: 98.64%
Model saved at epoch 68
Saved new best model at epoch 68 with valid dataset


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:40<00:00,  1.59it/s]


noise_loss: 0.1274, noise_accuracy: 96.99%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:56<00:00,  1.57it/s]


atom_loss: 0.8591, atom_accuracy: 87.28%
Model saved at epoch 69
Epoch: 70/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:25<00:00,  1.70s/it]


train_loss: 0.0315, train_accuracy: 98.85%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:58<00:00,  1.57it/s]


valid_loss: 0.0430, valid_accuracy: 98.63%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:51<00:00,  1.57it/s]


noise_loss: 0.1355, noise_accuracy: 97.05%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:51<00:00,  1.57it/s]


atom_loss: 0.9958, atom_accuracy: 86.80%
Model saved at epoch 70
Epoch: 71/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:21<00:00,  1.70s/it]


train_loss: 0.0314, train_accuracy: 98.85%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:59<00:00,  1.57it/s]


valid_loss: 0.0447, valid_accuracy: 98.63%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:48<00:00,  1.58it/s]


noise_loss: 0.1595, noise_accuracy: 96.81%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:49<00:00,  1.58it/s]


atom_loss: 1.0430, atom_accuracy: 87.03%
Model saved at epoch 71
Epoch: 72/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:38<00:00,  1.70s/it]


train_loss: 0.0313, train_accuracy: 98.86%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:08<00:00,  1.54it/s]


valid_loss: 0.0446, valid_accuracy: 98.64%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:59<00:00,  1.57it/s]


noise_loss: 0.1549, noise_accuracy: 97.10%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:01<00:00,  1.57it/s]


atom_loss: 1.0451, atom_accuracy: 87.48%
Model saved at epoch 72
Epoch: 73/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:11<00:00,  1.69s/it]


train_loss: 0.0313, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:54<00:00,  1.59it/s]


valid_loss: 0.0460, valid_accuracy: 98.62%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:39<00:00,  1.59it/s]


noise_loss: 0.1673, noise_accuracy: 97.01%


Valid:  71%|██████████████████████████████████████████████████▉                     | 1862/2632 [19:43<08:08,  1.57it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:26<00:00,  1.70s/it]


train_loss: 0.0313, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:57<00:00,  1.58it/s]


valid_loss: 0.0469, valid_accuracy: 98.62%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:16<00:00,  1.55it/s]


noise_loss: 0.1725, noise_accuracy: 96.84%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:35<00:00,  1.53it/s]


atom_loss: 1.0170, atom_accuracy: 87.21%
Model saved at epoch 77
Epoch: 78/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:59<00:00,  1.71s/it]


train_loss: 0.0312, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:56<00:00,  1.58it/s]


valid_loss: 0.0460, valid_accuracy: 98.61%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:51<00:00,  1.57it/s]


noise_loss: 0.1533, noise_accuracy: 97.10%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:20<00:00,  1.55it/s]


atom_loss: 0.9988, atom_accuracy: 87.37%
Model saved at epoch 78
Epoch: 79/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:28<00:00,  1.70s/it]


train_loss: 0.0312, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:01<00:00,  1.56it/s]


valid_loss: 0.0461, valid_accuracy: 98.62%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:57<00:00,  1.57it/s]


noise_loss: 0.2002, noise_accuracy: 96.66%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:57<00:00,  1.57it/s]


atom_loss: 0.9271, atom_accuracy: 88.96%
Model saved at epoch 79
Epoch: 80/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:25<00:00,  1.70s/it]


train_loss: 0.0313, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:55<00:00,  1.58it/s]


valid_loss: 0.0451, valid_accuracy: 98.64%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:53<00:00,  1.57it/s]


noise_loss: 0.2128, noise_accuracy: 96.55%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:55<00:00,  1.57it/s]


atom_loss: 1.0919, atom_accuracy: 88.80%
Model saved at epoch 80
Epoch: 81/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:31<00:00,  1.70s/it]


train_loss: 0.0312, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [06:57<00:00,  1.58it/s]


valid_loss: 0.0470, valid_accuracy: 98.60%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:58<00:00,  1.57it/s]


noise_loss: 0.1661, noise_accuracy: 96.82%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [27:58<00:00,  1.57it/s]


atom_loss: 1.0978, atom_accuracy: 86.91%
Model saved at epoch 81
Epoch: 82/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:35<00:00,  1.70s/it]


train_loss: 0.0313, train_accuracy: 98.88%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:07<00:00,  1.54it/s]


valid_loss: 0.0443, valid_accuracy: 98.62%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:09<00:00,  1.56it/s]


noise_loss: 0.1549, noise_accuracy: 97.07%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:02<00:00,  1.56it/s]


atom_loss: 0.9418, atom_accuracy: 87.24%
Model saved at epoch 82
Epoch: 83/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:14:26<00:00,  1.70s/it]


train_loss: 0.0314, train_accuracy: 98.87%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:02<00:00,  1.56it/s]


valid_loss: 0.0445, valid_accuracy: 98.61%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:05<00:00,  1.56it/s]


noise_loss: 0.1741, noise_accuracy: 96.62%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:03<00:00,  1.56it/s]


atom_loss: 0.9778, atom_accuracy: 88.18%
Model saved at epoch 83
Epoch: 84/200


Train:  84%|██████████████████████████████████████████████████████████▌           | 2204/2632 [1:02:19<12:06,  1.70s/it]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:23<00:00,  1.72s/it]


train_loss: 0.0318, train_accuracy: 98.86%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:20<00:00,  1.49it/s]


valid_loss: 0.0449, valid_accuracy: 98.57%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:42<00:00,  1.53it/s]


noise_loss: 0.1375, noise_accuracy: 96.74%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:15<00:00,  1.55it/s]


atom_loss: 1.1634, atom_accuracy: 84.20%
Model saved at epoch 88
Epoch: 89/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:11<00:00,  1.71s/it]


train_loss: 0.0318, train_accuracy: 98.86%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:08<00:00,  1.54it/s]


valid_loss: 0.0444, valid_accuracy: 98.57%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:43<00:00,  1.53it/s]


noise_loss: 0.1367, noise_accuracy: 96.79%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:35<00:00,  1.53it/s]


atom_loss: 0.7257, atom_accuracy: 89.88%
Model saved at epoch 89
Epoch: 90/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:40<00:00,  1.73s/it]


train_loss: 0.0319, train_accuracy: 98.86%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:15<00:00,  1.51it/s]


valid_loss: 0.0466, valid_accuracy: 98.52%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:52<00:00,  1.52it/s]


noise_loss: 0.1398, noise_accuracy: 96.89%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:46<00:00,  1.52it/s]


atom_loss: 1.0056, atom_accuracy: 86.68%
Model saved at epoch 90
Epoch: 91/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:23<00:00,  1.72s/it]


train_loss: 0.0320, train_accuracy: 98.86%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:18<00:00,  1.50it/s]


valid_loss: 0.0467, valid_accuracy: 98.54%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [29:22<00:00,  1.49it/s]


noise_loss: 0.1844, noise_accuracy: 95.85%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [29:02<00:00,  1.51it/s]


atom_loss: 0.9200, atom_accuracy: 86.83%
Model saved at epoch 91
Epoch: 92/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:22<00:00,  1.72s/it]


train_loss: 0.0322, train_accuracy: 98.85%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:10<00:00,  1.53it/s]


valid_loss: 0.0446, valid_accuracy: 98.56%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:31<00:00,  1.54it/s]


noise_loss: 0.1573, noise_accuracy: 96.51%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:38<00:00,  1.53it/s]


atom_loss: 1.1766, atom_accuracy: 85.50%
Model saved at epoch 92
Epoch: 93/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:30<00:00,  1.72s/it]


train_loss: 0.0322, train_accuracy: 98.84%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:15<00:00,  1.51it/s]


valid_loss: 0.0437, valid_accuracy: 98.59%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:59<00:00,  1.51it/s]


noise_loss: 0.1517, noise_accuracy: 96.30%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:34<00:00,  1.53it/s]


atom_loss: 0.8436, atom_accuracy: 87.70%
Model saved at epoch 93
Epoch: 94/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:23<00:00,  1.72s/it]


train_loss: 0.0324, train_accuracy: 98.84%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:11<00:00,  1.53it/s]


valid_loss: 0.0428, valid_accuracy: 98.58%


Valid:  12%|████████▌                                                                | 309/2632 [03:20<25:01,  1.55it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:15<00:00,  1.51it/s]


valid_loss: 0.0431, valid_accuracy: 98.56%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:53<00:00,  1.52it/s]


noise_loss: 0.1684, noise_accuracy: 95.54%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [29:05<00:00,  1.51it/s]


atom_loss: 0.8321, atom_accuracy: 85.47%
Model saved at epoch 98
Epoch: 99/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:11<00:00,  1.71s/it]


train_loss: 0.0327, train_accuracy: 98.84%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:20<00:00,  1.49it/s]


valid_loss: 0.0434, valid_accuracy: 98.57%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [29:19<00:00,  1.50it/s]


noise_loss: 0.1309, noise_accuracy: 96.72%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:56<00:00,  1.52it/s]


atom_loss: 0.8833, atom_accuracy: 86.07%
Model saved at epoch 99
Epoch: 100/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:41<00:00,  1.73s/it]


train_loss: 0.0327, train_accuracy: 98.84%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:16<00:00,  1.51it/s]


valid_loss: 0.0433, valid_accuracy: 98.56%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:58<00:00,  1.51it/s]


noise_loss: 0.1720, noise_accuracy: 95.70%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:43<00:00,  1.53it/s]


atom_loss: 0.9424, atom_accuracy: 86.13%
Model saved at epoch 100
Epoch: 101/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:39<00:00,  1.72s/it]


train_loss: 0.0326, train_accuracy: 98.84%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:14<00:00,  1.51it/s]


valid_loss: 0.0425, valid_accuracy: 98.61%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:46<00:00,  1.52it/s]


noise_loss: 0.1316, noise_accuracy: 96.69%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:54<00:00,  1.52it/s]


atom_loss: 0.9588, atom_accuracy: 85.79%
Model saved at epoch 101
Epoch: 102/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:38<00:00,  1.72s/it]


train_loss: 0.0327, train_accuracy: 98.83%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:18<00:00,  1.50it/s]


valid_loss: 0.0448, valid_accuracy: 98.53%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [29:28<00:00,  1.49it/s]


noise_loss: 0.2408, noise_accuracy: 94.62%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [29:00<00:00,  1.51it/s]


atom_loss: 1.0867, atom_accuracy: 85.11%
Model saved at epoch 102
Epoch: 103/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:22<00:00,  1.72s/it]


train_loss: 0.0327, train_accuracy: 98.83%


Valid: 100%|██████████████████████████████████████████████████████████████████████████| 658/658 [07:16<00:00,  1.51it/s]


valid_loss: 0.0429, valid_accuracy: 98.57%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:53<00:00,  1.52it/s]


noise_loss: 0.1613, noise_accuracy: 96.03%


Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:41<00:00,  1.53it/s]


atom_loss: 0.7639, atom_accuracy: 87.47%
Model saved at epoch 103
Epoch: 104/200


Train: 100%|██████████████████████████████████████████████████████████████████████| 2632/2632 [1:15:37<00:00,  1.72s/it]


train_loss: 0.0327, train_accuracy: 98.84%


Valid:  85%|██████████████████████████████████████████████████████████████▉           | 560/658 [06:10<01:03,  1.53it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

Valid: 100%|████████████████████████████████████████████████████████████████████████| 2632/2632 [28:58<00:00,  1.51it/s]


noise_loss: 0.2308, noise_accuracy: 94.12%


Valid:   3%|██                                                                        | 75/2632 [00:50<27:46,  1.53it/s]