# Feed-forward сети

Итак, давайте потренируемся тренировать нейронные сети прямого распространения (так как делали на паре)
При этом попробуем создать свою функцию активации на одном из слоев

In [1]:
# Сделаем необходимые импорты
import torch
import numpy as np

from torch import nn
import torchvision

In [2]:
# Загрузим датасет CIFAR-100, сразу же создадим dataloader для него
# Если вам не хватает вычислительных ресурсов, то можно вернуться к CIFAR-10
# возьму набор CIFAR-10, т.к. комп дохленький

import torchvision.transforms as transforms
from sklearn.preprocessing import label_binarize

train_dataset = torchvision.datasets.CIFAR10(root='data/',
                                             train=True,  
                                             transform=transforms.ToTensor(), 
                                             download=False)

#преобразовываем форму изображений и нормируем их
smpls_train = train_dataset.data.shape[0]
X_train = np.reshape(train_dataset.data,(smpls_train,3072))/255

#переводим метки в векторы
y_train = label_binarize(train_dataset.targets,classes = [x for x in range(10)])
del train_dataset


test_dataset = torchvision.datasets.CIFAR10(root='data/',
                                             train=False,  
                                             transform=transforms.ToTensor(), 
                                             download=False)

#преобразовываем форму изображений и нормируем их
smpls_test = test_dataset.data.shape[0]
X_test = np.reshape(test_dataset.data,(smpls_test,3072))/255

#переводим метки в векторы
y_test = label_binarize(test_dataset.targets,classes = [x for x in range(10)])

classes = test_dataset.classes #названия меток
del test_dataset

#ОБратный перевод данных в тензоры
X_train = torch.Tensor(X_train)
y_train = torch.Tensor(y_train)
X_test = torch.Tensor(X_test)
y_test = torch.Tensor(y_test)

print(X_train.shape, y_train.shape, X_test.shape, y_test.shape)

torch.Size([50000, 3072]) torch.Size([50000, 10]) torch.Size([10000, 3072]) torch.Size([10000, 10])


In [9]:
# Создайте собственную архитектуру! Можете использовать все, что угодно, но в ограничении на использование линейные слои (пока без сверток)
# Давайте добавим ограниченный Leaky_relu, то есть output = max(0.1x, 0.5x)
# Ваша задача добавить его в архитектуру сети как функцию активации
from tqdm import tqdm

import torch.nn.functional as fnc
import torch.optim as opt

#4-слойный перцептрон
class Model_4l(nn.Module):
    def __init__(self,lays):
        super(Model_4l, self).__init__()
        self.lay12=nn.Linear(lays[0],lays[1]).to(device)   
        self.lay23=nn.Linear(lays[1],lays[2]).to(device)   
        self.lay34=nn.Linear(lays[2],lays[3]).to(device)
        
        self.opt=opt.SGD(self.parameters(), lr=0.001, momentum=0.9) #оптимизатор
        self.criterion=nn.CrossEntropyLoss() #функция потерь (отриц. логарифм правдоподобия)

    def forward(self, x):
        x = fnc.leaky_relu(self.lay12(x), 0.1)
        x = fnc.leaky_relu(self.lay23(x), 0.1)
        return fnc.softmax(self.lay34(x))


#5-слойный перцептрон
class Model_5l(nn.Module):
    def __init__(self,lays):
        super(Model_5l, self).__init__()
        self.lay12=nn.Linear(lays[0],lays[1]).to(device)   
        self.lay23=nn.Linear(lays[1],lays[2]).to(device)   
        self.lay34=nn.Linear(lays[2],lays[3]).to(device)
        self.lay45=nn.Linear(lays[3],lays[4]).to(device)
        
        self.opt=opt.SGD(self.parameters(), lr=0.001, momentum=0.9) #оптимизатор
        self.criterion=nn.CrossEntropyLoss() #функция потерь (отриц. логарифм правдоподобия)

    def forward(self, x):
        x = fnc.leaky_relu(self.lay12(x), 0.1)
        x = fnc.leaky_relu(self.lay23(x), 0.1)
        x = fnc.leaky_relu(self.lay34(x), 0.1)
        return fnc.softmax(self.lay45(x))


#6-слойный перцептрон
class Model_6l(nn.Module):
    def __init__(self,lays):
        super(Model_6l, self).__init__()
        self.lay12=nn.Linear(lays[0],lays[1]).to(device)   
        self.lay23=nn.Linear(lays[1],lays[2]).to(device)   
        self.lay34=nn.Linear(lays[2],lays[3]).to(device)
        self.lay45=nn.Linear(lays[3],lays[4]).to(device)
        self.lay56=nn.Linear(lays[4],lays[5]).to(device)
        
        self.opt=opt.SGD(self.parameters(), lr=0.001, momentum=0.9) #оптимизатор
        self.criterion=nn.CrossEntropyLoss() #функция потерь (отриц. логарифм правдоподобия)

    def forward(self, x):
        x = fnc.leaky_relu(self.lay12(x), 0.1)
        x = fnc.leaky_relu(self.lay23(x), 0.1)
        x = fnc.leaky_relu(self.lay34(x), 0.1)
        x = fnc.leaky_relu(self.lay45(x), 0.1)
        return fnc.softmax(self.lay56(x))

In [4]:
# Запустить обучение (по аналогии с тем, что делали на паре)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

size_in = 3072
size_out = 10

In [6]:
#обучим 4-слойные НС
errs_4l = []
mdls_4l = []
err_best = np.Inf #наименьшее достигнутое значение ошибки на тестовой выборке

#обучим 4-слойные сети
l2 = [768, 384, 192, 128]
l3 = [192, 128, 64, 32]

#определим размер пакета
batch_size = 64
batches = int(np.ceil(smpls_train/batch_size))

for l2_ in l2:
    for l3_ in l3:
        net = Model_4l([size_in, l2_, l3_, size_out])

        for epoch in tqdm(range(20)):  
            running_loss = 0.0
            for i in range(batches):
                if i+1 != batches:
                    inputs = X_train[i*batch_size:(i+1)*batch_size, :]
                    labels = y_train[i*batch_size:(i+1)*batch_size, :]
                else:
                    inputs1 = X_train[i*batch_size:smpls_train, :]
                    labels1 = y_train[i*batch_size:smpls_train, :]
                    
                    resid = batch_size - (smpls_train - i*batch_size)
                    
                    inputs2 = X_train[0:resid, :]
                    labels2 = y_train[0:resid, :]
                    
                    inputs = torch.cat((inputs1,inputs2))
                    labels = torch.cat((labels1,labels2))
                    
                    del inputs1, labels1, inputs2, labels2

                # обнуляем градиент
                net.opt.zero_grad()
                
                #inputs = inputs.reshape((inputs.shape[0],3072)) #переводим образцы в векторы
                #inputs = inputs/255 #и нормируем

                outputs = net(inputs)
                loss = net.criterion(outputs, labels)
                loss.backward()
                net.opt.step()

                # выводим статистику о процессе обучения
                running_loss += loss.item()
                if i % 300 == 0:    # печатаем каждые 300 mini-batches
                    print('[%d, %5d] loss: %.3f' %
                          (epoch + 1, i + 1, running_loss / 2000)) # откуда 2000?
                    running_loss = 0.0
                
            
        
        #вычисление ошибки на тестовом наборе данных
        y_pred = net(X_test)
        loss_test = net.criterion(y_pred, y_test).item()
        
        if loss_test<err_best: #сохраняем только лучшие сети на данный момент
            errs_4l.append(loss_test)
            mdls_4l.append(net)
            err_best = loss_test

  return fnc.softmax(self.lay34(x))


[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:49<15:43, 49.66s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.344
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [01:32<13:39, 45.51s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.342


 15%|████████████▍                                                                      | 3/20 [02:16<12:41, 44.79s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.339
[4,   601] loss: 0.338


 20%|████████████████▌                                                                  | 4/20 [03:02<12:09, 45.58s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.335
[5,   601] loss: 0.333


 25%|████████████████████▊                                                              | 5/20 [04:02<12:41, 50.78s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.332
[6,   601] loss: 0.330


 30%|████████████████████████▉                                                          | 6/20 [04:57<12:06, 51.89s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.329
[7,   601] loss: 0.328


 35%|█████████████████████████████                                                      | 7/20 [05:44<10:55, 50.39s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.328
[8,   601] loss: 0.327


 40%|█████████████████████████████████▏                                                 | 8/20 [06:35<10:06, 50.57s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.327
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [07:23<09:09, 49.93s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [08:13<08:18, 49.82s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [09:01<07:24, 49.44s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [09:49<06:31, 48.93s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.324
[13,   601] loss: 0.323


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [10:39<05:44, 49.15s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.322


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [11:30<04:59, 49.87s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.322
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [12:24<04:14, 50.94s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.322
[16,   601] loss: 0.321


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [13:15<03:24, 51.10s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.321
[17,   601] loss: 0.320


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [14:06<02:32, 50.91s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.320
[18,   601] loss: 0.319


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [14:55<01:40, 50.48s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.320
[19,   601] loss: 0.319


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [15:44<00:49, 49.87s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.319
[20,   601] loss: 0.318


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [16:33<00:00, 49.68s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:43<13:53, 43.86s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.344
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [01:25<12:47, 42.66s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.342


 15%|████████████▍                                                                      | 3/20 [02:07<11:55, 42.12s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.340
[4,   601] loss: 0.338


 20%|████████████████▌                                                                  | 4/20 [02:49<11:14, 42.18s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.335
[5,   601] loss: 0.334


 25%|████████████████████▊                                                              | 5/20 [03:31<10:32, 42.14s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.332
[6,   601] loss: 0.330


 30%|████████████████████████▉                                                          | 6/20 [04:13<09:48, 42.05s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.329
[7,   601] loss: 0.328


 35%|█████████████████████████████                                                      | 7/20 [04:54<09:03, 41.81s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.328
[8,   601] loss: 0.327


 40%|█████████████████████████████████▏                                                 | 8/20 [05:36<08:21, 41.83s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.326
[9,   601] loss: 0.325


 45%|█████████████████████████████████████▎                                             | 9/20 [06:18<07:39, 41.79s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.325
[10,   601] loss: 0.324


 50%|█████████████████████████████████████████                                         | 10/20 [07:00<06:58, 41.85s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [07:41<06:16, 41.81s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [08:23<05:34, 41.79s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.323
[13,   601] loss: 0.322


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [09:05<04:53, 41.91s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.322
[14,   601] loss: 0.321


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [09:47<04:10, 41.82s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.321
[15,   601] loss: 0.320


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [10:29<03:28, 41.76s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.320
[16,   601] loss: 0.319


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [11:10<02:46, 41.69s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.319
[17,   601] loss: 0.318


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [11:52<02:05, 41.68s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.319
[18,   601] loss: 0.317


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [12:34<01:23, 41.83s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.318
[19,   601] loss: 0.317


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [13:16<00:41, 41.82s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.317
[20,   601] loss: 0.316


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [13:57<00:00, 41.90s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:40<12:50, 40.57s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [01:21<12:11, 40.65s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.342


 15%|████████████▍                                                                      | 3/20 [02:02<11:35, 40.94s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.340
[4,   601] loss: 0.339


 20%|████████████████▌                                                                  | 4/20 [02:43<10:53, 40.85s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.337
[5,   601] loss: 0.336


 25%|████████████████████▊                                                              | 5/20 [03:23<10:10, 40.71s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.335
[6,   601] loss: 0.333


 30%|████████████████████████▉                                                          | 6/20 [04:04<09:28, 40.61s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.332
[7,   601] loss: 0.330


 35%|█████████████████████████████                                                      | 7/20 [04:44<08:46, 40.51s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.329
[8,   601] loss: 0.328


 40%|█████████████████████████████████▏                                                 | 8/20 [05:25<08:07, 40.59s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.328
[9,   601] loss: 0.327


 45%|█████████████████████████████████████▎                                             | 9/20 [06:05<07:25, 40.54s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.327
[10,   601] loss: 0.326


 50%|█████████████████████████████████████████                                         | 10/20 [06:46<06:45, 40.50s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.326
[11,   601] loss: 0.325


 55%|█████████████████████████████████████████████                                     | 11/20 [07:26<06:05, 40.62s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.325
[12,   601] loss: 0.324


 60%|█████████████████████████████████████████████████▏                                | 12/20 [08:08<05:28, 41.04s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.324
[13,   601] loss: 0.323


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [08:49<04:47, 41.01s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.324
[14,   601] loss: 0.323


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [09:31<04:07, 41.25s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.323
[15,   601] loss: 0.322


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [10:13<03:27, 41.45s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.322
[16,   601] loss: 0.321


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [10:56<02:47, 41.83s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.322
[17,   601] loss: 0.321


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [11:37<02:04, 41.53s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.321
[18,   601] loss: 0.320


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [12:17<01:22, 41.31s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.320
[19,   601] loss: 0.319


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [12:58<00:41, 41.05s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.319
[20,   601] loss: 0.318


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [13:39<00:00, 40.96s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:40<12:43, 40.18s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.344
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [01:19<11:59, 39.96s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.342
[3,   601] loss: 0.341


 15%|████████████▍                                                                      | 3/20 [02:00<11:22, 40.13s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.339
[4,   601] loss: 0.339


 20%|████████████████▌                                                                  | 4/20 [02:40<10:40, 40.01s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.337
[5,   601] loss: 0.336


 25%|████████████████████▊                                                              | 5/20 [03:19<09:58, 39.92s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.334
[6,   601] loss: 0.333


 30%|████████████████████████▉                                                          | 6/20 [03:59<09:18, 39.89s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.331
[7,   601] loss: 0.330


 35%|█████████████████████████████                                                      | 7/20 [04:39<08:37, 39.82s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.329
[8,   601] loss: 0.328


 40%|█████████████████████████████████▏                                                 | 8/20 [05:19<07:59, 39.93s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.327
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [06:00<07:23, 40.35s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [06:41<06:44, 40.42s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [07:21<06:01, 40.21s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [08:01<05:20, 40.11s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.324
[13,   601] loss: 0.322


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [08:40<04:40, 40.06s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.321


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [09:21<04:00, 40.11s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.322
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [10:01<03:20, 40.09s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.321
[16,   601] loss: 0.320


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [10:43<02:42, 40.61s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.320
[17,   601] loss: 0.319


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [11:23<02:01, 40.43s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.319
[18,   601] loss: 0.318


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [12:03<01:20, 40.44s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.318
[19,   601] loss: 0.317


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [12:43<00:40, 40.34s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.317
[20,   601] loss: 0.317


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [13:23<00:00, 40.19s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:22<07:14, 22.89s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:45<06:49, 22.73s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.343


 15%|████████████▍                                                                      | 3/20 [01:08<06:26, 22.71s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.341
[4,   601] loss: 0.340


 20%|████████████████▌                                                                  | 4/20 [01:30<06:03, 22.71s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.337
[5,   601] loss: 0.336


 25%|████████████████████▊                                                              | 5/20 [01:53<05:40, 22.69s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.334
[6,   601] loss: 0.332


 30%|████████████████████████▉                                                          | 6/20 [02:16<05:18, 22.74s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.331
[7,   601] loss: 0.329


 35%|█████████████████████████████                                                      | 7/20 [02:39<04:55, 22.74s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.329
[8,   601] loss: 0.328


 40%|█████████████████████████████████▏                                                 | 8/20 [03:06<04:49, 24.12s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.327
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [03:29<04:20, 23.71s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [03:51<03:53, 23.36s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [04:14<03:28, 23.21s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.325
[12,   601] loss: 0.324


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:36<03:03, 22.99s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.324
[13,   601] loss: 0.323


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:59<02:40, 22.99s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.322


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [05:22<02:17, 22.87s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.323
[15,   601] loss: 0.322


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:45<01:53, 22.79s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.322
[16,   601] loss: 0.321


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [06:07<01:31, 22.76s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.322
[17,   601] loss: 0.320


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:30<01:08, 22.74s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.321
[18,   601] loss: 0.320


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:53<00:45, 22.74s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.320
[19,   601] loss: 0.319


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [07:16<00:22, 22.85s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.320
[20,   601] loss: 0.319


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:38<00:00, 22.95s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:22<07:02, 22.23s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:44<06:40, 22.27s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.343


 15%|████████████▍                                                                      | 3/20 [01:06<06:17, 22.18s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.341
[4,   601] loss: 0.340


 20%|████████████████▌                                                                  | 4/20 [01:28<05:53, 22.09s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.338
[5,   601] loss: 0.337


 25%|████████████████████▊                                                              | 5/20 [01:51<05:33, 22.24s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.335
[6,   601] loss: 0.334


 30%|████████████████████████▉                                                          | 6/20 [02:12<05:09, 22.12s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.332
[7,   601] loss: 0.330


 35%|█████████████████████████████                                                      | 7/20 [02:35<04:48, 22.17s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.329
[8,   601] loss: 0.328


 40%|█████████████████████████████████▏                                                 | 8/20 [02:57<04:25, 22.09s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.328
[9,   601] loss: 0.327


 45%|█████████████████████████████████████▎                                             | 9/20 [03:19<04:02, 22.08s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.327
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [03:41<03:40, 22.03s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.326
[11,   601] loss: 0.325


 55%|█████████████████████████████████████████████                                     | 11/20 [04:03<03:17, 22.00s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.325
[12,   601] loss: 0.324


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:25<02:57, 22.13s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.324
[13,   601] loss: 0.323


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:47<02:34, 22.07s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.322


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [05:09<02:12, 22.06s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.322
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:31<01:49, 22.00s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.322
[16,   601] loss: 0.321


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:53<01:28, 22.10s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.321
[17,   601] loss: 0.320


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:15<01:06, 22.03s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.320
[18,   601] loss: 0.320


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:37<00:44, 22.02s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.320
[19,   601] loss: 0.319


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [07:00<00:22, 22.33s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.319
[20,   601] loss: 0.319


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:22<00:00, 22.14s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:21<06:47, 21.45s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:42<06:25, 21.42s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.344
[3,   601] loss: 0.343


 15%|████████████▍                                                                      | 3/20 [01:04<06:05, 21.49s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.342
[4,   601] loss: 0.341


 20%|████████████████▌                                                                  | 4/20 [01:25<05:43, 21.47s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.339
[5,   601] loss: 0.338


 25%|████████████████████▊                                                              | 5/20 [01:47<05:23, 21.59s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.335
[6,   601] loss: 0.333


 30%|████████████████████████▉                                                          | 6/20 [02:09<05:01, 21.55s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.331
[7,   601] loss: 0.330


 35%|█████████████████████████████                                                      | 7/20 [02:30<04:39, 21.51s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.329
[8,   601] loss: 0.327


 40%|█████████████████████████████████▏                                                 | 8/20 [02:51<04:17, 21.44s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.327
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [03:13<03:55, 21.44s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.324


 50%|█████████████████████████████████████████                                         | 10/20 [03:34<03:34, 21.44s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.324
[11,   601] loss: 0.323


 55%|█████████████████████████████████████████████                                     | 11/20 [03:55<03:12, 21.39s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.323
[12,   601] loss: 0.322


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:17<02:50, 21.34s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.322
[13,   601] loss: 0.321


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:39<02:30, 21.50s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.321
[14,   601] loss: 0.320


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [05:00<02:09, 21.54s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.320
[15,   601] loss: 0.319


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:22<01:47, 21.49s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.319
[16,   601] loss: 0.318


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:43<01:25, 21.45s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.319
[17,   601] loss: 0.318


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:05<01:04, 21.49s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.318
[18,   601] loss: 0.317


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:26<00:42, 21.47s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.317
[19,   601] loss: 0.317


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:48<00:21, 21.57s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.317
[20,   601] loss: 0.316


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:10<00:00, 21.52s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:21<06:48, 21.51s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:42<06:24, 21.35s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.343


 15%|████████████▍                                                                      | 3/20 [01:03<06:01, 21.26s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.341
[4,   601] loss: 0.340


 20%|████████████████▌                                                                  | 4/20 [01:24<05:38, 21.17s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.338
[5,   601] loss: 0.337


 25%|████████████████████▊                                                              | 5/20 [01:46<05:18, 21.20s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.335
[6,   601] loss: 0.333


 30%|████████████████████████▉                                                          | 6/20 [02:07<04:55, 21.13s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.332
[7,   601] loss: 0.331


 35%|█████████████████████████████                                                      | 7/20 [02:28<04:34, 21.14s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.330
[8,   601] loss: 0.329


 40%|█████████████████████████████████▏                                                 | 8/20 [02:49<04:14, 21.19s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.329
[9,   601] loss: 0.328


 45%|█████████████████████████████████████▎                                             | 9/20 [03:10<03:52, 21.18s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.327
[10,   601] loss: 0.326


 50%|█████████████████████████████████████████                                         | 10/20 [03:32<03:33, 21.33s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.326
[11,   601] loss: 0.325


 55%|█████████████████████████████████████████████                                     | 11/20 [03:54<03:13, 21.45s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.325
[12,   601] loss: 0.324


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:15<02:50, 21.32s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.325
[13,   601] loss: 0.324


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:36<02:29, 21.35s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.324
[14,   601] loss: 0.323


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:57<02:07, 21.29s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.323
[15,   601] loss: 0.322


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:18<01:46, 21.22s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.323
[16,   601] loss: 0.322


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:39<01:24, 21.19s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.322
[17,   601] loss: 0.321


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:01<01:03, 21.21s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.321
[18,   601] loss: 0.320


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:22<00:42, 21.29s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.320
[19,   601] loss: 0.319


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:43<00:21, 21.28s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.320
[20,   601] loss: 0.319


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:04<00:00, 21.25s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:12<03:54, 12.33s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.344
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:24<03:42, 12.36s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.342
[3,   601] loss: 0.342


 15%|████████████▍                                                                      | 3/20 [00:37<03:30, 12.39s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.339
[4,   601] loss: 0.338


 20%|████████████████▌                                                                  | 4/20 [00:49<03:18, 12.39s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.335
[5,   601] loss: 0.333


 25%|████████████████████▊                                                              | 5/20 [01:01<03:04, 12.33s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.331
[6,   601] loss: 0.330


 30%|████████████████████████▉                                                          | 6/20 [01:14<02:52, 12.35s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.329
[7,   601] loss: 0.328


 35%|█████████████████████████████                                                      | 7/20 [01:26<02:40, 12.32s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.327
[8,   601] loss: 0.326


 40%|█████████████████████████████████▏                                                 | 8/20 [01:38<02:28, 12.34s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.326
[9,   601] loss: 0.325


 45%|█████████████████████████████████████▎                                             | 9/20 [01:51<02:15, 12.34s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.325
[10,   601] loss: 0.324


 50%|█████████████████████████████████████████                                         | 10/20 [02:03<02:03, 12.32s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [02:15<01:50, 12.33s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [02:28<01:39, 12.39s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.323
[13,   601] loss: 0.322


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:40<01:27, 12.48s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.322


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:53<01:14, 12.43s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.322
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [03:05<01:01, 12.38s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.321
[16,   601] loss: 0.320


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [03:18<00:49, 12.40s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.321
[17,   601] loss: 0.320


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [03:30<00:37, 12.37s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.320
[18,   601] loss: 0.319


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [03:42<00:24, 12.41s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.320
[19,   601] loss: 0.319


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:55<00:12, 12.39s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.319
[20,   601] loss: 0.318


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [04:07<00:00, 12.37s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:12<03:51, 12.21s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.344
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:24<03:38, 12.13s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.342


 15%|████████████▍                                                                      | 3/20 [00:36<03:28, 12.25s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.339
[4,   601] loss: 0.338


 20%|████████████████▌                                                                  | 4/20 [00:48<03:15, 12.20s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.335
[5,   601] loss: 0.333


 25%|████████████████████▊                                                              | 5/20 [01:00<03:01, 12.12s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.331
[6,   601] loss: 0.330


 30%|████████████████████████▉                                                          | 6/20 [01:12<02:49, 12.09s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.329
[7,   601] loss: 0.328


 35%|█████████████████████████████                                                      | 7/20 [01:25<02:38, 12.21s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.328
[8,   601] loss: 0.327


 40%|█████████████████████████████████▏                                                 | 8/20 [01:37<02:25, 12.16s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.326
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [01:49<02:13, 12.13s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [02:01<02:00, 12.09s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [02:13<01:48, 12.08s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [02:25<01:36, 12.07s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.323
[13,   601] loss: 0.322


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:37<01:25, 12.14s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.322
[14,   601] loss: 0.321


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:49<01:12, 12.12s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.321
[15,   601] loss: 0.320


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [03:02<01:00, 12.15s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.320
[16,   601] loss: 0.319


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [03:14<00:48, 12.11s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.319
[17,   601] loss: 0.319


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [03:26<00:36, 12.16s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.319
[18,   601] loss: 0.318


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [03:38<00:24, 12.18s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.318
[19,   601] loss: 0.317


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:50<00:12, 12.15s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.317
[20,   601] loss: 0.317


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [04:02<00:00, 12.14s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:11<03:40, 11.62s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:23<03:30, 11.72s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.344
[3,   601] loss: 0.343


 15%|████████████▍                                                                      | 3/20 [00:35<03:20, 11.79s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.341
[4,   601] loss: 0.340


 20%|████████████████▌                                                                  | 4/20 [00:46<03:07, 11.72s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.338
[5,   601] loss: 0.336


 25%|████████████████████▊                                                              | 5/20 [00:58<02:55, 11.72s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.334
[6,   601] loss: 0.332


 30%|████████████████████████▉                                                          | 6/20 [01:10<02:43, 11.68s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.330
[7,   601] loss: 0.329


 35%|█████████████████████████████                                                      | 7/20 [01:21<02:31, 11.69s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.328
[8,   601] loss: 0.327


 40%|█████████████████████████████████▏                                                 | 8/20 [01:33<02:19, 11.65s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.327
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [01:45<02:07, 11.62s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [01:56<01:55, 11.60s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [02:08<01:44, 11.60s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [02:19<01:32, 11.60s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.323
[13,   601] loss: 0.322


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:31<01:21, 11.69s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.322
[14,   601] loss: 0.321


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:43<01:10, 11.68s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.321
[15,   601] loss: 0.320


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:54<00:58, 11.64s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.320
[16,   601] loss: 0.319


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [03:06<00:47, 11.76s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.319
[17,   601] loss: 0.318


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [03:18<00:35, 11.72s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.318
[18,   601] loss: 0.318


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [03:30<00:23, 11.69s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.318
[19,   601] loss: 0.317


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:41<00:11, 11.66s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.317
[20,   601] loss: 0.317


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:53<00:00, 11.67s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:11<03:40, 11.59s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:23<03:30, 11.67s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.344
[3,   601] loss: 0.343


 15%|████████████▍                                                                      | 3/20 [00:35<03:21, 11.83s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.342
[4,   601] loss: 0.341


 20%|████████████████▌                                                                  | 4/20 [00:46<03:07, 11.71s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.339
[5,   601] loss: 0.337


 25%|████████████████████▊                                                              | 5/20 [00:58<02:54, 11.65s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.336
[6,   601] loss: 0.335


 30%|████████████████████████▉                                                          | 6/20 [01:09<02:42, 11.59s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.333
[7,   601] loss: 0.332


 35%|█████████████████████████████                                                      | 7/20 [01:21<02:31, 11.66s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.331
[8,   601] loss: 0.330


 40%|█████████████████████████████████▏                                                 | 8/20 [01:33<02:19, 11.61s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.330
[9,   601] loss: 0.328


 45%|█████████████████████████████████████▎                                             | 9/20 [01:44<02:07, 11.57s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.328
[10,   601] loss: 0.327


 50%|█████████████████████████████████████████                                         | 10/20 [01:56<01:55, 11.60s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.327
[11,   601] loss: 0.326


 55%|█████████████████████████████████████████████                                     | 11/20 [02:08<01:44, 11.66s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.326
[12,   601] loss: 0.325


 60%|█████████████████████████████████████████████████▏                                | 12/20 [02:19<01:32, 11.59s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.325
[13,   601] loss: 0.324


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:31<01:21, 11.62s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.324
[14,   601] loss: 0.322


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:42<01:09, 11.62s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.323
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:54<00:58, 11.63s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.322
[16,   601] loss: 0.320


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [03:05<00:46, 11.56s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.321
[17,   601] loss: 0.319


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [03:17<00:34, 11.52s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.320
[18,   601] loss: 0.319


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [03:28<00:23, 11.56s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.319
[19,   601] loss: 0.318


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:40<00:11, 11.56s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.318
[20,   601] loss: 0.317


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:52<00:00, 11.60s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:08<02:49,  8.92s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.344
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:17<02:39,  8.86s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.342


 15%|████████████▍                                                                      | 3/20 [00:26<02:31,  8.89s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.340
[4,   601] loss: 0.338


 20%|████████████████▌                                                                  | 4/20 [00:35<02:22,  8.88s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.335
[5,   601] loss: 0.333


 25%|████████████████████▊                                                              | 5/20 [00:47<02:32, 10.17s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.331
[6,   601] loss: 0.330


 30%|████████████████████████▉                                                          | 6/20 [00:59<02:26, 10.47s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.329
[7,   601] loss: 0.328


 35%|█████████████████████████████                                                      | 7/20 [01:17<02:51, 13.21s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.327
[8,   601] loss: 0.327


 40%|█████████████████████████████████▏                                                 | 8/20 [01:37<03:04, 15.35s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.326
[9,   601] loss: 0.325


 45%|█████████████████████████████████████▎                                             | 9/20 [01:48<02:32, 13.84s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [01:59<02:10, 13.10s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [02:18<02:13, 14.88s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [02:31<01:53, 14.14s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.323
[13,   601] loss: 0.322


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:44<01:36, 13.85s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.321


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:55<01:18, 13.04s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.322
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [03:06<01:01, 12.29s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.321
[16,   601] loss: 0.319


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [03:16<00:47, 11.83s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.320
[17,   601] loss: 0.318


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [03:26<00:33, 11.22s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.319
[18,   601] loss: 0.317


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [03:37<00:22, 11.04s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.318
[19,   601] loss: 0.317


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:48<00:11, 11.07s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.317
[20,   601] loss: 0.316


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:58<00:00, 11.94s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<03:02,  9.61s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:18<02:50,  9.46s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.342


 15%|████████████▍                                                                      | 3/20 [00:28<02:44,  9.69s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.341
[4,   601] loss: 0.340


 20%|████████████████▌                                                                  | 4/20 [00:38<02:36,  9.76s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.338
[5,   601] loss: 0.337


 25%|████████████████████▊                                                              | 5/20 [00:48<02:28,  9.91s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.335
[6,   601] loss: 0.333


 30%|████████████████████████▉                                                          | 6/20 [01:00<02:24, 10.31s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.331
[7,   601] loss: 0.330


 35%|█████████████████████████████                                                      | 7/20 [01:09<02:10, 10.07s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.329
[8,   601] loss: 0.328


 40%|█████████████████████████████████▏                                                 | 8/20 [01:19<01:58,  9.90s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.327
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [01:28<01:47,  9.74s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [01:38<01:36,  9.65s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.326
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [01:47<01:25,  9.52s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.325
[12,   601] loss: 0.324


 60%|█████████████████████████████████████████████████▏                                | 12/20 [01:56<01:15,  9.49s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.324
[13,   601] loss: 0.323


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:06<01:06,  9.45s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.322


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:15<00:57,  9.54s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.322
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:25<00:47,  9.53s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.322
[16,   601] loss: 0.321


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:34<00:38,  9.51s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.321
[17,   601] loss: 0.320


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [02:44<00:28,  9.49s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.320
[18,   601] loss: 0.319


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [02:53<00:18,  9.46s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.319
[19,   601] loss: 0.318


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:02<00:09,  9.43s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.318
[20,   601] loss: 0.317


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:12<00:00,  9.62s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<02:54,  9.17s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.344
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:19<02:52,  9.58s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.342
[3,   601] loss: 0.341


 15%|████████████▍                                                                      | 3/20 [00:30<02:54, 10.25s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.339
[4,   601] loss: 0.338


 20%|████████████████▌                                                                  | 4/20 [00:39<02:39,  9.99s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.336
[5,   601] loss: 0.334


 25%|████████████████████▊                                                              | 5/20 [00:49<02:27,  9.83s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.332
[6,   601] loss: 0.331


 30%|████████████████████████▉                                                          | 6/20 [00:58<02:15,  9.71s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.329
[7,   601] loss: 0.328


 35%|█████████████████████████████                                                      | 7/20 [01:07<02:04,  9.58s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.328
[8,   601] loss: 0.327


 40%|█████████████████████████████████▏                                                 | 8/20 [01:17<01:55,  9.59s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.327
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [01:27<01:45,  9.56s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [01:36<01:35,  9.51s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [01:45<01:24,  9.38s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [01:54<01:14,  9.25s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.324
[13,   601] loss: 0.323


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:03<01:03,  9.08s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.322


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:12<00:54,  9.11s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.322
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:21<00:45,  9.11s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.322
[16,   601] loss: 0.320


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:32<00:38,  9.58s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.321
[17,   601] loss: 0.320


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [02:42<00:29,  9.73s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.320
[18,   601] loss: 0.319


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [02:52<00:19,  9.77s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.319
[19,   601] loss: 0.318


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:02<00:09,  9.98s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.318
[20,   601] loss: 0.317


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:14<00:00,  9.72s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<03:02,  9.61s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.344


 10%|████████▎                                                                          | 2/20 [00:19<02:59,  9.98s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.343
[3,   601] loss: 0.342


 15%|████████████▍                                                                      | 3/20 [00:30<02:53, 10.19s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.340
[4,   601] loss: 0.339


 20%|████████████████▌                                                                  | 4/20 [00:40<02:40, 10.00s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.336
[5,   601] loss: 0.335


 25%|████████████████████▊                                                              | 5/20 [00:49<02:28,  9.92s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.332
[6,   601] loss: 0.331


 30%|████████████████████████▉                                                          | 6/20 [00:59<02:17,  9.84s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.330
[7,   601] loss: 0.329


 35%|█████████████████████████████                                                      | 7/20 [01:09<02:08,  9.86s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.328
[8,   601] loss: 0.327


 40%|█████████████████████████████████▏                                                 | 8/20 [01:22<02:09, 10.80s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.327
[9,   601] loss: 0.326


 45%|█████████████████████████████████████▎                                             | 9/20 [01:32<01:56, 10.61s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.326
[10,   601] loss: 0.325


 50%|█████████████████████████████████████████                                         | 10/20 [01:41<01:40, 10.10s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.325
[11,   601] loss: 0.324


 55%|█████████████████████████████████████████████                                     | 11/20 [01:50<01:29,  9.90s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.324
[12,   601] loss: 0.323


 60%|█████████████████████████████████████████████████▏                                | 12/20 [02:00<01:19,  9.88s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.323
[13,   601] loss: 0.322


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:09<01:07,  9.63s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.323
[14,   601] loss: 0.321


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:18<00:57,  9.53s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.322
[15,   601] loss: 0.321


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:28<00:47,  9.50s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.321
[16,   601] loss: 0.320


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:37<00:37,  9.42s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.320
[17,   601] loss: 0.319


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [02:47<00:28,  9.58s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.319
[18,   601] loss: 0.318


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [02:56<00:18,  9.43s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.318
[19,   601] loss: 0.317


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:06<00:09,  9.40s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.318
[20,   601] loss: 0.317


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:15<00:00,  9.76s/it]


In [7]:
#обучим 5-слойные НС
errs_5l = []
mdls_5l = []
err_best = np.Inf #наименьшее достигнутое значение ошибки на тестовой выборке

#обучим 5-слойные сети
l2 = [576, 320, 128]
l3 = [224, 160, 128]
l4 = [96, 64]

#определим размер пакета
batch_size = 64
batches = int(np.ceil(smpls_train/batch_size))

for l2_ in l2:
    for l3_ in l3:
        for l4_ in l4:
            net = Model_5l([size_in, l2_, l3_, l4_, size_out])

            for epoch in tqdm(range(20)):  
                running_loss = 0.0
                for i in range(batches):
                    if i+1 != batches:
                        inputs = X_train[i*batch_size:(i+1)*batch_size, :]
                        labels = y_train[i*batch_size:(i+1)*batch_size, :]
                    else:
                        inputs1 = X_train[i*batch_size:smpls_train, :]
                        labels1 = y_train[i*batch_size:smpls_train, :]

                        resid = batch_size - (smpls_train - i*batch_size)

                        inputs2 = X_train[0:resid, :]
                        labels2 = y_train[0:resid, :]

                        inputs = torch.cat((inputs1,inputs2))
                        labels = torch.cat((labels1,labels2))

                        del inputs1, labels1, inputs2, labels2

                    # обнуляем градиент
                    net.opt.zero_grad()

                    #inputs = inputs.reshape((inputs.shape[0],3072)) #переводим образцы в векторы
                    #inputs = inputs/255 #и нормируем

                    outputs = net(inputs)
                    loss = net.criterion(outputs, labels)
                    loss.backward()
                    net.opt.step()

                    # выводим статистику о процессе обучения
                    running_loss += loss.item()
                    if i % 300 == 0:    # печатаем каждые 300 mini-batches
                        print('[%d, %5d] loss: %.3f' %
                              (epoch + 1, i + 1, running_loss / 2000)) # откуда 2000?
                        running_loss = 0.0



            #вычисление ошибки на тестовом наборе данных
            y_pred = net(X_test)
            loss_test = net.criterion(y_pred, y_test).item()

            if loss_test<err_best: #сохраняем только лучшие сети на данный момент
                errs_5l.append(loss_test)
                mdls_5l.append(net)
                err_best = loss_test

  return fnc.softmax(self.lay45(x))


[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:37<12:01, 37.99s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [01:14<11:12, 37.34s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:51<10:30, 37.11s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.344


 20%|████████████████▌                                                                  | 4/20 [02:29<09:58, 37.42s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.344
[5,   601] loss: 0.343


 25%|████████████████████▊                                                              | 5/20 [03:07<09:22, 37.53s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.342
[6,   601] loss: 0.341


 30%|████████████████████████▉                                                          | 6/20 [03:45<08:48, 37.76s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.340
[7,   601] loss: 0.339


 35%|█████████████████████████████                                                      | 7/20 [04:24<08:16, 38.18s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.338
[8,   601] loss: 0.337


 40%|█████████████████████████████████▏                                                 | 8/20 [05:04<07:44, 38.68s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.335
[9,   601] loss: 0.334


 45%|█████████████████████████████████████▎                                             | 9/20 [05:41<06:58, 38.07s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.333
[10,   601] loss: 0.331


 50%|█████████████████████████████████████████                                         | 10/20 [06:18<06:17, 37.73s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.330
[11,   601] loss: 0.330


 55%|█████████████████████████████████████████████                                     | 11/20 [06:56<05:41, 37.95s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.329
[12,   601] loss: 0.328


 60%|█████████████████████████████████████████████████▏                                | 12/20 [07:34<05:04, 38.09s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.328
[13,   601] loss: 0.327


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [08:15<04:31, 38.75s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.327
[14,   601] loss: 0.326


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [08:52<03:50, 38.46s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.326
[15,   601] loss: 0.325


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [09:29<03:09, 37.97s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.325
[16,   601] loss: 0.324


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [10:08<02:32, 38.07s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.325
[17,   601] loss: 0.324


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [10:49<01:57, 39.21s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.324
[18,   601] loss: 0.323


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [11:31<01:20, 40.06s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.323


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [12:13<00:40, 40.47s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.323
[20,   601] loss: 0.322


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [12:55<00:00, 38.75s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:41<13:03, 41.26s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [01:17<11:33, 38.53s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:58<11:09, 39.40s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [02:36<10:20, 38.75s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.344
[5,   601] loss: 0.344


 25%|████████████████████▊                                                              | 5/20 [03:13<09:34, 38.30s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.343
[6,   601] loss: 0.342


 30%|████████████████████████▉                                                          | 6/20 [03:52<08:57, 38.36s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.341
[7,   601] loss: 0.340


 35%|█████████████████████████████                                                      | 7/20 [04:29<08:16, 38.19s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.338
[8,   601] loss: 0.337


 40%|█████████████████████████████████▏                                                 | 8/20 [05:08<07:40, 38.35s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.335
[9,   601] loss: 0.334


 45%|█████████████████████████████████████▎                                             | 9/20 [05:44<06:54, 37.70s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.333
[10,   601] loss: 0.331


 50%|█████████████████████████████████████████                                         | 10/20 [06:21<06:13, 37.36s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.330
[11,   601] loss: 0.329


 55%|█████████████████████████████████████████████                                     | 11/20 [06:58<05:35, 37.24s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.329
[12,   601] loss: 0.328


 60%|█████████████████████████████████████████████████▏                                | 12/20 [07:34<04:55, 36.91s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.327
[13,   601] loss: 0.326


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [08:11<04:17, 36.83s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.326
[14,   601] loss: 0.325


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [08:47<03:39, 36.58s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.325
[15,   601] loss: 0.325


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [09:24<03:04, 36.92s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.325
[16,   601] loss: 0.324


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [10:04<02:31, 37.79s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.324
[17,   601] loss: 0.324


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [10:41<01:52, 37.43s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.324
[18,   601] loss: 0.323


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [11:18<01:14, 37.33s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.323
[19,   601] loss: 0.323


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [11:56<00:37, 37.46s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.323
[20,   601] loss: 0.322


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [12:32<00:00, 37.64s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:36<11:28, 36.23s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [01:12<10:53, 36.32s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:49<10:21, 36.53s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [02:24<09:38, 36.13s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [03:00<08:59, 35.96s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.344


 30%|████████████████████████▉                                                          | 6/20 [03:36<08:22, 35.86s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.344
[7,   601] loss: 0.343


 35%|█████████████████████████████                                                      | 7/20 [04:11<07:44, 35.75s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.342
[8,   601] loss: 0.341


 40%|█████████████████████████████████▏                                                 | 8/20 [04:48<07:11, 35.93s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.339
[9,   601] loss: 0.338


 45%|█████████████████████████████████████▎                                             | 9/20 [05:23<06:35, 35.93s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.337
[10,   601] loss: 0.336


 50%|█████████████████████████████████████████                                         | 10/20 [06:00<06:00, 36.03s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.335
[11,   601] loss: 0.334


 55%|█████████████████████████████████████████████                                     | 11/20 [06:36<05:25, 36.20s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.333
[12,   601] loss: 0.332


 60%|█████████████████████████████████████████████████▏                                | 12/20 [07:13<04:49, 36.19s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.331
[13,   601] loss: 0.330


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [07:48<04:12, 36.13s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.329
[14,   601] loss: 0.328


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [08:23<03:34, 35.78s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.328
[15,   601] loss: 0.327


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [08:58<02:56, 35.26s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.327
[16,   601] loss: 0.326


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [09:32<02:20, 35.05s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.326
[17,   601] loss: 0.325


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [10:07<01:45, 35.05s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [10:43<01:10, 35.43s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.324


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [11:20<00:35, 35.62s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.324
[20,   601] loss: 0.323


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [11:55<00:00, 35.80s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:35<11:22, 35.94s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [01:13<11:04, 36.91s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:50<10:26, 36.86s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [02:27<09:51, 36.98s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [03:03<09:10, 36.72s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.344
[6,   601] loss: 0.344


 30%|████████████████████████▉                                                          | 6/20 [03:40<08:32, 36.59s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.343
[7,   601] loss: 0.342


 35%|█████████████████████████████                                                      | 7/20 [04:17<07:57, 36.73s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.341
[8,   601] loss: 0.340


 40%|█████████████████████████████████▏                                                 | 8/20 [04:54<07:21, 36.83s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.339
[9,   601] loss: 0.339


 45%|█████████████████████████████████████▎                                             | 9/20 [05:30<06:44, 36.76s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.337
[10,   601] loss: 0.337


 50%|█████████████████████████████████████████                                         | 10/20 [06:07<06:06, 36.68s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.335
[11,   601] loss: 0.335


 55%|█████████████████████████████████████████████                                     | 11/20 [06:43<05:29, 36.64s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.333
[12,   601] loss: 0.332


 60%|█████████████████████████████████████████████████▏                                | 12/20 [07:19<04:51, 36.44s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.331
[13,   601] loss: 0.330


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [07:55<04:14, 36.30s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.329
[14,   601] loss: 0.328


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [08:32<03:38, 36.42s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.328
[15,   601] loss: 0.327


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [09:08<03:01, 36.39s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.327
[16,   601] loss: 0.326


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [09:45<02:26, 36.59s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.326
[17,   601] loss: 0.325


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [10:21<01:49, 36.37s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [10:57<01:12, 36.26s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.323


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [11:34<00:36, 36.53s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.323
[20,   601] loss: 0.322


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [12:11<00:00, 36.56s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:36<11:24, 36.02s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [01:13<11:07, 37.07s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:51<10:31, 37.15s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [02:26<09:40, 36.28s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.344
[5,   601] loss: 0.344


 25%|████████████████████▊                                                              | 5/20 [03:02<09:06, 36.45s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.343
[6,   601] loss: 0.343


 30%|████████████████████████▉                                                          | 6/20 [03:40<08:34, 36.78s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.342
[7,   601] loss: 0.341


 35%|█████████████████████████████                                                      | 7/20 [04:17<08:01, 37.00s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.340
[8,   601] loss: 0.338


 40%|█████████████████████████████████▏                                                 | 8/20 [04:53<07:20, 36.71s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.337
[9,   601] loss: 0.335


 45%|█████████████████████████████████████▎                                             | 9/20 [05:30<06:42, 36.62s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.334
[10,   601] loss: 0.333


 50%|█████████████████████████████████████████                                         | 10/20 [06:06<06:04, 36.45s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.332
[11,   601] loss: 0.331


 55%|█████████████████████████████████████████████                                     | 11/20 [06:44<05:34, 37.12s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.330
[12,   601] loss: 0.329


 60%|█████████████████████████████████████████████████▏                                | 12/20 [07:28<05:13, 39.21s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.329
[13,   601] loss: 0.328


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [08:07<04:33, 39.06s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.328
[14,   601] loss: 0.327


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [08:42<03:46, 37.75s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.327
[15,   601] loss: 0.326


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [09:14<03:00, 36.08s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.326
[16,   601] loss: 0.326


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [09:46<02:19, 34.97s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.326
[17,   601] loss: 0.325


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [10:19<01:42, 34.12s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [10:51<01:06, 33.50s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.325
[19,   601] loss: 0.324


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [11:23<00:33, 33.32s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.324
[20,   601] loss: 0.323


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [11:56<00:00, 35.80s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:32<10:11, 32.16s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [01:04<09:38, 32.13s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:36<09:10, 32.40s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.344
[4,   601] loss: 0.344


 20%|████████████████▌                                                                  | 4/20 [02:08<08:35, 32.23s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.343
[5,   601] loss: 0.343


 25%|████████████████████▊                                                              | 5/20 [02:41<08:05, 32.37s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.341
[6,   601] loss: 0.340


 30%|████████████████████████▉                                                          | 6/20 [03:13<07:31, 32.24s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.338
[7,   601] loss: 0.337


 35%|█████████████████████████████                                                      | 7/20 [03:46<07:00, 32.35s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.336
[8,   601] loss: 0.335


 40%|█████████████████████████████████▏                                                 | 8/20 [04:18<06:28, 32.38s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.334
[9,   601] loss: 0.332


 45%|█████████████████████████████████████▎                                             | 9/20 [04:50<05:54, 32.26s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.331
[10,   601] loss: 0.330


 50%|█████████████████████████████████████████                                         | 10/20 [05:22<05:22, 32.23s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.329
[11,   601] loss: 0.328


 55%|█████████████████████████████████████████████                                     | 11/20 [05:54<04:49, 32.19s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.327
[12,   601] loss: 0.326


 60%|█████████████████████████████████████████████████▏                                | 12/20 [06:27<04:18, 32.31s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.326
[13,   601] loss: 0.325


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [07:00<03:47, 32.47s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.325
[14,   601] loss: 0.325


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [07:32<03:14, 32.48s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.325
[15,   601] loss: 0.324


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [08:04<02:41, 32.30s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.324
[16,   601] loss: 0.323


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [08:36<02:08, 32.19s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.324
[17,   601] loss: 0.323


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [09:08<01:36, 32.06s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.323
[18,   601] loss: 0.322


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [09:40<01:04, 32.09s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.323
[19,   601] loss: 0.321


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [10:12<00:32, 32.15s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.322
[20,   601] loss: 0.321


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [10:44<00:00, 32.24s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:20<06:25, 20.29s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:41<06:11, 20.66s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:01<05:48, 20.52s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:21<05:26, 20.40s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.344
[5,   601] loss: 0.344


 25%|████████████████████▊                                                              | 5/20 [01:41<05:04, 20.33s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.343
[6,   601] loss: 0.342


 30%|████████████████████████▉                                                          | 6/20 [02:02<04:45, 20.38s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.341
[7,   601] loss: 0.340


 35%|█████████████████████████████                                                      | 7/20 [02:22<04:23, 20.28s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.338
[8,   601] loss: 0.338


 40%|█████████████████████████████████▏                                                 | 8/20 [02:43<04:04, 20.38s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.336
[9,   601] loss: 0.336


 45%|█████████████████████████████████████▎                                             | 9/20 [03:03<03:44, 20.37s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.334
[10,   601] loss: 0.333


 50%|█████████████████████████████████████████                                         | 10/20 [03:23<03:22, 20.27s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.331
[11,   601] loss: 0.330


 55%|█████████████████████████████████████████████                                     | 11/20 [03:44<03:04, 20.48s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.329
[12,   601] loss: 0.328


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:04<02:42, 20.34s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.327
[13,   601] loss: 0.326


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:24<02:21, 20.24s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.326
[14,   601] loss: 0.325


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:45<02:01, 20.32s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.326
[15,   601] loss: 0.325


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:05<01:41, 20.27s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.325
[16,   601] loss: 0.324


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:25<01:21, 20.27s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.324
[17,   601] loss: 0.323


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [05:45<01:00, 20.23s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.324
[18,   601] loss: 0.323


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:05<00:40, 20.19s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.323
[19,   601] loss: 0.322


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:25<00:20, 20.14s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.323
[20,   601] loss: 0.322


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [06:46<00:00, 20.32s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:20<06:22, 20.12s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:40<06:03, 20.18s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:00<05:42, 20.14s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:20<05:21, 20.07s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.344


 25%|████████████████████▊                                                              | 5/20 [01:40<05:01, 20.07s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.343
[6,   601] loss: 0.343


 30%|████████████████████████▉                                                          | 6/20 [02:00<04:42, 20.17s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.341
[7,   601] loss: 0.341


 35%|█████████████████████████████                                                      | 7/20 [02:20<04:21, 20.08s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.339
[8,   601] loss: 0.339


 40%|█████████████████████████████████▏                                                 | 8/20 [02:40<04:00, 20.01s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.338
[9,   601] loss: 0.337


 45%|█████████████████████████████████████▎                                             | 9/20 [03:00<03:39, 19.98s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.336
[10,   601] loss: 0.336


 50%|█████████████████████████████████████████                                         | 10/20 [03:20<03:19, 19.96s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.335
[11,   601] loss: 0.334


 55%|█████████████████████████████████████████████                                     | 11/20 [03:40<02:59, 20.00s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.333
[12,   601] loss: 0.332


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:00<02:41, 20.15s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.331
[13,   601] loss: 0.330


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:20<02:20, 20.10s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.330
[14,   601] loss: 0.329


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:40<02:00, 20.03s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.328
[15,   601] loss: 0.327


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:01<01:40, 20.11s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.327
[16,   601] loss: 0.326


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:21<01:20, 20.10s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.326
[17,   601] loss: 0.325


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [05:41<01:00, 20.04s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:01<00:40, 20.14s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.323


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:21<00:20, 20.05s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.323
[20,   601] loss: 0.322


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [06:41<00:00, 20.06s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:19<06:16, 19.82s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:39<05:58, 19.91s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:59<05:37, 19.84s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:19<05:19, 19.94s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.344
[5,   601] loss: 0.344


 25%|████████████████████▊                                                              | 5/20 [01:39<04:56, 19.79s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.343
[6,   601] loss: 0.343


 30%|████████████████████████▉                                                          | 6/20 [01:59<04:37, 19.82s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.341
[7,   601] loss: 0.341


 35%|█████████████████████████████                                                      | 7/20 [02:18<04:17, 19.79s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.339
[8,   601] loss: 0.339


 40%|█████████████████████████████████▏                                                 | 8/20 [02:38<03:56, 19.70s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.338
[9,   601] loss: 0.337


 45%|█████████████████████████████████████▎                                             | 9/20 [02:57<03:35, 19.62s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.336
[10,   601] loss: 0.336


 50%|█████████████████████████████████████████                                         | 10/20 [03:17<03:17, 19.74s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.335
[11,   601] loss: 0.335


 55%|█████████████████████████████████████████████                                     | 11/20 [03:37<02:57, 19.67s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.333
[12,   601] loss: 0.332


 60%|█████████████████████████████████████████████████▏                                | 12/20 [03:56<02:37, 19.63s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.331
[13,   601] loss: 0.330


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:16<02:17, 19.63s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.329
[14,   601] loss: 0.328


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:35<01:57, 19.61s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.327
[15,   601] loss: 0.326


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [04:55<01:37, 19.57s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.326
[16,   601] loss: 0.325


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:16<01:19, 19.86s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.325
[17,   601] loss: 0.324


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [05:35<00:59, 19.85s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.323


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [05:55<00:39, 19.75s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.323


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:14<00:19, 19.67s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.323
[20,   601] loss: 0.322


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [06:34<00:00, 19.72s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:19<06:14, 19.74s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:39<05:58, 19.89s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:59<05:35, 19.75s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:18<05:13, 19.62s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:38<04:54, 19.60s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.344


 30%|████████████████████████▉                                                          | 6/20 [01:58<04:35, 19.67s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.344
[7,   601] loss: 0.343


 35%|█████████████████████████████                                                      | 7/20 [02:17<04:14, 19.61s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.342
[8,   601] loss: 0.341


 40%|█████████████████████████████████▏                                                 | 8/20 [02:37<03:56, 19.68s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.339
[9,   601] loss: 0.338


 45%|█████████████████████████████████████▎                                             | 9/20 [02:57<03:37, 19.78s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.336
[10,   601] loss: 0.334


 50%|█████████████████████████████████████████                                         | 10/20 [03:17<03:19, 19.96s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.333
[11,   601] loss: 0.331


 55%|█████████████████████████████████████████████                                     | 11/20 [03:37<02:59, 19.92s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.330
[12,   601] loss: 0.329


 60%|█████████████████████████████████████████████████▏                                | 12/20 [03:56<02:37, 19.75s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.329
[13,   601] loss: 0.328


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:16<02:17, 19.60s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.328
[14,   601] loss: 0.327


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:36<01:58, 19.74s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.327
[15,   601] loss: 0.326


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [04:55<01:38, 19.72s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.326
[16,   601] loss: 0.326


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:15<01:18, 19.62s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.326
[17,   601] loss: 0.325


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [05:35<00:58, 19.64s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [05:54<00:39, 19.54s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.325
[19,   601] loss: 0.324


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:13<00:19, 19.52s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.324
[20,   601] loss: 0.323


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [06:33<00:00, 19.69s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:19<06:08, 19.42s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:38<05:48, 19.38s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:58<05:29, 19.39s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:17<05:09, 19.36s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.344
[5,   601] loss: 0.343


 25%|████████████████████▊                                                              | 5/20 [01:36<04:49, 19.29s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.342
[6,   601] loss: 0.342


 30%|████████████████████████▉                                                          | 6/20 [01:56<04:32, 19.47s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.340
[7,   601] loss: 0.340


 35%|█████████████████████████████                                                      | 7/20 [02:15<04:12, 19.40s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.339
[8,   601] loss: 0.339


 40%|█████████████████████████████████▏                                                 | 8/20 [02:35<03:53, 19.45s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.338
[9,   601] loss: 0.338


 45%|█████████████████████████████████████▎                                             | 9/20 [02:54<03:33, 19.43s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.337
[10,   601] loss: 0.337


 50%|█████████████████████████████████████████                                         | 10/20 [03:13<03:13, 19.38s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.336
[11,   601] loss: 0.336


 55%|█████████████████████████████████████████████                                     | 11/20 [03:33<02:53, 19.33s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.335
[12,   601] loss: 0.335


 60%|█████████████████████████████████████████████████▏                                | 12/20 [03:52<02:35, 19.45s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.334
[13,   601] loss: 0.333


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:12<02:16, 19.46s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.331
[14,   601] loss: 0.330


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:31<01:56, 19.37s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.329
[15,   601] loss: 0.328


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [04:50<01:36, 19.33s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.327
[16,   601] loss: 0.326


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:09<01:17, 19.29s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.326
[17,   601] loss: 0.325


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [05:29<00:58, 19.35s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [05:48<00:38, 19.29s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.325
[19,   601] loss: 0.324


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:08<00:19, 19.44s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.324
[20,   601] loss: 0.323


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [06:27<00:00, 19.38s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:19<06:06, 19.29s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:38<05:51, 19.53s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:58<05:31, 19.53s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:17<05:09, 19.36s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:37<04:52, 19.49s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.344
[6,   601] loss: 0.343


 30%|████████████████████████▉                                                          | 6/20 [01:56<04:30, 19.36s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.342
[7,   601] loss: 0.342


 35%|█████████████████████████████                                                      | 7/20 [02:15<04:11, 19.33s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.340
[8,   601] loss: 0.339


 40%|█████████████████████████████████▏                                                 | 8/20 [02:35<03:51, 19.32s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.338
[9,   601] loss: 0.337


 45%|█████████████████████████████████████▎                                             | 9/20 [02:54<03:31, 19.25s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.336
[10,   601] loss: 0.335


 50%|█████████████████████████████████████████                                         | 10/20 [03:13<03:11, 19.20s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.334
[11,   601] loss: 0.333


 55%|█████████████████████████████████████████████                                     | 11/20 [03:32<02:54, 19.34s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.332
[12,   601] loss: 0.331


 60%|█████████████████████████████████████████████████▏                                | 12/20 [03:51<02:34, 19.26s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.330
[13,   601] loss: 0.328


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:11<02:14, 19.21s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.328
[14,   601] loss: 0.327


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:30<01:55, 19.17s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.327
[15,   601] loss: 0.325


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [04:49<01:35, 19.14s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.326
[16,   601] loss: 0.324


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:08<01:16, 19.09s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.325
[17,   601] loss: 0.323


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [05:27<00:57, 19.22s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.324
[18,   601] loss: 0.323


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [05:46<00:38, 19.17s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.323
[19,   601] loss: 0.322


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:05<00:19, 19.12s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.322
[20,   601] loss: 0.321


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [06:24<00:00, 19.25s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<03:06,  9.80s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:19<02:56,  9.83s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:29<02:46,  9.80s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [00:39<02:36,  9.77s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.344


 25%|████████████████████▊                                                              | 5/20 [00:48<02:26,  9.74s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.344
[6,   601] loss: 0.343


 30%|████████████████████████▉                                                          | 6/20 [00:59<02:20, 10.03s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.342
[7,   601] loss: 0.341


 35%|█████████████████████████████                                                      | 7/20 [01:09<02:09,  9.93s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.339
[8,   601] loss: 0.339


 40%|█████████████████████████████████▏                                                 | 8/20 [01:18<01:58,  9.87s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.338
[9,   601] loss: 0.337


 45%|█████████████████████████████████████▎                                             | 9/20 [01:28<01:48,  9.82s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.336
[10,   601] loss: 0.335


 50%|█████████████████████████████████████████                                         | 10/20 [01:38<01:38,  9.81s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.334
[11,   601] loss: 0.333


 55%|█████████████████████████████████████████████                                     | 11/20 [01:48<01:28,  9.79s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.331
[12,   601] loss: 0.330


 60%|█████████████████████████████████████████████████▏                                | 12/20 [01:57<01:18,  9.79s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.330
[13,   601] loss: 0.329


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:07<01:08,  9.77s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.328
[14,   601] loss: 0.327


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:17<00:58,  9.76s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.327
[15,   601] loss: 0.326


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:27<00:50, 10.01s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.326
[16,   601] loss: 0.325


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:37<00:39,  9.94s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.325
[17,   601] loss: 0.324


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [02:47<00:29,  9.87s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [02:57<00:19,  9.83s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.323


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:07<00:09,  9.98s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.323
[20,   601] loss: 0.322


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:17<00:00,  9.86s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<03:02,  9.62s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:19<02:54,  9.71s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:29<02:44,  9.67s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [00:38<02:36,  9.77s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.344


 25%|████████████████████▊                                                              | 5/20 [00:48<02:27,  9.83s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.344
[6,   601] loss: 0.343


 30%|████████████████████████▉                                                          | 6/20 [00:58<02:16,  9.75s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.342
[7,   601] loss: 0.341


 35%|█████████████████████████████                                                      | 7/20 [01:08<02:07,  9.81s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.340
[8,   601] loss: 0.339


 40%|█████████████████████████████████▏                                                 | 8/20 [01:18<01:57,  9.82s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.337
[9,   601] loss: 0.336


 45%|█████████████████████████████████████▎                                             | 9/20 [01:27<01:47,  9.75s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.334
[10,   601] loss: 0.333


 50%|█████████████████████████████████████████                                         | 10/20 [01:37<01:37,  9.70s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.331
[11,   601] loss: 0.330


 55%|█████████████████████████████████████████████                                     | 11/20 [01:47<01:28,  9.83s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.329
[12,   601] loss: 0.328


 60%|█████████████████████████████████████████████████▏                                | 12/20 [01:57<01:18,  9.77s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.328
[13,   601] loss: 0.327


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:06<01:08,  9.72s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.327
[14,   601] loss: 0.326


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:16<00:57,  9.67s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.326
[15,   601] loss: 0.325


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:25<00:48,  9.62s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.325
[16,   601] loss: 0.324


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:35<00:38,  9.67s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.325
[17,   601] loss: 0.324


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [02:45<00:28,  9.65s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.324
[18,   601] loss: 0.323


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [02:54<00:19,  9.67s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.323
[19,   601] loss: 0.322


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:04<00:09,  9.66s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.322
[20,   601] loss: 0.321


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:14<00:00,  9.71s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<03:00,  9.52s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:18<02:50,  9.47s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:28<02:45,  9.71s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [00:38<02:34,  9.63s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.344
[5,   601] loss: 0.344


 25%|████████████████████▊                                                              | 5/20 [00:47<02:23,  9.60s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.343
[6,   601] loss: 0.342


 30%|████████████████████████▉                                                          | 6/20 [00:57<02:13,  9.52s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.340
[7,   601] loss: 0.339


 35%|█████████████████████████████                                                      | 7/20 [01:06<02:03,  9.47s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.338
[8,   601] loss: 0.337


 40%|█████████████████████████████████▏                                                 | 8/20 [01:16<01:53,  9.43s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.336
[9,   601] loss: 0.335


 45%|█████████████████████████████████████▎                                             | 9/20 [01:25<01:43,  9.45s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.334
[10,   601] loss: 0.333


 50%|█████████████████████████████████████████                                         | 10/20 [01:34<01:34,  9.43s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.331
[11,   601] loss: 0.330


 55%|█████████████████████████████████████████████                                     | 11/20 [01:44<01:24,  9.42s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.329
[12,   601] loss: 0.328


 60%|█████████████████████████████████████████████████▏                                | 12/20 [01:53<01:15,  9.39s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.328
[13,   601] loss: 0.327


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:02<01:05,  9.37s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.326
[14,   601] loss: 0.325


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:12<00:56,  9.38s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.325
[15,   601] loss: 0.324


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:21<00:46,  9.37s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.324
[16,   601] loss: 0.323


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:31<00:38,  9.54s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.323
[17,   601] loss: 0.322


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [02:41<00:28,  9.50s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.322
[18,   601] loss: 0.321


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [02:50<00:19,  9.58s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.321
[19,   601] loss: 0.320


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:00<00:09,  9.54s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.320
[20,   601] loss: 0.319


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:09<00:00,  9.48s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<02:56,  9.31s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:18<02:48,  9.35s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:27<02:38,  9.31s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [00:37<02:28,  9.30s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [00:46<02:19,  9.27s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.344
[6,   601] loss: 0.344


 30%|████████████████████████▉                                                          | 6/20 [00:55<02:09,  9.26s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.343
[7,   601] loss: 0.343


 35%|█████████████████████████████                                                      | 7/20 [01:04<02:00,  9.23s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.341
[8,   601] loss: 0.340


 40%|█████████████████████████████████▏                                                 | 8/20 [01:14<01:51,  9.30s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.338
[9,   601] loss: 0.338


 45%|█████████████████████████████████████▎                                             | 9/20 [01:24<01:43,  9.44s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.337
[10,   601] loss: 0.337


 50%|█████████████████████████████████████████                                         | 10/20 [01:33<01:33,  9.38s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.335
[11,   601] loss: 0.335


 55%|█████████████████████████████████████████████                                     | 11/20 [01:42<01:23,  9.31s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.334
[12,   601] loss: 0.333


 60%|█████████████████████████████████████████████████▏                                | 12/20 [01:51<01:14,  9.27s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.332
[13,   601] loss: 0.331


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:00<01:05,  9.30s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.330
[14,   601] loss: 0.328


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:11<00:58,  9.68s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.328
[15,   601] loss: 0.327


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:20<00:47,  9.54s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.326
[16,   601] loss: 0.325


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:29<00:37,  9.44s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.325
[17,   601] loss: 0.324


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [02:39<00:28,  9.38s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.324
[18,   601] loss: 0.323


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [02:48<00:18,  9.41s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.322


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [02:57<00:09,  9.35s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.323
[20,   601] loss: 0.322


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:07<00:00,  9.35s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<02:59,  9.46s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:19<02:51,  9.53s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:29<02:50, 10.04s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [00:40<02:45, 10.32s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [00:51<02:37, 10.48s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [01:05<02:46, 11.91s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.344
[7,   601] loss: 0.344


 35%|█████████████████████████████                                                      | 7/20 [01:20<02:48, 12.94s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.342
[8,   601] loss: 0.342


 40%|█████████████████████████████████▏                                                 | 8/20 [01:33<02:32, 12.72s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.340
[9,   601] loss: 0.339


 45%|█████████████████████████████████████▎                                             | 9/20 [01:43<02:10, 11.90s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.338
[10,   601] loss: 0.337


 50%|█████████████████████████████████████████                                         | 10/20 [01:52<01:50, 11.07s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.336
[11,   601] loss: 0.335


 55%|█████████████████████████████████████████████                                     | 11/20 [02:03<01:39, 11.07s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.334
[12,   601] loss: 0.332


 60%|█████████████████████████████████████████████████▏                                | 12/20 [02:17<01:35, 11.95s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.331
[13,   601] loss: 0.330


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [02:29<01:23, 11.97s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.329
[14,   601] loss: 0.328


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:39<01:08, 11.45s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.327
[15,   601] loss: 0.326


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:48<00:53, 10.77s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.326
[16,   601] loss: 0.325


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:58<00:41, 10.29s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.325
[17,   601] loss: 0.324


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [03:07<00:30, 10.03s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [03:16<00:19,  9.79s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.323


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [03:26<00:09,  9.64s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.324
[20,   601] loss: 0.323


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:35<00:00, 10.76s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:09<02:54,  9.16s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:18<02:44,  9.16s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [00:27<02:35,  9.15s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.344


 20%|████████████████▌                                                                  | 4/20 [00:37<02:29,  9.36s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.343
[5,   601] loss: 0.343


 25%|████████████████████▊                                                              | 5/20 [00:46<02:19,  9.27s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.342
[6,   601] loss: 0.341


 30%|████████████████████████▉                                                          | 6/20 [00:55<02:09,  9.23s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.340
[7,   601] loss: 0.339


 35%|█████████████████████████████                                                      | 7/20 [01:04<01:59,  9.19s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.337
[8,   601] loss: 0.336


 40%|█████████████████████████████████▏                                                 | 8/20 [01:13<01:50,  9.17s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.334
[9,   601] loss: 0.332


 45%|█████████████████████████████████████▎                                             | 9/20 [01:22<01:40,  9.16s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.331
[10,   601] loss: 0.330


 50%|█████████████████████████████████████████                                         | 10/20 [01:32<01:32,  9.21s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.329
[11,   601] loss: 0.328


 55%|█████████████████████████████████████████████                                     | 11/20 [01:41<01:22,  9.17s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.328
[12,   601] loss: 0.327


 60%|█████████████████████████████████████████████████▏                                | 12/20 [01:50<01:13,  9.16s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.327
[13,   601] loss: 0.326


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [01:59<01:03,  9.13s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.326
[14,   601] loss: 0.326


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [02:08<00:54,  9.12s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.326
[15,   601] loss: 0.325


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [02:17<00:45,  9.10s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.325
[16,   601] loss: 0.325


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [02:26<00:36,  9.09s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.325
[17,   601] loss: 0.324


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [02:36<00:27,  9.27s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.325
[18,   601] loss: 0.324


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [02:45<00:18,  9.21s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.324
[19,   601] loss: 0.324


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [02:54<00:09,  9.18s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.324
[20,   601] loss: 0.323


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [03:03<00:00,  9.18s/it]


In [10]:
#обучим 6-слойные НС
errs_6l = []
mdls_6l = []
err_best = np.Inf #наименьшее достигнутое значение ошибки на тестовой выборке

#обучим 5-слойные сети
l2 = [448, 320]
l3 = [256, 160]
l4 = [128, 112]
l5 = [96, 48]

#определим размер пакета
batch_size = 64
batches = int(np.ceil(smpls_train/batch_size))

for l2_ in l2:
    for l3_ in l3:
        for l4_ in l4:
            for l5_ in l5:
                net = Model_6l([size_in, l2_, l3_, l4_, l5_, size_out])

                for epoch in tqdm(range(20)):  
                    running_loss = 0.0
                    for i in range(batches):
                        if i+1 != batches:
                            inputs = X_train[i*batch_size:(i+1)*batch_size, :]
                            labels = y_train[i*batch_size:(i+1)*batch_size, :]
                        else:
                            inputs1 = X_train[i*batch_size:smpls_train, :]
                            labels1 = y_train[i*batch_size:smpls_train, :]

                            resid = batch_size - (smpls_train - i*batch_size)

                            inputs2 = X_train[0:resid, :]
                            labels2 = y_train[0:resid, :]

                            inputs = torch.cat((inputs1,inputs2))
                            labels = torch.cat((labels1,labels2))

                            del inputs1, labels1, inputs2, labels2

                        # обнуляем градиент
                        net.opt.zero_grad()

                        outputs = net(inputs)
                        loss = net.criterion(outputs, labels)
                        loss.backward()
                        net.opt.step()

                        # выводим статистику о процессе обучения
                        running_loss += loss.item()
                        if i % 300 == 0:    # печатаем каждые 300 mini-batches
                            print('[%d, %5d] loss: %.3f' %
                                  (epoch + 1, i + 1, running_loss / 2000)) # откуда 2000?
                            running_loss = 0.0



                #вычисление ошибки на тестовом наборе данных
                y_pred = net(X_test)
                loss_test = net.criterion(y_pred, y_test).item()

                if loss_test<err_best: #сохраняем только лучшие сети на данный момент
                    errs_6l.append(loss_test)
                    mdls_6l.append(net)
                    err_best = loss_test

  return fnc.softmax(self.lay56(x))


[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:29<09:13, 29.14s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:57<08:36, 28.67s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:26<08:09, 28.78s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:54<07:38, 28.64s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [02:23<07:10, 28.69s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:52<06:40, 28.63s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [03:20<06:13, 28.71s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:49<05:43, 28.62s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.344
[9,   601] loss: 0.344


 45%|█████████████████████████████████████▎                                             | 9/20 [04:18<05:16, 28.74s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.344
[10,   601] loss: 0.344


 50%|█████████████████████████████████████████                                         | 10/20 [04:47<04:47, 28.74s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.343
[11,   601] loss: 0.342


 55%|█████████████████████████████████████████████                                     | 11/20 [05:16<04:19, 28.81s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.341
[12,   601] loss: 0.341


 60%|█████████████████████████████████████████████████▏                                | 12/20 [05:44<03:49, 28.66s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.340
[13,   601] loss: 0.340


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [06:12<03:20, 28.58s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.339
[14,   601] loss: 0.339


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [06:41<02:51, 28.61s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.339
[15,   601] loss: 0.339


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [07:10<02:23, 28.75s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.338
[16,   601] loss: 0.338


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [07:38<01:54, 28.64s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.337
[17,   601] loss: 0.337


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [08:07<01:25, 28.51s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.336
[18,   601] loss: 0.336


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [08:35<00:57, 28.53s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.335
[19,   601] loss: 0.334


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [09:04<00:28, 28.53s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.333
[20,   601] loss: 0.332


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [09:34<00:00, 28.72s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:28<09:10, 28.99s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:57<08:37, 28.73s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:25<08:03, 28.47s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:54<07:37, 28.59s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [02:22<07:08, 28.53s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:51<06:38, 28.49s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [03:19<06:08, 28.38s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:48<05:41, 28.48s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [04:16<05:11, 28.36s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [04:44<04:43, 28.39s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.344
[11,   601] loss: 0.344


 55%|█████████████████████████████████████████████                                     | 11/20 [05:12<04:14, 28.30s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.343
[12,   601] loss: 0.342


 60%|█████████████████████████████████████████████████▏                                | 12/20 [05:41<03:47, 28.42s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.341
[13,   601] loss: 0.340


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [06:09<03:18, 28.32s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.339
[14,   601] loss: 0.339


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [06:37<02:49, 28.22s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.338
[15,   601] loss: 0.337


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [07:06<02:21, 28.29s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.336
[16,   601] loss: 0.336


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [07:34<01:53, 28.32s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.334
[17,   601] loss: 0.333


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [08:02<01:24, 28.23s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.332
[18,   601] loss: 0.331


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [08:30<00:56, 28.14s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.330
[19,   601] loss: 0.329


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [08:58<00:28, 28.06s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.328
[20,   601] loss: 0.328


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [09:26<00:00, 28.32s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:28<09:03, 28.60s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:56<08:29, 28.31s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:24<08:00, 28.25s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:53<07:31, 28.21s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [02:21<07:05, 28.35s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:49<06:36, 28.34s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [03:18<06:08, 28.35s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:46<05:38, 28.23s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [04:14<05:12, 28.37s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [04:43<04:42, 28.28s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.344
[11,   601] loss: 0.344


 55%|█████████████████████████████████████████████                                     | 11/20 [05:11<04:13, 28.21s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.343
[12,   601] loss: 0.343


 60%|█████████████████████████████████████████████████▏                                | 12/20 [05:39<03:44, 28.12s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.342
[13,   601] loss: 0.341


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [06:07<03:17, 28.18s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.339
[14,   601] loss: 0.339


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [06:35<02:48, 28.09s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.337
[15,   601] loss: 0.337


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [07:03<02:20, 28.01s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.335
[16,   601] loss: 0.334


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [07:30<01:51, 27.96s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.332
[17,   601] loss: 0.331


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [07:58<01:23, 27.92s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.330
[18,   601] loss: 0.329


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [08:27<00:56, 28.16s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.329
[19,   601] loss: 0.328


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [08:55<00:28, 28.08s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.328
[20,   601] loss: 0.327


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [09:23<00:00, 28.18s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:28<08:54, 28.13s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:57<08:34, 28.58s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:24<08:01, 28.30s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:53<07:32, 28.26s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [02:21<07:03, 28.21s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:49<06:36, 28.31s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [03:18<06:09, 28.44s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:46<05:40, 28.40s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [04:15<05:13, 28.48s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [04:46<04:51, 29.12s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [05:14<04:19, 28.79s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.345
[12,   601] loss: 0.345


 60%|█████████████████████████████████████████████████▏                                | 12/20 [05:42<03:48, 28.60s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.345
[13,   601] loss: 0.345


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [06:10<03:18, 28.42s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.345
[14,   601] loss: 0.345


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [06:39<02:51, 28.53s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.345
[15,   601] loss: 0.345


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [07:07<02:22, 28.44s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.345
[16,   601] loss: 0.345


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [07:35<01:53, 28.33s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.345
[17,   601] loss: 0.345


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [08:03<01:24, 28.19s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.344
[18,   601] loss: 0.344


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [08:31<00:56, 28.10s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.343
[19,   601] loss: 0.342


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [08:59<00:28, 28.21s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.340
[20,   601] loss: 0.340


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [09:27<00:00, 28.37s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:27<08:44, 27.59s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:54<08:11, 27.28s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:22<07:50, 27.67s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:50<07:21, 27.60s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [02:17<06:52, 27.49s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:44<06:22, 27.34s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [03:12<05:57, 27.47s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:41<05:36, 28.06s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [04:17<05:34, 30.44s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.344


 50%|█████████████████████████████████████████                                         | 10/20 [04:52<05:17, 31.79s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.344
[11,   601] loss: 0.343


 55%|█████████████████████████████████████████████                                     | 11/20 [05:25<04:51, 32.35s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.343
[12,   601] loss: 0.342


 60%|█████████████████████████████████████████████████▏                                | 12/20 [05:56<04:14, 31.82s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.341
[13,   601] loss: 0.341


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [06:23<03:32, 30.41s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.340
[14,   601] loss: 0.339


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [06:50<02:56, 29.38s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.338
[15,   601] loss: 0.338


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [07:18<02:24, 28.81s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.337
[16,   601] loss: 0.337


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [07:45<01:53, 28.28s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.336
[17,   601] loss: 0.336


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [08:12<01:23, 27.88s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.335
[18,   601] loss: 0.335


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [08:38<00:55, 27.59s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.334
[19,   601] loss: 0.333


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [09:05<00:27, 27.42s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.332
[20,   601] loss: 0.331


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [09:33<00:00, 28.68s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:27<08:35, 27.12s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:54<08:07, 27.10s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:21<07:40, 27.10s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:49<07:17, 27.34s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [02:15<06:47, 27.19s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:42<06:19, 27.12s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [03:09<05:51, 27.03s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:37<05:25, 27.14s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [04:04<04:58, 27.09s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.344
[10,   601] loss: 0.344


 50%|█████████████████████████████████████████                                         | 10/20 [04:31<04:31, 27.12s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.344
[11,   601] loss: 0.343


 55%|█████████████████████████████████████████████                                     | 11/20 [04:58<04:03, 27.10s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.342
[12,   601] loss: 0.341


 60%|█████████████████████████████████████████████████▏                                | 12/20 [05:25<03:35, 26.98s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.340
[13,   601] loss: 0.339


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [05:52<03:09, 27.08s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.338
[14,   601] loss: 0.338


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [06:19<02:42, 27.15s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.337
[15,   601] loss: 0.337


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [06:46<02:15, 27.08s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.336
[16,   601] loss: 0.336


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [07:13<01:48, 27.01s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.335
[17,   601] loss: 0.335


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [07:40<01:21, 27.07s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.334
[18,   601] loss: 0.334


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [08:07<00:53, 26.94s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.332
[19,   601] loss: 0.331


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [08:34<00:26, 26.92s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.330
[20,   601] loss: 0.330


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [09:00<00:00, 27.04s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:27<08:36, 27.20s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:55<08:19, 27.73s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:22<07:45, 27.37s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:49<07:15, 27.23s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [02:16<06:47, 27.14s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:43<06:22, 27.30s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [03:10<05:53, 27.18s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:37<05:26, 27.19s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [04:04<04:58, 27.10s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [04:32<04:32, 27.22s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [04:59<04:04, 27.17s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.344
[12,   601] loss: 0.344


 60%|█████████████████████████████████████████████████▏                                | 12/20 [05:26<03:37, 27.15s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.343
[13,   601] loss: 0.343


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [05:53<03:10, 27.18s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.341
[14,   601] loss: 0.341


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [06:20<02:42, 27.13s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.339
[15,   601] loss: 0.339


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [06:48<02:15, 27.19s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.338
[16,   601] loss: 0.338


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [07:16<01:50, 27.50s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.337
[17,   601] loss: 0.337


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [07:45<01:23, 27.97s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.336
[18,   601] loss: 0.336


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [08:13<00:56, 28.12s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.335
[19,   601] loss: 0.335


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [08:42<00:28, 28.22s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.333
[20,   601] loss: 0.332


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [09:09<00:00, 27.46s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:26<08:32, 26.95s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:54<08:06, 27.01s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:21<07:43, 27.26s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:48<07:15, 27.22s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [02:15<06:46, 27.08s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:42<06:17, 27.00s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [03:09<05:51, 27.04s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:37<05:26, 27.19s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [04:04<04:58, 27.15s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [04:31<04:31, 27.15s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.344
[11,   601] loss: 0.344


 55%|█████████████████████████████████████████████                                     | 11/20 [04:58<04:03, 27.06s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.343
[12,   601] loss: 0.343


 60%|█████████████████████████████████████████████████▏                                | 12/20 [05:25<03:37, 27.16s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.342
[13,   601] loss: 0.341


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [05:52<03:09, 27.04s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.340
[14,   601] loss: 0.339


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [06:19<02:42, 27.05s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.338
[15,   601] loss: 0.338


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [06:46<02:15, 27.04s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.337
[16,   601] loss: 0.337


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [07:13<01:47, 26.94s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.336
[17,   601] loss: 0.336


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [07:40<01:21, 27.18s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.336
[18,   601] loss: 0.336


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [08:07<00:54, 27.07s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.336
[19,   601] loss: 0.335


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [08:34<00:27, 27.03s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.335
[20,   601] loss: 0.335


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [09:01<00:00, 27.07s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:22<06:58, 22.04s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:43<06:31, 21.75s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:05<06:07, 21.62s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:26<05:43, 21.50s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:47<05:22, 21.47s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:09<04:59, 21.39s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [02:30<04:40, 21.54s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [02:52<04:18, 21.55s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [03:13<03:56, 21.48s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [03:35<03:34, 21.48s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [03:57<03:14, 21.62s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.344
[12,   601] loss: 0.344


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:18<02:53, 21.67s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.342
[13,   601] loss: 0.342


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:40<02:30, 21.56s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.340
[14,   601] loss: 0.340


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [05:01<02:08, 21.47s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.338
[15,   601] loss: 0.338


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:23<01:47, 21.48s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.337
[16,   601] loss: 0.337


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:44<01:25, 21.41s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.336
[17,   601] loss: 0.336


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:05<01:04, 21.34s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.335
[18,   601] loss: 0.335


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:27<00:42, 21.45s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.334
[19,   601] loss: 0.334


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:48<00:21, 21.35s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.332
[20,   601] loss: 0.331


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:09<00:00, 21.48s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:21<06:48, 21.49s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:42<06:24, 21.34s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:04<06:02, 21.34s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:26<05:45, 21.59s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:47<05:23, 21.58s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:10<05:07, 21.94s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [02:35<05:01, 23.16s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [02:57<04:29, 22.50s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [03:19<04:06, 22.41s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [03:40<03:40, 22.03s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [04:01<03:16, 21.81s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.345
[12,   601] loss: 0.345


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:22<02:52, 21.62s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.345
[13,   601] loss: 0.345


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:43<02:30, 21.45s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.344
[14,   601] loss: 0.344


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [05:05<02:08, 21.35s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.343
[15,   601] loss: 0.343


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:26<01:47, 21.43s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.341
[16,   601] loss: 0.340


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:47<01:25, 21.34s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.339
[17,   601] loss: 0.338


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:08<01:03, 21.28s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.337
[18,   601] loss: 0.337


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:30<00:42, 21.28s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.336
[19,   601] loss: 0.335


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:51<00:21, 21.20s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.334
[20,   601] loss: 0.332


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:13<00:00, 21.67s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:21<06:48, 21.51s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:42<06:24, 21.37s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:04<06:04, 21.41s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:25<05:42, 21.38s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:46<05:20, 21.34s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:09<05:02, 21.63s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [02:31<04:43, 21.79s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [02:53<04:24, 22.04s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [03:15<04:00, 21.85s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [03:36<03:38, 21.83s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.344
[11,   601] loss: 0.344


 55%|█████████████████████████████████████████████                                     | 11/20 [03:59<03:17, 21.90s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.343
[12,   601] loss: 0.343


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:20<02:53, 21.72s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.341
[13,   601] loss: 0.341


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:41<02:30, 21.55s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.340
[14,   601] loss: 0.340


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [05:03<02:09, 21.60s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.339
[15,   601] loss: 0.339


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:26<01:50, 22.19s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.338
[16,   601] loss: 0.338


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:48<01:27, 21.93s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.337
[17,   601] loss: 0.337


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:10<01:05, 21.95s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.336
[18,   601] loss: 0.336


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:31<00:43, 21.70s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.335
[19,   601] loss: 0.334


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:52<00:21, 21.60s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.333
[20,   601] loss: 0.332


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:13<00:00, 21.69s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:21<06:43, 21.26s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:43<06:29, 21.61s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:04<06:05, 21.53s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:25<05:41, 21.35s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:47<05:20, 21.38s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:08<04:58, 21.29s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [02:29<04:36, 21.29s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [02:51<04:18, 21.53s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [03:12<03:56, 21.47s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [03:34<03:34, 21.41s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [03:55<03:13, 21.53s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.345
[12,   601] loss: 0.345


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:17<02:52, 21.51s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.345
[13,   601] loss: 0.345


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:38<02:30, 21.52s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.345
[14,   601] loss: 0.345


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [05:00<02:09, 21.57s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.345
[15,   601] loss: 0.345


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:21<01:47, 21.48s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.344
[16,   601] loss: 0.344


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:43<01:26, 21.56s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.343
[17,   601] loss: 0.343


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:04<01:04, 21.48s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.342
[18,   601] loss: 0.342


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:25<00:42, 21.29s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.341
[19,   601] loss: 0.340


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:47<00:21, 21.39s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.339
[20,   601] loss: 0.339


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:08<00:00, 21.42s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:20<06:30, 20.57s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:41<06:09, 20.55s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:01<05:47, 20.45s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:21<05:26, 20.43s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:42<05:10, 20.67s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:03<04:47, 20.55s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [02:23<04:26, 20.53s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [02:44<04:05, 20.48s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [03:04<03:44, 20.44s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [03:24<03:24, 20.43s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [03:55<03:32, 23.61s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.345
[12,   601] loss: 0.345


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:17<03:03, 22.94s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.345
[13,   601] loss: 0.345


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:37<02:35, 22.26s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.344
[14,   601] loss: 0.344


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:58<02:10, 21.80s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.343
[15,   601] loss: 0.343


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:19<01:47, 21.48s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.341
[16,   601] loss: 0.340


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:40<01:25, 21.50s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.339
[17,   601] loss: 0.339


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:02<01:04, 21.64s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.338
[18,   601] loss: 0.338


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:26<00:44, 22.38s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.337
[19,   601] loss: 0.337


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:48<00:22, 22.21s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.336
[20,   601] loss: 0.335


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:13<00:00, 21.66s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:23<07:35, 24.00s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:49<07:23, 24.65s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:12<06:46, 23.92s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:34<06:12, 23.28s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:57<05:48, 23.26s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:25<05:47, 24.80s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [02:49<05:18, 24.50s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [03:18<05:09, 25.83s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [03:41<04:36, 25.13s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [04:02<03:57, 23.72s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [04:23<03:26, 23.00s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.344
[12,   601] loss: 0.344


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:44<02:57, 22.25s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.343
[13,   601] loss: 0.342


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [05:04<02:31, 21.68s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.341
[14,   601] loss: 0.340


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [05:24<02:07, 21.32s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.339
[15,   601] loss: 0.339


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:45<01:45, 21.03s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.338
[16,   601] loss: 0.338


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [06:05<01:23, 20.82s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.337
[17,   601] loss: 0.337


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [06:27<01:03, 21.03s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.336
[18,   601] loss: 0.336


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:47<00:41, 20.86s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.335
[19,   601] loss: 0.335


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [07:07<00:20, 20.72s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.334
[20,   601] loss: 0.333


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [07:28<00:00, 22.42s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:21<06:42, 21.19s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [00:42<06:21, 21.17s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [01:03<06:00, 21.18s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [01:24<05:35, 20.97s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [01:44<05:13, 20.87s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [02:05<04:51, 20.79s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [02:26<04:30, 20.78s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [02:47<04:10, 20.89s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [03:08<03:49, 20.84s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [03:28<03:26, 20.70s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [03:49<03:07, 20.82s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.344
[12,   601] loss: 0.344


 60%|█████████████████████████████████████████████████▏                                | 12/20 [04:10<02:45, 20.70s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.343
[13,   601] loss: 0.342


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [04:30<02:24, 20.71s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.340
[14,   601] loss: 0.340


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [04:52<02:05, 20.87s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.339
[15,   601] loss: 0.338


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [05:12<01:43, 20.72s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.337
[16,   601] loss: 0.337


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [05:32<01:22, 20.63s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.336
[17,   601] loss: 0.336


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [05:53<01:01, 20.61s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.336
[18,   601] loss: 0.336


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [06:14<00:41, 20.63s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.335
[19,   601] loss: 0.335


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [06:34<00:20, 20.66s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.333
[20,   601] loss: 0.333


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [06:56<00:00, 20.80s/it]
  0%|                                                                                           | 0/20 [00:00<?, ?it/s]

[1,     1] loss: 0.001
[1,   301] loss: 0.345
[1,   601] loss: 0.345


  5%|████▏                                                                              | 1/20 [00:22<07:03, 22.29s/it]

[2,     1] loss: 0.001
[2,   301] loss: 0.345
[2,   601] loss: 0.345


 10%|████████▎                                                                          | 2/20 [02:11<21:59, 73.28s/it]

[3,     1] loss: 0.001
[3,   301] loss: 0.345
[3,   601] loss: 0.345


 15%|████████████▍                                                                      | 3/20 [02:54<16:52, 59.58s/it]

[4,     1] loss: 0.001
[4,   301] loss: 0.345
[4,   601] loss: 0.345


 20%|████████████████▌                                                                  | 4/20 [03:26<12:58, 48.67s/it]

[5,     1] loss: 0.001
[5,   301] loss: 0.345
[5,   601] loss: 0.345


 25%|████████████████████▊                                                              | 5/20 [03:55<10:24, 41.62s/it]

[6,     1] loss: 0.001
[6,   301] loss: 0.345
[6,   601] loss: 0.345


 30%|████████████████████████▉                                                          | 6/20 [04:26<08:52, 38.05s/it]

[7,     1] loss: 0.001
[7,   301] loss: 0.345
[7,   601] loss: 0.345


 35%|█████████████████████████████                                                      | 7/20 [04:53<07:24, 34.22s/it]

[8,     1] loss: 0.001
[8,   301] loss: 0.345
[8,   601] loss: 0.345


 40%|█████████████████████████████████▏                                                 | 8/20 [05:17<06:14, 31.18s/it]

[9,     1] loss: 0.001
[9,   301] loss: 0.345
[9,   601] loss: 0.345


 45%|█████████████████████████████████████▎                                             | 9/20 [05:41<05:17, 28.90s/it]

[10,     1] loss: 0.001
[10,   301] loss: 0.345
[10,   601] loss: 0.345


 50%|█████████████████████████████████████████                                         | 10/20 [06:07<04:38, 27.90s/it]

[11,     1] loss: 0.001
[11,   301] loss: 0.345
[11,   601] loss: 0.345


 55%|█████████████████████████████████████████████                                     | 11/20 [06:37<04:16, 28.52s/it]

[12,     1] loss: 0.001
[12,   301] loss: 0.345
[12,   601] loss: 0.345


 60%|█████████████████████████████████████████████████▏                                | 12/20 [07:01<03:38, 27.28s/it]

[13,     1] loss: 0.001
[13,   301] loss: 0.345
[13,   601] loss: 0.345


 65%|█████████████████████████████████████████████████████▎                            | 13/20 [07:23<02:58, 25.57s/it]

[14,     1] loss: 0.001
[14,   301] loss: 0.345
[14,   601] loss: 0.345


 70%|█████████████████████████████████████████████████████████▍                        | 14/20 [07:46<02:28, 24.75s/it]

[15,     1] loss: 0.001
[15,   301] loss: 0.345
[15,   601] loss: 0.345


 75%|█████████████████████████████████████████████████████████████▌                    | 15/20 [08:10<02:02, 24.56s/it]

[16,     1] loss: 0.001
[16,   301] loss: 0.344
[16,   601] loss: 0.344


 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [08:31<01:33, 23.50s/it]

[17,     1] loss: 0.001
[17,   301] loss: 0.343
[17,   601] loss: 0.343


 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [08:53<01:09, 23.15s/it]

[18,     1] loss: 0.001
[18,   301] loss: 0.342
[18,   601] loss: 0.341


 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [09:18<00:47, 23.69s/it]

[19,     1] loss: 0.001
[19,   301] loss: 0.340
[19,   601] loss: 0.339


 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [09:41<00:23, 23.49s/it]

[20,     1] loss: 0.001
[20,   301] loss: 0.338
[20,   601] loss: 0.338


100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [10:07<00:00, 30.36s/it]


In [12]:
#Выведем результаты обучения всех сетей (лучшие)
errs_4l = np.array(errs_4l)
nn_4l_i = errs_4l.argmin()

errs_5l = np.array(errs_5l)
nn_5l_i = errs_5l.argmin()

errs_6l = np.array(errs_6l)
nn_6l_i = errs_6l.argmin()

print('4-слойные сети: наименьшая ошибка: {}, \nСеть:\n{}'.format(errs_4l[nn_4l_i],mdls_4l[nn_4l_i]),end = '\n\n')
print('5-слойные сети: наименьшая ошибка: {}, \nСеть:\n{}'.format(errs_5l[nn_5l_i],mdls_5l[nn_5l_i]),end = '\n\n')
print('6-слойные сети: наименьшая ошибка: {}, \nСеть:\n{}'.format(errs_6l[nn_6l_i],mdls_6l[nn_6l_i]),end = '\n\n')

4-слойные сети: наименьшая ошибка: 2.1084680557250977, 
Сеть:
Model_4l(
  (lay12): Linear(in_features=3072, out_features=768, bias=True)
  (lay23): Linear(in_features=768, out_features=128, bias=True)
  (lay34): Linear(in_features=128, out_features=10, bias=True)
  (criterion): CrossEntropyLoss()
)

5-слойные сети: наименьшая ошибка: 2.1301937103271484, 
Сеть:
Model_5l(
  (lay12): Linear(in_features=3072, out_features=128, bias=True)
  (lay23): Linear(in_features=128, out_features=160, bias=True)
  (lay34): Linear(in_features=160, out_features=96, bias=True)
  (lay45): Linear(in_features=96, out_features=10, bias=True)
  (criterion): CrossEntropyLoss()
)

6-слойные сети: наименьшая ошибка: 2.177771806716919, 
Сеть:
Model_6l(
  (lay12): Linear(in_features=3072, out_features=448, bias=True)
  (lay23): Linear(in_features=448, out_features=256, bias=True)
  (lay34): Linear(in_features=256, out_features=112, bias=True)
  (lay45): Linear(in_features=112, out_features=96, bias=True)
  (lay56)

In [14]:
#сохраним лучшую модель
best_mdl = mdls_4l[nn_4l_i]

checkpoint={
    'state_dict': best_mdl.state_dict(),
    'optimizer': best_mdl.opt.state_dict()
}
torch.save(checkpoint,'best_mdl.pt')

#ЗАГРУЗКА МОДЕЛИ
'''
best_mdl2 = Model_4l([3072, 768, 128, 10])
checkpoint=torch.load('best_mdl.pt')
best_mdl2.load_state_dict(checkpoint['state_dict'])
best_mdl2.opt.load_state_dict(checkpoint['optimizer'])#ОБЯЗАТЕЛЬНО!
best_mdl2.opt.zero_grad()
'''

"\nbest_mdl2 = Model_4l([3072, 768, 128, 10])\ncheckpoint=torch.load('best_mdl.pt')\nbest_mdl2.load_state_dict(checkpoint['state_dict'])\nbest_mdl2.opt.load_state_dict(checkpoint['optimizer'])#ОБЯЗАТЕЛЬНО!\nbest_mdl2.opt.zero_grad()\n"