In [1]:
#check if model stays the same
#reimplement data generation

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import DataLoader, TensorDataset
import pickle
from tqdm import tqdm
import random
import numpy as np
import copy


DEVICE="cuda"


In [3]:
def set_seed(seed):
    # Set the seed for the random module
    random.seed(seed)
    
    # Set the seed for numpy
    np.random.seed(seed)
    
    # Set the seed for PyTorch (CPU)
    torch.manual_seed(seed)
    
    # Set the seed for PyTorch (GPU) if you are using CUDA
    if torch.cuda.is_available():
        torch.cuda.manual_seed(seed)
        torch.cuda.manual_seed_all(seed)  # For multi-GPU setups
    
    # Ensure deterministic behavior in PyTorch
    torch.backends.cudnn.deterministic = True  # This makes the computations deterministic
    torch.backends.cudnn.benchmark = False  # Disable auto-tuning for performance optimization
    
    # For reproducibility of other libraries like Python's `random`
    torch.random.manual_seed(seed)



In [4]:
class MLPBlock(nn.Module):
    """A single block of a Multi-Layer Perceptron with ReLU activation and dropout."""
    def __init__(self, in_features=16, out_features=16, dropout_prob=0.0):
        """Initialize the MLP block with given input and output features, along with dropout probability."""
        super(MLPBlock, self).__init__()
        self.ff1 = nn.Linear(in_features, out_features)
        self.act = nn.ReLU()
        self.dropout = nn.Dropout(p=dropout_prob)

    def forward(self, x):
        """Forward pass of the MLP block."""
        x = self.ff1(x)
        x = self.act(x)
        x = self.dropout(x)
        return x

class MLPModel(nn.Module):
    """A model composed of multiple MLP blocks with shared hyperparameters."""
    def __init__(self, input_size=16, hidden_size=16, num_blocks=3, dropout_prob=0.0):
        """Initialize the MLP model with input, hidden, and output parameters."""
        super(MLPModel, self).__init__()
        self.dropout = nn.Dropout(p=dropout_prob)
        self.h = nn.ModuleList([MLPBlock(hidden_size, hidden_size, dropout_prob) for _ in range(num_blocks)])

    def forward(self, x):
        """Forward pass of the MLP model."""
        x = self.dropout(x)
        for layer in self.h:
            x = layer(x)
        return x

class MLPForClassification(nn.Module):
    """A classification model using MLP for feature processing and a linear layer for final predictions."""
    def __init__(self, input_size=16, hidden_size=16, num_classes=2, num_blocks=3, dropout_prob=0.0):
        """Initialize the classification MLP with input, hidden, and output parameters."""
        super(MLPForClassification, self).__init__()
        self.mlp = MLPModel(input_size, hidden_size, num_blocks, dropout_prob)
        self.score = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        """Forward pass of the classification model."""
        x = self.mlp(x)
        x = self.score(x)
        return x


In [None]:
def randvec(n=50, lower=-0.5, upper=0.5):
    """Returns a random vector of length `n`. `w` is ignored."""
    return np.array([random.uniform(lower, upper) for i in range(n)])

def create_same_pair(embedding_size):
    vec=randvec(embedding_size)
    return vec,vec

def create_diff_pair(embedding_size):
    similar=True
    while similar:
        vec1=randvec(embedding_size)
        vec2=randvec(embedding_size)
        if not (vec1 == vec2).all():
            similar=False
    return vec1,vec2


def make_dataset_sample_model(embedding_size,variable1=False,variable2=False):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
        
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label

#Dataset generation for train,eval and test of the classification model
def make_model_dataset(size,embedding_size):
    model_inputs=[]
    labels=[]
    for _ in tqdm(range(size)):
        model_input,label=make_dataset_sample_model(embedding_size)
        model_inputs.append(model_input)
        labels.append(label)
    return torch.tensor(model_inputs, dtype=torch.float32).to(DEVICE),torch.tensor(labels, dtype=torch.float32).to(DEVICE)

In [None]:
#Helper function for Both Equality Relations Dataset Generation
def make_dataset_sample_variable_intervention(embedding_size,variable1=False,variable2=False):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
    source_first_pair=[(np.zeros(embedding_size),np.zeros(embedding_size)),(np.zeros(embedding_size),np.zeros(embedding_size))]
    if variable1:
        First_pair_same=random.choice([True,False])
        if First_pair_same:
            source_first_pair=create_same_pair(embedding_size)
        else:
            source_first_pair=create_diff_pair(embedding_size)
        if random.choice([True,False]):
            source_first_pair=[source_first_pair,create_same_pair(embedding_size)]
        else:
            source_first_pair=[source_first_pair,create_diff_pair(embedding_size)]
        
    
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)
    source_second_pair=[(np.zeros(embedding_size),np.zeros(embedding_size)),(np.zeros(embedding_size),np.zeros(embedding_size))]
    if variable2:
        Second_pair_same=random.choice([True,False])
        if Second_pair_same:
            source_second_pair=create_same_pair(embedding_size)
        else:
            source_second_pair=create_diff_pair(embedding_size)
        if random.choice([True,False]):
            source_second_pair=[create_same_pair(embedding_size),source_second_pair]
        else:
            source_second_pair=[create_diff_pair(embedding_size),source_second_pair]
    
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    source0=np.concatenate(source_first_pair, axis=None)
    source1=np.concatenate(source_second_pair, axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label,source0,source1


# Both Equality Relations Dataset Generation
def make_intervention_dataset_variable_intervention_all(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        variable1,variable2=random.choice([(True,False),(False,True),(True,True)])
        base,label,source0,source1=make_dataset_sample_variable_intervention(embedding_size,variable1=variable1,variable2=variable2)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source0,source1], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[variable1,variable2]
        #print(intervention_data[-1])
    return intervention_data

#Left Equality Relations Dataset Generation
def make_intervention_dataset_variable_intervention_first(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        base,label,source0,source1=make_dataset_sample_variable_intervention(embedding_size,variable1=True,variable2=False)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source0,source1], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[True,False]
        #print(intervention_data[-1])
    return intervention_data

In [5]:
# Helper Function Identity of First Argument Dataset Generation
def make_dataset_sample_first_input_intervention(embedding_size):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
    
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)


    source=[]
    First_pair_same=random.choice([True,False])
    if First_pair_same: #equal or not in first variable
        if random.choice([True,False]): #Same source pair
            source.append((First_pair[1],First_pair[1]))
        else: #Different source pair
            new_vec=randvec(embedding_size)
            while (new_vec == First_pair[1]).all():
                new_vec=randvec(embedding_size)
            source.append((First_pair[1],new_vec))
            
    else:
        new_vec1=randvec(embedding_size)
        while (new_vec1 == First_pair[1]).all():
            new_vec1=randvec(embedding_size)
        if random.choice([True,False]): #Same source pair
            source.append((new_vec1,new_vec1))
        else: #Different source pair
            new_vec2=randvec(embedding_size)
            while (new_vec2 == new_vec1).all():
                new_vec2=randvec(embedding_size)
            source.append((new_vec1,new_vec2))

    if random.choice([True,False]):
        source.append(create_same_pair(embedding_size))
    else:
        source.append(create_diff_pair(embedding_size))
    
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    source=np.concatenate(source, axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label,source
    

# Identity of First Argument Dataset Generation
def make_intervention_dataset_first_input_intervention(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        base,label,source=make_dataset_sample_first_input_intervention(embedding_size)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[True]
    return intervention_data




In [6]:
def train_model(model,batch_size = 1024,epochs=3,early_stopping_threshold=1024):
    #Training
    X_train,y_train=make_model_dataset(1048576,4)
    X_eval,y_eval=make_model_dataset(10000,4)
    # Create DataLoader
    
    
    train_dataset = TensorDataset(X_train, y_train)
    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
    
    # Initialize model, loss function, and optimizer
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    
    # Train
    model.train()
    best_accuracy=-1
    no_improvement=0
    best_model=None
    early_stopping=False
    for epoch in range(epochs):
        total_loss = 0
        for X_batch, y_batch in tqdm(train_loader):
            optimizer.zero_grad()
            outputs = model(X_batch)
            loss = criterion(outputs, y_batch.squeeze().long())
            loss.backward()
            optimizer.step()
            total_loss += loss.item()
            eval_accuracy=eval_model(model,X_eval,y_eval,batch_size = 1024)
            if eval_accuracy>best_accuracy:
                best_accuracy=eval_accuracy
                no_improvement=0
                best_model = copy.deepcopy(model)
            elif no_improvement>=early_stopping_threshold:
                early_stopping=True
                break
            else:
                no_improvement+=1
            #print("ES",no_improvement,"AC",best_accuracy)
        if early_stopping:
            break
        print(f"Epoch {epoch+1}, Loss: {total_loss / len(train_loader)}","steps without improvement:",no_improvement,"best accuracy:",best_accuracy)
    return best_model

In [7]:
def eval_model(model,X_eval,y_eval,batch_size = 1024):
    #Testing:
    test_dataset = TensorDataset(X_eval, y_eval)
    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)
    
    
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for X_batch, y_batch in test_loader:
            outputs = model(X_batch)
            _, predicted = torch.max(outputs, 1)
            correct += (predicted == y_batch.squeeze()).sum().item()
            total += y_batch.size(0)
    accuracy = correct / total
    model.train()
    return accuracy

In [8]:
def test_model(model,batch_size = 1024):
    #Testing:
    X_test,y_test=make_model_dataset(10000,4)
    test_dataset = TensorDataset(X_test, y_test)
    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)
    
    
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for X_batch, y_batch in tqdm(test_loader):
            outputs = model(X_batch)
            _, predicted = torch.max(outputs, 1)
            correct += (predicted == y_batch.squeeze()).sum().item()
            total += y_batch.size(0)
    accuracy = correct / total
    print(f"Test Accuracy: {accuracy:.4f}")
    return accuracy

In [9]:
def make_model(epochs=3):
    model = MLPForClassification()
    model.to(DEVICE)
    model=train_model(model,epochs=epochs)
    accuracy=test_model(model)
    return model,accuracy

In [None]:
class RotateLayer(torch.nn.Module):
    """A learnable linear transformation initialized as an orthogonal matrix."""

    def __init__(self, n, init_orth=True):
        """
        Args:
            n (int): Dimension of the square transformation matrix.
            init_orth (bool): If True, initializes the matrix with an orthogonal weight.
        """
        super().__init__()
        weight = torch.empty(n, n)  # Create an empty n x n matrix
        
        # We don't need initialization if loading from a pretrained checkpoint.
        # You can explore different initialization strategies if necessary, but this isn't our focus.
        if init_orth:
            torch.nn.init.orthogonal_(weight)
        
        self.weight = torch.nn.Parameter(weight, requires_grad=True)  # Learnable weight matrix

    def forward(self, x):
        """Applies the rotation matrix to the input tensor."""
        return torch.matmul(x.to(self.weight.dtype), self.weight)
        

class Transformation_Function(nn.Module):
    """Encapsulates the rotation transformation as a PyTorch module."""

    def __init__(self, embed_dim=16):
        """
        Args:
            embed_dim (int): The embedding dimension (size of the transformation matrix).
        """
        super(Transformation_Function, self).__init__()
        
        rotate_layer = RotateLayer(embed_dim)  # Initialize the rotation layer
        # Ensure the transformation remains an orthogonal matrix
        self.rotate_layer = torch.nn.utils.parametrizations.orthogonal(rotate_layer)

    def forward(self, x):
        """Applies the orthogonal transformation to the input tensor."""
        return self.rotate_layer(x)


class InverseTransformation_Function(nn.Module):
    """Computes the inverse of the given transformation function (phi)."""

    def __init__(self, transformation_function: Transformation_Function):
        """
        Args:
            transformation_function (Transformation_Function): The forward transformation function.
        """
        super(InverseTransformation_Function, self).__init__()
        self.transformation_function = transformation_function  # Store reference to the transformation

    def forward(self, x):
        """Applies the inverse transformation by transposing the orthogonal weight matrix."""
        weight_T = self.transformation_function.rotate_layer.weight.T  # Use matrix transpose as inverse
        return torch.matmul(x.to(weight_T.dtype), weight_T)




In [10]:

class Inversible_Linear_Layer(nn.Module):
    def __init__(self, dimension=16, epsilon=1e-1):
        super(Inversible_Linear_Layer, self).__init__()

        self.epsilon=epsilon

        self.U_params = nn.Parameter(torch.randn(dimension, dimension).double())
        self.S_params = nn.Parameter(torch.randn(dimension).double())  
        self.V_params = nn.Parameter(torch.randn(dimension, dimension).double())
        self.bias = nn.Parameter(torch.zeros(dimension).double())

    def compute_orthogonal(self,matrix,SVD=False):
        """Ensures numerically stable orthogonal matrix using SVD."""
        if SVD:
            U, _, Vt = torch.linalg.svd(matrix, full_matrices=True)
            return U @ Vt  # Ensures it is a proper rotation matrix
        else:
            UV,_=torch.linalg.qr(self.U_params)
            return UV
        
    def forward(self, x):
        """Forward pass: Applies W*x + bias"""
        U = self.compute_orthogonal(self.U_params)
        S = torch.diag(F.softplus(self.S_params) + self.epsilon)  # Stabilized singular values
        V = self.compute_orthogonal(self.V_params)
        W = U @ S @ V.T
        return x @ W.T + self.bias

    def inverse(self, x):

        U =  self.compute_orthogonal(self.U_params)
        V =  self.compute_orthogonal(self.V_params)
        S_inv = torch.diag(1.0 / (F.softplus(self.S_params) + self.epsilon))  

        W_inv = V @ S_inv @ U.T  # Compute W inverse
        x = (x - self.bias) @ W_inv.T  # Apply inverse transformation

        return x  


class InvertibleLeakyReLU(nn.Module):
    def __init__(self, alpha=0.01):
        """Invertible Leaky ReLU activation function."""
        super().__init__()
        self.alpha = alpha  

    def forward(self, x):
        """Applies the Leaky ReLU function."""
        return torch.where(x >= 0, x, self.alpha * x)

    def inverse(self, y):
        """Applies the inverse of Leaky ReLU."""
        return torch.where(y >= 0, y, y / self.alpha)


class InvertibleMLP(nn.Module):
    def __init__(self, dimension, layers, alpha=0.01):
        """Invertible MLP using stacked layers."""
        super().__init__()
        Model_Layers = []
        for i in range(layers):
            if i != 0:
                Model_Layers.append(InvertibleLeakyReLU(alpha))
            Model_Layers.append(Inversible_Linear_Layer(dimension))
        self.Model_Layers = nn.ModuleList(Model_Layers)

    def forward(self, x):
        dtype = x.dtype  # Store original precision
        x = x.double()  # Temporarily switch to float64
        for ac_layer in self.Model_Layers:
            x = ac_layer(x)
        return x.to(dtype)

    def inverse(self, y):
        """Applies inverse transformation with high precision."""
        dtype = y.dtype
        y = y.double()  # Switch to float64
        for ac_layer in reversed(self.Model_Layers):
            y = ac_layer.inverse(y)
        return y.to(dtype)  # Convert back to original precision




class phi_class:
    def __init__(self, phi,phi_inv,criterion,optimizer):
        self.phi=phi
        self.phi_inv=phi_inv
        self.criterion=criterion
        self.optimizer=optimizer



In [11]:
class Distributed_Alignment_Search:

    
    def __init__(self, 
                 Model,
                 Model_Layer,
                 Train_Data_Raw,
                 Test_Data_Raw,
                 Eval_Data_Raw,
                 Hidden_Layer_Size,
                 Variable_Dimensions,
                 Transformation_Class,
                 Device):
        self.Model=Model
        self.Model_Layer=Model_Layer
        self.Hidden_Layer_Size=Hidden_Layer_Size
        self.Variable_Dimensions=Variable_Dimensions
        self.Num_Varibales=len(self.Variable_Dimensions)
        self.Transformation_Class=Transformation_Class
        self.Device=Device

        self.mode_info=None
        self.base_activations=None
        self.source_activations=None

        
        self.Train_Dataset,self.Train_Sample_Number=self.Prepare_Dataset(Train_Data_Raw)
        self.Test_Dataset,self.Test_Samples_Number=self.Prepare_Dataset(Test_Data_Raw)
        self.Eval_Dataset,self.Eval_Samples_Number=self.Prepare_Dataset(Eval_Data_Raw)

   
        self.Hook=self.register_intervention_hook(self.Model_Layer)
        

    def Prepare_Dataset(self,Raw_Dataset): 
        Clean_Dataset={}
        Clean_Dataset["base"]=[]
        Clean_Dataset["sources"]=[]
        for _ in range(self.Num_Varibales):
            Clean_Dataset["sources"].append([])
        Clean_Dataset["label"]=[]
        Clean_Dataset["intervention"]=[]

        #Actually adapted to the dataset I am using. Needs to be changed later:
        print("[SYST] Prepare Data")
        for ac_DP_pos in tqdm(range(len(Raw_Dataset))):
            #base input
            ac_DP=Raw_Dataset[ac_DP_pos]
            Clean_Dataset["base"].append(ac_DP["base"])

            #expected label after intervention
            Clean_Dataset["label"].append(ac_DP["label"])

            #source inputs
            for var_dim in range(ac_DP['sources'].shape[0]):
                Clean_Dataset["sources"][var_dim].append(ac_DP['sources'][var_dim])

            #intervention data
            Clean_Dataset["intervention"].append([])
            for Hidden_Dimension in range(self.Hidden_Layer_Size):
                dim_found=False
                for ac_dimensions_pos,ac_dimensions in enumerate(self.Variable_Dimensions):
                    if Hidden_Dimension in ac_dimensions:
                        dim_found=True
                        if ac_DP["intervention"][ac_dimensions_pos]:
                            Clean_Dataset["intervention"][-1].append(True)
                        else:
                            Clean_Dataset["intervention"][-1].append(False)
                        break
                if not dim_found:
                    Clean_Dataset["intervention"][-1].append(False)
            Raw_Dataset[ac_DP_pos]=None
            
        #Make tensors
        sample_number=len(Clean_Dataset["label"])
        Clean_Dataset["base"]=torch.stack(Clean_Dataset["base"]).to(self.Device)
        Clean_Dataset["label"]=torch.stack(Clean_Dataset["label"]).to(self.Device)
        for i in range(len(Clean_Dataset["sources"])):
            Clean_Dataset["sources"][i]=torch.stack(Clean_Dataset["sources"][i]).to(self.Device)
        Clean_Dataset["intervention"]=torch.tensor(Clean_Dataset["intervention"]).to(self.Device)
        return Clean_Dataset,sample_number
                        
        
    def register_intervention_hook(self, layer):
        def hook_fn(module, input, output):
            if self.mode_info[0] == "source":
                # Extract row indices (list)
                row_indices = self.mode_info[2]
                
                # Extract column indices (list)
                col_indices = self.Variable_Dimensions[self.mode_info[1]]
                
                # Get values from the transformation tensor
                transformed_values = self.Transformation_Class.phi(output.detach())[:, col_indices]
                
                # Assign these values to the corresponding positions in source_activations
                self.source_activations[torch.tensor(row_indices).unsqueeze(1), torch.tensor(col_indices).unsqueeze(0)] = transformed_values
            
            elif self.mode_info[0] == "intervene":
                result_tensor = self.Transformation_Class.phi(output.detach())
                result_tensor = torch.where(self.mode_info[1], self.source_activations, result_tensor)
                return self.Transformation_Class.phi_inv(result_tensor)
        
        return layer.register_forward_hook(hook_fn)

    #Train Test and Eval of DAS transformation function
    def train_test(self,batch_size,epochs=1,mode=1,early_stopping_threshold=3): #1=train,2=test,3=eval

        self.Model.eval()
        for param in self.Model.parameters():
            param.requires_grad = False  # This freezes the weights

        if mode==1: #Train
            self.Transformation_Class.phi.train()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = True  # This unfreezes the weights
            data=self.Train_Dataset
            Sample_Indices=list(range(self.Train_Sample_Number))
        elif mode==2:  #Test
            self.Transformation_Class.phi.eval()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = False  # This freezes the weights
            data=self.Test_Dataset
            Sample_Indices=list(range(self.Test_Samples_Number))
        elif mode==3:  #Eval
            self.Transformation_Class.phi.eval()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = False  # This freezes the weights
            data=self.Eval_Dataset
            Sample_Indices=list(range(self.Eval_Samples_Number))
        
        best_accuracy=-1
        steps_without_improvement=0
        Best_Phi=None
        for epoch in range(epochs):
            print("[SYST] Epoch",epoch)
            total_correct = 0
            total_samples = 0
            total_loss = 0
        
            #Make Batches
            random.shuffle(Sample_Indices)
            DAS_Train_Batches=self.chunk_list(Sample_Indices, batch_size)
            
            for ac_batch in tqdm(DAS_Train_Batches):

                if mode==1: 
                    self.Transformation_Class.optimizer.zero_grad()
                
                #Prepare Source Activations
                self.source_activations = torch.zeros(len(ac_batch), self.Hidden_Layer_Size).to(self.Device)
                
                for ac_source_pos in range(len(data["sources"])):
                    #This extracts which sources actually are used. This avoids running them through the model as they are not used.
                    used_source_indices=self.extract_sources_to_run(ac_source_pos,ac_batch,data)
                    if len(used_source_indices)>0:
                        #Informes the hook what to do. Its a source input batch where it is for variable ac_source_pos and only
                        #used_source_indices positions are run as all other samples will not intervene on that variable
                        self.mode_info=["source",ac_source_pos,used_source_indices]
                        ac_source=data["sources"][ac_source_pos][ac_batch][used_source_indices]
                        model(ac_source)
        
                #Intervention
                ac_base=data["base"][ac_batch]
                intervention_bools=data["intervention"][ac_batch]
                #Informes the hook what to do. Its the intervention where intervention_bools signals the positions the values from
                #the self.source_activations have to be copied.
                self.mode_info=["intervene",intervention_bools]
                outputs=model(ac_base)
                labels=data["label"][ac_batch]
                if mode==1:
                    loss = self.Transformation_Class.criterion(outputs, labels.squeeze().long())
                    loss.backward()
                    self.Transformation_Class.optimizer.step()
                    total_loss += loss.item()

                else:
                    predictions = torch.argmax(outputs, dim=1) 
                    correct = (predictions.squeeze() == labels.squeeze()).sum().item()
                    total_correct += correct
                    total_samples += labels.size(0)

            #Code for early stopping
            if mode==1:
                eval_acc=self.train_test(batch_size,epochs=1,mode=3)
                if eval_acc>best_accuracy:
                    best_accuracy=eval_acc
                    steps_without_improvement=0
                    Best_Phi=copy.deepcopy(self.Transformation_Class.phi)
                elif steps_without_improvement>=early_stopping_threshold or epoch == epochs-1:
                    """ #In case we want to use a rotation as phi:
                    Best_Phi.to(self.Device)
                    Best_Phi_inverse=InverseTransformation_Function(Best_Phi)
                    criterion = nn.CrossEntropyLoss()
                    optimizer = optim.Adam(Best_Phi.parameters(), lr=0.001)
                    """
                    Best_Phi.to(self.Device)
                    Best_Phi_inverse=Best_Phi.inverse
                    criterion = nn.CrossEntropyLoss()
                    optimizer = optim.Adam(Best_Phi.parameters(), lr=0.001)
                    self.Transformation_Class=phi_class(Best_Phi,Best_Phi_inverse,criterion,optimizer)
                    break
                else:
                    steps_without_improvement+=1
                print(f"Epoch {epoch+1}, Loss: {total_loss / len(DAS_Train_Batches)}","steps without improvement:",steps_without_improvement,"best accuracy:",best_accuracy)
                    
        if mode==2 or mode==3:
            self.Transformation_Class.phi.train()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = True  # This unfreezes the weights
            accuracy = total_correct / total_samples
            if mode==2:
                print(f"Test Accuracy: {accuracy * 100:.2f}%")
            return accuracy
                

    #This function extracts the positionso of the source samples which are used for variable which_variable in intervention
    def extract_sources_to_run(self,which_variable,batch_indices,data):
        used_source_indices=[]
        for ip, i in enumerate(batch_indices):
            is_used=data["intervention"][i][self.Variable_Dimensions[which_variable][0]]
            if is_used:
                used_source_indices.append(ip)
        return used_source_indices


    # makes batch indices
    def chunk_list(self, input_list, batch_size):
        return [input_list[i:i + batch_size] for i in range(0, len(input_list), batch_size)]

    
    def Cleanup(self):
        self.Hook.remove()

In [None]:
results=[]
#Seeds where generated by ChatGPT so where not tuned by myself to make a point
for acseed in [4287, 3837, 9097, 2635, 5137, 6442, 5234, 4641, 8039, 2266]: 
    results.append({})
    set_seed(acseed)
    model,accuracy=make_model(epochs=20)
    Layers=[]
    Layers.append(("Layer1",model.mlp.h[0]))
    Layers.append(("Layer2",model.mlp.h[1]))
    Layers.append(("Layer3",model.mlp.h[2]))
    inter_dims=[]
    
    inter_dims.append([list(range(0,8)),list(range(8,16))])
    inter_dims.append([list(range(0,2)),list(range(2,4))])
    inter_dims.append([list(range(0,1)),list(range(1,2))])
    """#In case we only intervene on one variable (e.g. make_intervention_dataset_first_input_intervention):
    inter_dims.append([list(range(0,8))])
    inter_dims.append([list(range(0,2))])
    inter_dims.append([list(range(0,1))])
    """
    results[-1]["accuracy"]=accuracy
    for LayerName,Layer in Layers:
        results[-1][LayerName]={}
        for inter_dim in inter_dims:
            print(LayerName,":",inter_dim)
            DAS_Train=make_intervention_dataset_variable_intervention_all(1280000,4)
            DAS_Test=make_intervention_dataset_variable_intervention_all(10000,4)
            DAS_Eval=make_intervention_dataset_variable_intervention_all(10000,4)
            #DAS_Train=make_intervention_dataset_variable_intervention_first(1280000,4)
            #DAS_Test=make_intervention_dataset_variable_intervention_first(10000,4)
            #DAS_Eval=make_intervention_dataset_variable_intervention_first(10000,4)
            #DAS_Train=make_intervention_dataset_first_input_intervention(1280000,4)
            #DAS_Test=make_intervention_dataset_first_input_intervention(10000,4)
            #DAS_Eval=make_intervention_dataset_first_input_intervention(10000,4)
    
            #Initialize transformation function
            """#In case we want to use a rotation as phi:
            p=Transformation_Function(16)
            p.to(DEVICE)
            p_inverse=InverseTransformation_Function(p)
            criterion = nn.CrossEntropyLoss()
            optimizer = optim.Adam(p.parameters(), lr=0.001)
            """
            p = InvertibleMLP(16, 2, alpha=0.1)
            p.to(DEVICE)
            p_inverse = p.inverse
            optimizer = optim.Adam(p.parameters(), lr=0.001)
            criterion = nn.CrossEntropyLoss()
            
            
            phi=phi_class(p,p_inverse,criterion,optimizer)
    
            
    
            DAS_Experiment=Distributed_Alignment_Search(Model=model,
                                                        Model_Layer=Layer,
                                                        Train_Data_Raw=DAS_Train,
                                                        Test_Data_Raw=DAS_Test,
                                                        Eval_Data_Raw=DAS_Eval,
                                                        Hidden_Layer_Size=16,
                                                        Variable_Dimensions=inter_dim,
                                                        Transformation_Class=phi,
                                                        Device=DEVICE)
    
            DAS_Experiment.train_test(batch_size=6400,
                                      epochs=200,
                                      mode=1) #Train
    
            accuracy=DAS_Experiment.train_test(batch_size=6400,
                                               mode=2)#Test
            
            results[-1][LayerName][str(inter_dim)]=accuracy
            DAS_Experiment.Cleanup()
            DAS_Experiment=None
            print(results)

100%|█████████████████████████████████████████████| 1048576/1048576 [00:12<00:00, 84280.06it/s]
  return torch.tensor(model_inputs, dtype=torch.float32).to(DEVICE),torch.tensor(labels, dtype=torch.float32).to(DEVICE)
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 84643.13it/s]
100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.80it/s]


Epoch 1, Loss: 0.3913447721170087 steps without improvement: 7 best accuracy: 0.9834


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.85it/s]


Epoch 2, Loss: 0.026170237798851304 steps without improvement: 71 best accuracy: 0.9968


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.88it/s]


Epoch 3, Loss: 0.00836737672216259 steps without improvement: 40 best accuracy: 0.9983


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.87it/s]


Epoch 4, Loss: 0.004441804104942548 steps without improvement: 366 best accuracy: 0.999


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.88it/s]


Epoch 5, Loss: 0.002791132724212275 steps without improvement: 201 best accuracy: 0.9996


100%|██████████████████████████████████████████████████████| 1024/1024 [01:25<00:00, 11.92it/s]


Epoch 6, Loss: 0.001976955215070575 steps without improvement: 462 best accuracy: 0.9998


 55%|██████████████████████████████▏                        | 562/1024 [00:47<00:38, 11.87it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 86710.77it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 157.83it/s]


Test Accuracy: 0.9996
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:51<00:00, 11491.40it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12118.75it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12196.24it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:16<00:00, 76790.87it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 106738.60it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 108645.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.23it/s]


Epoch 1, Loss: 24.650323538780214 steps without improvement: 0 best accuracy: 0.5807
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 2, Loss: 9.176832597255707 steps without improvement: 0 best accuracy: 0.6057
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 3, Loss: 6.85383875131607 steps without improvement: 0 best accuracy: 0.6464
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 4, Loss: 5.249205205440521 steps without improvement: 0 best accuracy: 0.7055
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 5, Loss: 3.922204986810684 steps without improvement: 0 best accuracy: 0.7463
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 6, Loss: 3.111790215969086 steps without improvement: 0 best accuracy: 0.7657
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 7, Loss: 2.4503201138973236 steps without improvement: 0 best accuracy: 0.7925
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 8, Loss: 1.9304399001598358 steps without improvement: 0 best accuracy: 0.8187
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 9, Loss: 1.5192211806774139 steps without improvement: 0 best accuracy: 0.8487
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 10, Loss: 1.2258496430516244 steps without improvement: 0 best accuracy: 0.8718
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 11, Loss: 0.9824877375364304 steps without improvement: 0 best accuracy: 0.8906
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 12, Loss: 0.842399324476719 steps without improvement: 0 best accuracy: 0.8991
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 13, Loss: 0.742695437669754 steps without improvement: 0 best accuracy: 0.9091
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 14, Loss: 0.6447095933556557 steps without improvement: 0 best accuracy: 0.9248
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 15, Loss: 0.5523323418200016 steps without improvement: 0 best accuracy: 0.9321
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 16, Loss: 0.46938629016280176 steps without improvement: 0 best accuracy: 0.941
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 17, Loss: 0.3886643473803997 steps without improvement: 0 best accuracy: 0.9523
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 18, Loss: 0.3297267981618643 steps without improvement: 0 best accuracy: 0.9592
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 19, Loss: 0.28965751960873604 steps without improvement: 0 best accuracy: 0.9607
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 20, Loss: 0.26187342368066313 steps without improvement: 0 best accuracy: 0.9645
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 21, Loss: 0.23685550585389137 steps without improvement: 0 best accuracy: 0.9653
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 22, Loss: 0.21358958415687085 steps without improvement: 0 best accuracy: 0.967
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 23, Loss: 0.1938586315512657 steps without improvement: 0 best accuracy: 0.9714
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 24, Loss: 0.1771642482280731 steps without improvement: 0 best accuracy: 0.9742
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 25, Loss: 0.16189721755683423 steps without improvement: 0 best accuracy: 0.9755
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.22it/s]


Epoch 26, Loss: 0.1469547964632511 steps without improvement: 0 best accuracy: 0.9775
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 27, Loss: 0.13414838526397943 steps without improvement: 0 best accuracy: 0.9793
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 28, Loss: 0.12368171654641628 steps without improvement: 1 best accuracy: 0.9793
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 29, Loss: 0.1151294631138444 steps without improvement: 0 best accuracy: 0.9828
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 30, Loss: 0.10741013078019022 steps without improvement: 0 best accuracy: 0.9831
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 31, Loss: 0.10052467882633209 steps without improvement: 0 best accuracy: 0.9833
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 32, Loss: 0.09361122278496622 steps without improvement: 0 best accuracy: 0.9844
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 33, Loss: 0.08754279593005776 steps without improvement: 1 best accuracy: 0.9844
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 34, Loss: 0.08175460563972592 steps without improvement: 0 best accuracy: 0.9869
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 35, Loss: 0.07561774732545018 steps without improvement: 0 best accuracy: 0.9878
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 36, Loss: 0.06992846326902509 steps without improvement: 0 best accuracy: 0.9888
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 37, Loss: 0.06547129351645709 steps without improvement: 0 best accuracy: 0.989
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 38, Loss: 0.06078342132270336 steps without improvement: 0 best accuracy: 0.9895
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 39, Loss: 0.0572404639236629 steps without improvement: 0 best accuracy: 0.99
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 40, Loss: 0.05433818753808737 steps without improvement: 0 best accuracy: 0.9908
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 41, Loss: 0.052084269132465125 steps without improvement: 0 best accuracy: 0.991
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 42, Loss: 0.04967110928148031 steps without improvement: 0 best accuracy: 0.9922
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 43, Loss: 0.048479678388684985 steps without improvement: 1 best accuracy: 0.9922
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 44, Loss: 0.0456805566791445 steps without improvement: 2 best accuracy: 0.9922
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 45, Loss: 0.0438735734205693 steps without improvement: 3 best accuracy: 0.9922
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 46, Loss: 0.04220771932043135 steps without improvement: 0 best accuracy: 0.9931
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 47, Loss: 0.040824172412976624 steps without improvement: 1 best accuracy: 0.9931
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 48, Loss: 0.039368976382538674 steps without improvement: 2 best accuracy: 0.9931
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 49, Loss: 0.037536248695105315 steps without improvement: 3 best accuracy: 0.9931
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.20it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Test Accuracy: 99.28%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928}}]
Layer1 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11835.00it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12651.41it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12690.37it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 83930.96it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 114214.94it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116253.01it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 1, Loss: 27.332066583633424 steps without improvement: 0 best accuracy: 0.5814
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 2, Loss: 9.944020853042602 steps without improvement: 0 best accuracy: 0.6078
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 3, Loss: 7.436495389938354 steps without improvement: 0 best accuracy: 0.6209
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 4, Loss: 5.534648530483246 steps without improvement: 0 best accuracy: 0.6317
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 5, Loss: 4.387919903993606 steps without improvement: 0 best accuracy: 0.6599
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 6, Loss: 3.456557185649872 steps without improvement: 0 best accuracy: 0.6866
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 7, Loss: 2.743891644477844 steps without improvement: 0 best accuracy: 0.7099
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 8, Loss: 2.148085893392563 steps without improvement: 0 best accuracy: 0.7511
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 9, Loss: 1.6437836968898774 steps without improvement: 0 best accuracy: 0.7842
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 10, Loss: 1.3307760524749757 steps without improvement: 0 best accuracy: 0.8053
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 11, Loss: 1.0907101720571517 steps without improvement: 0 best accuracy: 0.8183
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 12, Loss: 0.9178336414694787 steps without improvement: 0 best accuracy: 0.8215
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 13, Loss: 0.8136310499906539 steps without improvement: 0 best accuracy: 0.8325
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 14, Loss: 0.7606803560256958 steps without improvement: 1 best accuracy: 0.8325
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 15, Loss: 0.7155256357789039 steps without improvement: 0 best accuracy: 0.8576
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 16, Loss: 0.6700088739395141 steps without improvement: 0 best accuracy: 0.8689
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 17, Loss: 0.6466978830099106 steps without improvement: 1 best accuracy: 0.8689
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 18, Loss: 0.6177814334630967 steps without improvement: 0 best accuracy: 0.8755
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 19, Loss: 0.59602608025074 steps without improvement: 0 best accuracy: 0.8776
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 20, Loss: 0.5834155398607254 steps without improvement: 1 best accuracy: 0.8776
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 21, Loss: 0.5627422162890434 steps without improvement: 2 best accuracy: 0.8776
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 22, Loss: 0.5537863110005855 steps without improvement: 3 best accuracy: 0.8776
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 23, Loss: 0.538337177336216 steps without improvement: 0 best accuracy: 0.8851
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 24, Loss: 0.5284720388054848 steps without improvement: 0 best accuracy: 0.8884
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 25, Loss: 0.5167172262072564 steps without improvement: 1 best accuracy: 0.8884
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 26, Loss: 0.5023061308264732 steps without improvement: 2 best accuracy: 0.8884
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 27, Loss: 0.4905829755961895 steps without improvement: 0 best accuracy: 0.89
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 28, Loss: 0.4803456343710423 steps without improvement: 0 best accuracy: 0.8958
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 29, Loss: 0.47755820825695994 steps without improvement: 0 best accuracy: 0.8961
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 30, Loss: 0.46192065730690957 steps without improvement: 1 best accuracy: 0.8961
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 31, Loss: 0.45628797486424444 steps without improvement: 0 best accuracy: 0.8988
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 32, Loss: 0.4498753197491169 steps without improvement: 0 best accuracy: 0.9026
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 33, Loss: 0.44222732141613963 steps without improvement: 0 best accuracy: 0.9053
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 34, Loss: 0.4329617291688919 steps without improvement: 1 best accuracy: 0.9053
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 35, Loss: 0.4267712511122227 steps without improvement: 0 best accuracy: 0.9075
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 36, Loss: 0.42183852910995484 steps without improvement: 1 best accuracy: 0.9075
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 37, Loss: 0.41489958837628366 steps without improvement: 2 best accuracy: 0.9075
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 38, Loss: 0.4075025601685047 steps without improvement: 0 best accuracy: 0.9117
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 39, Loss: 0.3981250447034836 steps without improvement: 1 best accuracy: 0.9117
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 40, Loss: 0.39095484629273414 steps without improvement: 0 best accuracy: 0.9149
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 41, Loss: 0.3807536990940571 steps without improvement: 1 best accuracy: 0.9149
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 42, Loss: 0.3713836717605591 steps without improvement: 0 best accuracy: 0.9172
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 43, Loss: 0.36425520449876786 steps without improvement: 0 best accuracy: 0.9197
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 44, Loss: 0.35737244710326194 steps without improvement: 1 best accuracy: 0.9197
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 45, Loss: 0.34795962408185005 steps without improvement: 2 best accuracy: 0.9197
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 46, Loss: 0.33988756105303763 steps without improvement: 3 best accuracy: 0.9197
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 47, Loss: 0.3319270932674408 steps without improvement: 0 best accuracy: 0.9227
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 48, Loss: 0.3248924033343792 steps without improvement: 0 best accuracy: 0.9271
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 49, Loss: 0.3214985902607441 steps without improvement: 1 best accuracy: 0.9271
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 50, Loss: 0.3187601211667061 steps without improvement: 2 best accuracy: 0.9271
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 51, Loss: 0.3118874576687813 steps without improvement: 0 best accuracy: 0.9293
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 52, Loss: 0.30602357745170594 steps without improvement: 0 best accuracy: 0.9312
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 53, Loss: 0.3025653490424156 steps without improvement: 0 best accuracy: 0.9332
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 54, Loss: 0.29698628835380075 steps without improvement: 1 best accuracy: 0.9332
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 55, Loss: 0.2912058510631323 steps without improvement: 2 best accuracy: 0.9332
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 56, Loss: 0.28878059431910513 steps without improvement: 0 best accuracy: 0.9368
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 57, Loss: 0.28427044205367563 steps without improvement: 1 best accuracy: 0.9368
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.23it/s]


Epoch 58, Loss: 0.2811803883314133 steps without improvement: 2 best accuracy: 0.9368
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 59, Loss: 0.2750003734976053 steps without improvement: 3 best accuracy: 0.9368
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Test Accuracy: 93.29%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329}}]
Layer1 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:49<00:00, 11647.76it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12616.23it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12616.38it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 82776.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 115870.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 117651.63it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 1, Loss: 16.955658316612244 steps without improvement: 0 best accuracy: 0.5779
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 2, Loss: 8.598984317779541 steps without improvement: 0 best accuracy: 0.5904
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 3, Loss: 7.423161971569061 steps without improvement: 0 best accuracy: 0.6124
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 4, Loss: 6.623968245983124 steps without improvement: 0 best accuracy: 0.6196
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 5, Loss: 6.105799415111542 steps without improvement: 0 best accuracy: 0.6357
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 6, Loss: 5.707762739658356 steps without improvement: 0 best accuracy: 0.6477
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 7, Loss: 5.3664284658432 steps without improvement: 0 best accuracy: 0.6642
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 8, Loss: 4.952395741939545 steps without improvement: 1 best accuracy: 0.6642
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 9, Loss: 4.578347874879837 steps without improvement: 0 best accuracy: 0.67
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 10, Loss: 4.332674082517624 steps without improvement: 0 best accuracy: 0.6721
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 11, Loss: 4.149761980772018 steps without improvement: 1 best accuracy: 0.6721
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 12, Loss: 3.9864579856395723 steps without improvement: 2 best accuracy: 0.6721
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 13, Loss: 3.8645367431640625 steps without improvement: 0 best accuracy: 0.6726
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 14, Loss: 3.7141657245159148 steps without improvement: 1 best accuracy: 0.6726
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.47it/s]


Epoch 15, Loss: 3.4399039375782015 steps without improvement: 2 best accuracy: 0.6726
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 16, Loss: 3.0772754228115082 steps without improvement: 3 best accuracy: 0.6726
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Test Accuracy: 67.33%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:46<00:00, 11963.02it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12535.59it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12598.25it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:18<00:00, 69390.22it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 107398.65it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 107786.15it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 1, Loss: 7.415233434438705 steps without improvement: 0 best accuracy: 0.5944
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 2, Loss: 2.752131099700928 steps without improvement: 0 best accuracy: 0.6309
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 3, Loss: 1.7832964676618577 steps without improvement: 0 best accuracy: 0.6639
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 4, Loss: 1.3181106144189834 steps without improvement: 0 best accuracy: 0.6942
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 5, Loss: 0.9575681093335152 steps without improvement: 0 best accuracy: 0.7287
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 6, Loss: 0.705530911386013 steps without improvement: 0 best accuracy: 0.7682
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 7, Loss: 0.5861458119750023 steps without improvement: 0 best accuracy: 0.7973
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 8, Loss: 0.4728355829417705 steps without improvement: 0 best accuracy: 0.83
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 9, Loss: 0.382758612036705 steps without improvement: 0 best accuracy: 0.8475
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 10, Loss: 0.3434907923638821 steps without improvement: 0 best accuracy: 0.8573
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 11, Loss: 0.31752160876989366 steps without improvement: 0 best accuracy: 0.8699
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 12, Loss: 0.2867199370265007 steps without improvement: 0 best accuracy: 0.9052
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 13, Loss: 0.2429290534555912 steps without improvement: 0 best accuracy: 0.9275
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 14, Loss: 0.21061677820980548 steps without improvement: 0 best accuracy: 0.9413
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 15, Loss: 0.18725581161677837 steps without improvement: 0 best accuracy: 0.9487
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 16, Loss: 0.17193149745464326 steps without improvement: 0 best accuracy: 0.9536
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 17, Loss: 0.1575735043734312 steps without improvement: 0 best accuracy: 0.9599
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 18, Loss: 0.14611843086779117 steps without improvement: 0 best accuracy: 0.964
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 19, Loss: 0.13748300459235907 steps without improvement: 0 best accuracy: 0.9672
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 20, Loss: 0.12863873422145844 steps without improvement: 0 best accuracy: 0.9706
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 21, Loss: 0.12306438896805048 steps without improvement: 0 best accuracy: 0.9728
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 22, Loss: 0.11647046871483326 steps without improvement: 0 best accuracy: 0.9738
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 23, Loss: 0.1120542148500681 steps without improvement: 0 best accuracy: 0.9752
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 24, Loss: 0.10714911617338657 steps without improvement: 0 best accuracy: 0.9773
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 25, Loss: 0.10181882128119468 steps without improvement: 0 best accuracy: 0.9781
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 26, Loss: 0.09803782403469086 steps without improvement: 0 best accuracy: 0.9789
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 27, Loss: 0.09465053237974644 steps without improvement: 0 best accuracy: 0.9801
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 28, Loss: 0.09038782466202974 steps without improvement: 0 best accuracy: 0.9821
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 29, Loss: 0.08687265671789646 steps without improvement: 0 best accuracy: 0.9832
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 30, Loss: 0.08332105100154877 steps without improvement: 0 best accuracy: 0.9846
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 31, Loss: 0.07962536606937647 steps without improvement: 0 best accuracy: 0.986
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 32, Loss: 0.07543641341850162 steps without improvement: 0 best accuracy: 0.9875
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 33, Loss: 0.07088914673775434 steps without improvement: 1 best accuracy: 0.9875
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 34, Loss: 0.06583948031067849 steps without improvement: 0 best accuracy: 0.9886
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 35, Loss: 0.05825534829869866 steps without improvement: 1 best accuracy: 0.9886
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 36, Loss: 0.05232313180342316 steps without improvement: 0 best accuracy: 0.9893
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 37, Loss: 0.04740625281818211 steps without improvement: 0 best accuracy: 0.9899
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 38, Loss: 0.044995908830314874 steps without improvement: 1 best accuracy: 0.9899
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 39, Loss: 0.041800430873408914 steps without improvement: 0 best accuracy: 0.9901
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 40, Loss: 0.03875255835242569 steps without improvement: 0 best accuracy: 0.9917
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 41, Loss: 0.0548464226629585 steps without improvement: 1 best accuracy: 0.9917
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 42, Loss: 0.03642970134504139 steps without improvement: 0 best accuracy: 0.9927
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 43, Loss: 0.03488817801699042 steps without improvement: 1 best accuracy: 0.9927
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 44, Loss: 0.033599049616605044 steps without improvement: 0 best accuracy: 0.993
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 45, Loss: 0.032198642063885924 steps without improvement: 1 best accuracy: 0.993
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 46, Loss: 0.031385915167629716 steps without improvement: 0 best accuracy: 0.9933
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 47, Loss: 0.030291358977556228 steps without improvement: 0 best accuracy: 0.9937
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 48, Loss: 0.029743103431537746 steps without improvement: 1 best accuracy: 0.9937
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 49, Loss: 0.028886943710967897 steps without improvement: 0 best accuracy: 0.9943
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 50, Loss: 0.027603775560855866 steps without improvement: 0 best accuracy: 0.9947
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.43it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 51, Loss: 0.026781802959740163 steps without improvement: 0 best accuracy: 0.9948
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.42it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 52, Loss: 0.026160609712824225 steps without improvement: 1 best accuracy: 0.9948
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 53, Loss: 0.025386469052173198 steps without improvement: 0 best accuracy: 0.9951
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 54, Loss: 0.025037607047706842 steps without improvement: 1 best accuracy: 0.9951
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 55, Loss: 0.024191208705306052 steps without improvement: 2 best accuracy: 0.9951
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 56, Loss: 0.023505070926621557 steps without improvement: 3 best accuracy: 0.9951
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.16it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Test Accuracy: 99.53%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953}}]
Layer2 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11873.22it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12529.33it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12529.52it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 82576.61it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 112619.02it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 111742.03it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 1, Loss: 8.446262627840042 steps without improvement: 0 best accuracy: 0.5828
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 2, Loss: 3.4224861896038057 steps without improvement: 0 best accuracy: 0.5983
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 3, Loss: 2.674361332654953 steps without improvement: 0 best accuracy: 0.6008
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.20it/s]


Epoch 4, Loss: 2.2200047826766967 steps without improvement: 0 best accuracy: 0.6032
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 5, Loss: 1.935361031293869 steps without improvement: 0 best accuracy: 0.6111
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 6, Loss: 1.743183332681656 steps without improvement: 0 best accuracy: 0.613
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 7, Loss: 1.6010019141435623 steps without improvement: 0 best accuracy: 0.6134
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 8, Loss: 1.5076222985982894 steps without improvement: 1 best accuracy: 0.6134
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.22it/s]


Epoch 9, Loss: 1.4115800482034684 steps without improvement: 0 best accuracy: 0.6151
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 10, Loss: 1.3153702878952027 steps without improvement: 0 best accuracy: 0.6155
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 11, Loss: 1.243569037914276 steps without improvement: 0 best accuracy: 0.6259
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 12, Loss: 1.1973784148693085 steps without improvement: 0 best accuracy: 0.6286
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 13, Loss: 1.1524317276477813 steps without improvement: 0 best accuracy: 0.6371
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 14, Loss: 1.0781514093279838 steps without improvement: 0 best accuracy: 0.6462
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 15, Loss: 1.0274665266275407 steps without improvement: 0 best accuracy: 0.6549
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 16, Loss: 0.9858065724372864 steps without improvement: 0 best accuracy: 0.663
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 17, Loss: 0.9489030808210372 steps without improvement: 0 best accuracy: 0.666
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 18, Loss: 0.9227358910441399 steps without improvement: 0 best accuracy: 0.676
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.18it/s]


Epoch 19, Loss: 0.9101845201849937 steps without improvement: 1 best accuracy: 0.676
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 20, Loss: 0.879978928565979 steps without improvement: 0 best accuracy: 0.6839
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 21, Loss: 0.8599952125549316 steps without improvement: 0 best accuracy: 0.6907
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 22, Loss: 0.8454702287912369 steps without improvement: 0 best accuracy: 0.6917
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 23, Loss: 0.827608332335949 steps without improvement: 1 best accuracy: 0.6917
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 24, Loss: 0.8194040122628212 steps without improvement: 2 best accuracy: 0.6917
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 25, Loss: 0.8066642785072327 steps without improvement: 0 best accuracy: 0.697
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 26, Loss: 0.7964446428418159 steps without improvement: 0 best accuracy: 0.6978
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 27, Loss: 0.7869670182466507 steps without improvement: 0 best accuracy: 0.7002
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 28, Loss: 0.77703778475523 steps without improvement: 0 best accuracy: 0.7009
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 29, Loss: 0.7664320608973503 steps without improvement: 1 best accuracy: 0.7009
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.18it/s]


Epoch 30, Loss: 0.7630476322770119 steps without improvement: 0 best accuracy: 0.7053
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 31, Loss: 0.7571809679269791 steps without improvement: 0 best accuracy: 0.7093
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 32, Loss: 0.7574814888834953 steps without improvement: 1 best accuracy: 0.7093
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 33, Loss: 0.7378209948539733 steps without improvement: 2 best accuracy: 0.7093
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 34, Loss: 0.7404200956225395 steps without improvement: 3 best accuracy: 0.7093
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 35, Loss: 0.7270493498444557 steps without improvement: 0 best accuracy: 0.7122
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.23it/s]


Epoch 36, Loss: 0.7184893748164177 steps without improvement: 0 best accuracy: 0.7134
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 37, Loss: 0.7103820106387139 steps without improvement: 1 best accuracy: 0.7134
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 38, Loss: 0.7113658556342125 steps without improvement: 0 best accuracy: 0.7158
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 39, Loss: 0.7025829946994782 steps without improvement: 0 best accuracy: 0.7178
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 40, Loss: 0.6970980009436607 steps without improvement: 0 best accuracy: 0.7212
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 41, Loss: 0.6910046201944351 steps without improvement: 0 best accuracy: 0.7276
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 42, Loss: 0.6823034217953682 steps without improvement: 1 best accuracy: 0.7276
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 43, Loss: 0.6925342527031898 steps without improvement: 0 best accuracy: 0.7317
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 44, Loss: 0.6733298322558403 steps without improvement: 1 best accuracy: 0.7317
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 45, Loss: 0.6728735840320588 steps without improvement: 2 best accuracy: 0.7317
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 46, Loss: 0.6704588043689728 steps without improvement: 3 best accuracy: 0.7317
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 47, Loss: 0.6625248125195503 steps without improvement: 0 best accuracy: 0.7327
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 48, Loss: 0.6594172596931458 steps without improvement: 1 best accuracy: 0.7327
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 49, Loss: 0.6579772850871086 steps without improvement: 0 best accuracy: 0.7363
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 50, Loss: 0.6570510479807854 steps without improvement: 0 best accuracy: 0.7373
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 51, Loss: 0.651796267926693 steps without improvement: 1 best accuracy: 0.7373
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 52, Loss: 0.6504920172691345 steps without improvement: 0 best accuracy: 0.7392
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 53, Loss: 0.6469368857145309 steps without improvement: 0 best accuracy: 0.7402
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 54, Loss: 0.6448197397589683 steps without improvement: 1 best accuracy: 0.7402
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 55, Loss: 0.6461941829323768 steps without improvement: 2 best accuracy: 0.7402
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 56, Loss: 0.6424591860175133 steps without improvement: 0 best accuracy: 0.7433
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 57, Loss: 0.643079571723938 steps without improvement: 1 best accuracy: 0.7433
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 58, Loss: 0.6398271253705025 steps without improvement: 2 best accuracy: 0.7433
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 59, Loss: 0.6360837456583976 steps without improvement: 3 best accuracy: 0.7433
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Test Accuracy: 74.84%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484}}]
Layer2 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11877.38it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12513.99it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12562.42it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:17<00:00, 73663.90it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116451.84it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116743.23it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 1, Loss: 11.631564323902131 steps without improvement: 0 best accuracy: 0.5874
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 2, Loss: 4.001434634923935 steps without improvement: 0 best accuracy: 0.5977
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 3, Loss: 2.9244289314746856 steps without improvement: 0 best accuracy: 0.6183
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 4, Loss: 2.2064585334062574 steps without improvement: 0 best accuracy: 0.641
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 5, Loss: 1.6390659272670747 steps without improvement: 0 best accuracy: 0.6571
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 6, Loss: 1.3732565116882325 steps without improvement: 0 best accuracy: 0.6764
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 7, Loss: 1.1787688305974007 steps without improvement: 0 best accuracy: 0.6937
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 8, Loss: 0.992146672308445 steps without improvement: 0 best accuracy: 0.7187
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 9, Loss: 0.8042085525393486 steps without improvement: 0 best accuracy: 0.755
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 10, Loss: 0.6975459131598473 steps without improvement: 0 best accuracy: 0.7642
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 11, Loss: 0.6303044709563256 steps without improvement: 0 best accuracy: 0.776
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 12, Loss: 0.5796428376436233 steps without improvement: 0 best accuracy: 0.7862
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 13, Loss: 0.5335856631398201 steps without improvement: 0 best accuracy: 0.7937
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 14, Loss: 0.44867886587977407 steps without improvement: 0 best accuracy: 0.8149
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 15, Loss: 0.3808724203705788 steps without improvement: 0 best accuracy: 0.8289
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 16, Loss: 0.3540398934483528 steps without improvement: 0 best accuracy: 0.8351
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 17, Loss: 0.33778257384896276 steps without improvement: 0 best accuracy: 0.8445
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 18, Loss: 0.3265608045458794 steps without improvement: 0 best accuracy: 0.8478
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 19, Loss: 0.3165995244681835 steps without improvement: 0 best accuracy: 0.8522
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 20, Loss: 0.3068834345042706 steps without improvement: 0 best accuracy: 0.8529
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 21, Loss: 0.2981433555483818 steps without improvement: 0 best accuracy: 0.8552
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 22, Loss: 0.29042517200112344 steps without improvement: 0 best accuracy: 0.8564
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 23, Loss: 0.2832484509050846 steps without improvement: 0 best accuracy: 0.8584
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 24, Loss: 0.27694214731454847 steps without improvement: 1 best accuracy: 0.8584
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 25, Loss: 0.2697097223997116 steps without improvement: 0 best accuracy: 0.8604
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 26, Loss: 0.26337293587625027 steps without improvement: 0 best accuracy: 0.8636
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 27, Loss: 0.2567040503770113 steps without improvement: 0 best accuracy: 0.8667
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 28, Loss: 0.24796345330774783 steps without improvement: 0 best accuracy: 0.8717
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 29, Loss: 0.24085797272622586 steps without improvement: 0 best accuracy: 0.8726
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 30, Loss: 0.2355245629698038 steps without improvement: 0 best accuracy: 0.877
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 31, Loss: 0.23049495071172715 steps without improvement: 0 best accuracy: 0.88
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 32, Loss: 0.22665293231606484 steps without improvement: 0 best accuracy: 0.8823
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 33, Loss: 0.22336896553635596 steps without improvement: 1 best accuracy: 0.8823
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 34, Loss: 0.21957771614193916 steps without improvement: 2 best accuracy: 0.8823
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 35, Loss: 0.2174421875923872 steps without improvement: 0 best accuracy: 0.8846
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 36, Loss: 0.2151792935281992 steps without improvement: 0 best accuracy: 0.8857
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 37, Loss: 0.21258883498609066 steps without improvement: 0 best accuracy: 0.8858
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 38, Loss: 0.2107461205869913 steps without improvement: 1 best accuracy: 0.8858
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 39, Loss: 0.20894760012626648 steps without improvement: 0 best accuracy: 0.8892
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 40, Loss: 0.20718979083001612 steps without improvement: 0 best accuracy: 0.8894
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 41, Loss: 0.20549683690071105 steps without improvement: 0 best accuracy: 0.89
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 42, Loss: 0.20423516884446144 steps without improvement: 0 best accuracy: 0.8912
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 43, Loss: 0.2024419054389 steps without improvement: 0 best accuracy: 0.8926
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 44, Loss: 0.20091109223663806 steps without improvement: 1 best accuracy: 0.8926
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 45, Loss: 0.20005346551537515 steps without improvement: 0 best accuracy: 0.8934
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 46, Loss: 0.19809993773698806 steps without improvement: 0 best accuracy: 0.8955
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 47, Loss: 0.19657052852213383 steps without improvement: 0 best accuracy: 0.8971
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 48, Loss: 0.1946529169380665 steps without improvement: 0 best accuracy: 0.8974
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 49, Loss: 0.19408486999571323 steps without improvement: 0 best accuracy: 0.8995
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 50, Loss: 0.1919846810400486 steps without improvement: 0 best accuracy: 0.9004
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 51, Loss: 0.1911270283907652 steps without improvement: 1 best accuracy: 0.9004
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 52, Loss: 0.18856056950986386 steps without improvement: 0 best accuracy: 0.9016
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 53, Loss: 0.18772721886634827 steps without improvement: 1 best accuracy: 0.9016
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 54, Loss: 0.18559941053390502 steps without improvement: 0 best accuracy: 0.9025
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 55, Loss: 0.18460842579603196 steps without improvement: 0 best accuracy: 0.9051
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.47it/s]


Epoch 56, Loss: 0.18343259245157242 steps without improvement: 1 best accuracy: 0.9051
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 57, Loss: 0.18195114076137542 steps without improvement: 2 best accuracy: 0.9051
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 58, Loss: 0.18061510413885118 steps without improvement: 0 best accuracy: 0.9056
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 59, Loss: 0.17964608013629912 steps without improvement: 1 best accuracy: 0.9056
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 60, Loss: 0.17957526654005052 steps without improvement: 0 best accuracy: 0.906
[SYST] Epoch 60


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 61, Loss: 0.17792299829423427 steps without improvement: 0 best accuracy: 0.9075
[SYST] Epoch 61


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 62, Loss: 0.17685284711420535 steps without improvement: 0 best accuracy: 0.9088
[SYST] Epoch 62


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 63, Loss: 0.17684530466794968 steps without improvement: 0 best accuracy: 0.9093
[SYST] Epoch 63


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 64, Loss: 0.17512482918798924 steps without improvement: 1 best accuracy: 0.9093
[SYST] Epoch 64


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 65, Loss: 0.17501148484647275 steps without improvement: 2 best accuracy: 0.9093
[SYST] Epoch 65


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 66, Loss: 0.17329249374568462 steps without improvement: 0 best accuracy: 0.9094
[SYST] Epoch 66


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 67, Loss: 0.17310897313058377 steps without improvement: 0 best accuracy: 0.9105
[SYST] Epoch 67


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 68, Loss: 0.17206178270280362 steps without improvement: 1 best accuracy: 0.9105
[SYST] Epoch 68


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 69, Loss: 0.1720570545643568 steps without improvement: 0 best accuracy: 0.9114
[SYST] Epoch 69


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 70, Loss: 0.17146143794059754 steps without improvement: 1 best accuracy: 0.9114
[SYST] Epoch 70


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 71, Loss: 0.17092893786728383 steps without improvement: 2 best accuracy: 0.9114
[SYST] Epoch 71


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 72, Loss: 0.16928037755191327 steps without improvement: 0 best accuracy: 0.9127
[SYST] Epoch 72


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 73, Loss: 0.16900000095367432 steps without improvement: 0 best accuracy: 0.9137
[SYST] Epoch 73


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 74, Loss: 0.16705981269478798 steps without improvement: 1 best accuracy: 0.9137
[SYST] Epoch 74


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 75, Loss: 0.16974970884621143 steps without improvement: 2 best accuracy: 0.9137
[SYST] Epoch 75


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 76, Loss: 0.16615760549902917 steps without improvement: 0 best accuracy: 0.9147
[SYST] Epoch 76


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 77, Loss: 0.16636697225272656 steps without improvement: 0 best accuracy: 0.915
[SYST] Epoch 77


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 78, Loss: 0.16483664229512215 steps without improvement: 0 best accuracy: 0.916
[SYST] Epoch 78


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 79, Loss: 0.17148324981331825 steps without improvement: 1 best accuracy: 0.916
[SYST] Epoch 79


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 80, Loss: 0.16349011421203613 steps without improvement: 0 best accuracy: 0.9172
[SYST] Epoch 80


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 81, Loss: 0.1629813887923956 steps without improvement: 0 best accuracy: 0.918
[SYST] Epoch 81


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 82, Loss: 0.16229966782033445 steps without improvement: 0 best accuracy: 0.9208
[SYST] Epoch 82


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 83, Loss: 0.16270624622702598 steps without improvement: 0 best accuracy: 0.9216
[SYST] Epoch 83


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 84, Loss: 0.1615749728679657 steps without improvement: 0 best accuracy: 0.9235
[SYST] Epoch 84


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 85, Loss: 0.16062580287456513 steps without improvement: 0 best accuracy: 0.925
[SYST] Epoch 85


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 86, Loss: 0.15932263515889644 steps without improvement: 0 best accuracy: 0.926
[SYST] Epoch 86


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 87, Loss: 0.15922417506575584 steps without improvement: 0 best accuracy: 0.9269
[SYST] Epoch 87


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 88, Loss: 0.15811869248747826 steps without improvement: 0 best accuracy: 0.9287
[SYST] Epoch 88


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 89, Loss: 0.15659950874745845 steps without improvement: 0 best accuracy: 0.929
[SYST] Epoch 89


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 90, Loss: 0.15755607843399047 steps without improvement: 0 best accuracy: 0.93
[SYST] Epoch 90


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 91, Loss: 0.15464819133281707 steps without improvement: 0 best accuracy: 0.932
[SYST] Epoch 91


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 92, Loss: 0.15358785592019558 steps without improvement: 0 best accuracy: 0.9337
[SYST] Epoch 92


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 93, Loss: 0.1541175278276205 steps without improvement: 1 best accuracy: 0.9337
[SYST] Epoch 93


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 94, Loss: 0.15180234514176846 steps without improvement: 0 best accuracy: 0.9368
[SYST] Epoch 94


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 95, Loss: 0.15290209241211414 steps without improvement: 0 best accuracy: 0.9373
[SYST] Epoch 95


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 96, Loss: 0.15024395897984505 steps without improvement: 0 best accuracy: 0.9386
[SYST] Epoch 96


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 97, Loss: 0.16274002961814404 steps without improvement: 1 best accuracy: 0.9386
[SYST] Epoch 97


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 98, Loss: 0.15541055858135222 steps without improvement: 0 best accuracy: 0.9427
[SYST] Epoch 98


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 99, Loss: 0.14687555529177188 steps without improvement: 0 best accuracy: 0.9429
[SYST] Epoch 99


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 100, Loss: 0.14585715308785438 steps without improvement: 0 best accuracy: 0.9439
[SYST] Epoch 100


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 101, Loss: 0.14494190774857998 steps without improvement: 0 best accuracy: 0.9449
[SYST] Epoch 101


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 102, Loss: 0.14389255948364735 steps without improvement: 0 best accuracy: 0.9464
[SYST] Epoch 102


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 103, Loss: 0.14302487507462502 steps without improvement: 0 best accuracy: 0.9471
[SYST] Epoch 103


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 104, Loss: 0.1412892822176218 steps without improvement: 0 best accuracy: 0.9482
[SYST] Epoch 104


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 105, Loss: 0.14020960934460164 steps without improvement: 0 best accuracy: 0.949
[SYST] Epoch 105


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 106, Loss: 0.13854621216654778 steps without improvement: 0 best accuracy: 0.9499
[SYST] Epoch 106


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 107, Loss: 0.13736732169985771 steps without improvement: 0 best accuracy: 0.9512
[SYST] Epoch 107


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 108, Loss: 0.13667712025344372 steps without improvement: 0 best accuracy: 0.952
[SYST] Epoch 108


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 109, Loss: 0.13469962183386086 steps without improvement: 0 best accuracy: 0.9542
[SYST] Epoch 109


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 110, Loss: 0.13427315469831227 steps without improvement: 0 best accuracy: 0.9559
[SYST] Epoch 110


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 111, Loss: 0.13163594346493482 steps without improvement: 0 best accuracy: 0.9562
[SYST] Epoch 111


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 112, Loss: 0.13080173198133707 steps without improvement: 0 best accuracy: 0.957
[SYST] Epoch 112


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 113, Loss: 0.1584615881741047 steps without improvement: 1 best accuracy: 0.957
[SYST] Epoch 113


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 114, Loss: 0.1369591197744012 steps without improvement: 2 best accuracy: 0.957
[SYST] Epoch 114


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 115, Loss: 0.127184132412076 steps without improvement: 0 best accuracy: 0.9574
[SYST] Epoch 115


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 116, Loss: 0.12558851212263109 steps without improvement: 0 best accuracy: 0.9585
[SYST] Epoch 116


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 117, Loss: 0.1244576383754611 steps without improvement: 1 best accuracy: 0.9585
[SYST] Epoch 117


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 118, Loss: 0.12341114137321711 steps without improvement: 0 best accuracy: 0.9606
[SYST] Epoch 118


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 119, Loss: 0.1225416200235486 steps without improvement: 0 best accuracy: 0.9609
[SYST] Epoch 119


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 120, Loss: 0.12129747860133648 steps without improvement: 0 best accuracy: 0.9617
[SYST] Epoch 120


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 121, Loss: 0.12040050894021988 steps without improvement: 1 best accuracy: 0.9617
[SYST] Epoch 121


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 122, Loss: 0.11887344408780337 steps without improvement: 0 best accuracy: 0.9622
[SYST] Epoch 122


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 123, Loss: 0.11634724263101816 steps without improvement: 0 best accuracy: 0.9623
[SYST] Epoch 123


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 124, Loss: 0.11421255968511104 steps without improvement: 1 best accuracy: 0.9623
[SYST] Epoch 124


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 125, Loss: 0.10669240839779377 steps without improvement: 0 best accuracy: 0.9661
[SYST] Epoch 125


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 126, Loss: 0.10064892772585153 steps without improvement: 0 best accuracy: 0.9677
[SYST] Epoch 126


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 127, Loss: 0.0944952830672264 steps without improvement: 0 best accuracy: 0.9682
[SYST] Epoch 127


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 128, Loss: 0.09194137651473283 steps without improvement: 0 best accuracy: 0.971
[SYST] Epoch 128


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 129, Loss: 0.0901907667890191 steps without improvement: 1 best accuracy: 0.971
[SYST] Epoch 129


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 130, Loss: 0.08756186291575432 steps without improvement: 0 best accuracy: 0.9711
[SYST] Epoch 130


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 131, Loss: 0.08721205182373523 steps without improvement: 0 best accuracy: 0.9734
[SYST] Epoch 131


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 132, Loss: 0.08366770181804896 steps without improvement: 0 best accuracy: 0.9737
[SYST] Epoch 132


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 133, Loss: 0.08105240289121866 steps without improvement: 0 best accuracy: 0.9751
[SYST] Epoch 133


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 134, Loss: 0.08035368170589209 steps without improvement: 0 best accuracy: 0.9763
[SYST] Epoch 134


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 135, Loss: 0.09172530822455884 steps without improvement: 0 best accuracy: 0.977
[SYST] Epoch 135


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 136, Loss: 0.07593973360955715 steps without improvement: 0 best accuracy: 0.9804
[SYST] Epoch 136


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 137, Loss: 0.07423009224236012 steps without improvement: 1 best accuracy: 0.9804
[SYST] Epoch 137


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 138, Loss: 0.0731183972582221 steps without improvement: 2 best accuracy: 0.9804
[SYST] Epoch 138


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 139, Loss: 0.07260403314605356 steps without improvement: 0 best accuracy: 0.9824
[SYST] Epoch 139


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 140, Loss: 0.07134346462786198 steps without improvement: 1 best accuracy: 0.9824
[SYST] Epoch 140


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 141, Loss: 0.0708520931005478 steps without improvement: 2 best accuracy: 0.9824
[SYST] Epoch 141


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 142, Loss: 0.06940393835306168 steps without improvement: 3 best accuracy: 0.9824
[SYST] Epoch 142


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 143, Loss: 0.07280344732105731 steps without improvement: 0 best accuracy: 0.9825
[SYST] Epoch 143


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 144, Loss: 0.06682333778589963 steps without improvement: 0 best accuracy: 0.9828
[SYST] Epoch 144


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 145, Loss: 0.06561612099409103 steps without improvement: 0 best accuracy: 0.9847
[SYST] Epoch 145


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 146, Loss: 0.06478148188441991 steps without improvement: 1 best accuracy: 0.9847
[SYST] Epoch 146


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 147, Loss: 0.06350064506754279 steps without improvement: 0 best accuracy: 0.9859
[SYST] Epoch 147


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 148, Loss: 0.06039744986221194 steps without improvement: 0 best accuracy: 0.9863
[SYST] Epoch 148


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 149, Loss: 0.05978488203138113 steps without improvement: 1 best accuracy: 0.9863
[SYST] Epoch 149


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 150, Loss: 0.05957085061818361 steps without improvement: 0 best accuracy: 0.9864
[SYST] Epoch 150


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 151, Loss: 0.05751622021198273 steps without improvement: 0 best accuracy: 0.987
[SYST] Epoch 151


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 152, Loss: 0.05773333974182606 steps without improvement: 1 best accuracy: 0.987
[SYST] Epoch 152


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 153, Loss: 0.05677183851599693 steps without improvement: 2 best accuracy: 0.987
[SYST] Epoch 153


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 154, Loss: 0.05559831075370312 steps without improvement: 0 best accuracy: 0.9871
[SYST] Epoch 154


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 155, Loss: 0.05547094466164708 steps without improvement: 0 best accuracy: 0.9873
[SYST] Epoch 155


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 156, Loss: 0.05426960906013847 steps without improvement: 1 best accuracy: 0.9873
[SYST] Epoch 156


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 157, Loss: 0.05362670758739114 steps without improvement: 0 best accuracy: 0.9883
[SYST] Epoch 157


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 158, Loss: 0.05342504492029548 steps without improvement: 1 best accuracy: 0.9883
[SYST] Epoch 158


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 159, Loss: 0.05336681082844734 steps without improvement: 2 best accuracy: 0.9883
[SYST] Epoch 159


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 160, Loss: 0.05269483547657728 steps without improvement: 0 best accuracy: 0.9885
[SYST] Epoch 160


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 161, Loss: 0.05094465220347047 steps without improvement: 0 best accuracy: 0.9886
[SYST] Epoch 161


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 162, Loss: 0.05035006375983357 steps without improvement: 1 best accuracy: 0.9886
[SYST] Epoch 162


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 163, Loss: 0.05070443307980895 steps without improvement: 2 best accuracy: 0.9886
[SYST] Epoch 163


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 164, Loss: 0.04932082483544946 steps without improvement: 3 best accuracy: 0.9886
[SYST] Epoch 164


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 165, Loss: 0.049329814966768026 steps without improvement: 0 best accuracy: 0.9892
[SYST] Epoch 165


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 166, Loss: 0.04885261744260788 steps without improvement: 1 best accuracy: 0.9892
[SYST] Epoch 166


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 167, Loss: 0.04816277800127864 steps without improvement: 0 best accuracy: 0.9893
[SYST] Epoch 167


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 168, Loss: 0.048153215609490874 steps without improvement: 0 best accuracy: 0.9899
[SYST] Epoch 168


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 169, Loss: 0.04742156544700265 steps without improvement: 1 best accuracy: 0.9899
[SYST] Epoch 169


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 170, Loss: 0.04723682725802064 steps without improvement: 2 best accuracy: 0.9899
[SYST] Epoch 170


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 171, Loss: 0.05152582721784711 steps without improvement: 0 best accuracy: 0.9901
[SYST] Epoch 171


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 172, Loss: 0.046812650933861735 steps without improvement: 0 best accuracy: 0.9907
[SYST] Epoch 172


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 173, Loss: 0.04536863386631012 steps without improvement: 1 best accuracy: 0.9907
[SYST] Epoch 173


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 174, Loss: 0.045226731933653355 steps without improvement: 2 best accuracy: 0.9907
[SYST] Epoch 174


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 175, Loss: 0.04452273583039641 steps without improvement: 0 best accuracy: 0.9914
[SYST] Epoch 175


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 176, Loss: 0.045471778512001036 steps without improvement: 0 best accuracy: 0.9918
[SYST] Epoch 176


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 177, Loss: 0.047984760534018275 steps without improvement: 1 best accuracy: 0.9918
[SYST] Epoch 177


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 178, Loss: 0.04404002575203776 steps without improvement: 2 best accuracy: 0.9918
[SYST] Epoch 178


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 179, Loss: 0.044355448819696906 steps without improvement: 3 best accuracy: 0.9918
[SYST] Epoch 179


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Test Accuracy: 98.89%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:45<00:00, 12093.38it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12580.69it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12462.94it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:18<00:00, 69945.19it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 107823.56it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 108319.77it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 1, Loss: 5.917382576465607 steps without improvement: 0 best accuracy: 0.5377
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 2, Loss: 1.792538816332817 steps without improvement: 0 best accuracy: 0.6272
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 3, Loss: 1.2756587326526643 steps without improvement: 0 best accuracy: 0.6794
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 4, Loss: 1.0973973292112351 steps without improvement: 0 best accuracy: 0.7017
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 5, Loss: 0.9981452831625939 steps without improvement: 0 best accuracy: 0.7167
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 6, Loss: 0.9065531870722771 steps without improvement: 0 best accuracy: 0.7323
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 7, Loss: 0.7933336639404297 steps without improvement: 0 best accuracy: 0.7571
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 8, Loss: 0.6752191233634949 steps without improvement: 0 best accuracy: 0.7859
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 9, Loss: 0.5936113587021827 steps without improvement: 0 best accuracy: 0.8059
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 10, Loss: 0.5392487308382988 steps without improvement: 0 best accuracy: 0.8357
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 11, Loss: 0.499876111894846 steps without improvement: 0 best accuracy: 0.8448
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 12, Loss: 0.4695527501404285 steps without improvement: 0 best accuracy: 0.8553
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 13, Loss: 0.4461209078133106 steps without improvement: 0 best accuracy: 0.859
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 14, Loss: 0.4241355846822262 steps without improvement: 0 best accuracy: 0.8737
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 15, Loss: 0.40662063270807264 steps without improvement: 0 best accuracy: 0.8791
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 16, Loss: 0.3914894397556782 steps without improvement: 0 best accuracy: 0.8826
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 17, Loss: 0.3760514882206917 steps without improvement: 0 best accuracy: 0.8906
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 18, Loss: 0.36008050575852396 steps without improvement: 0 best accuracy: 0.8961
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 19, Loss: 0.3460253147780895 steps without improvement: 0 best accuracy: 0.9011
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 20, Loss: 0.3312855985760689 steps without improvement: 0 best accuracy: 0.904
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 21, Loss: 0.3208951480686665 steps without improvement: 0 best accuracy: 0.907
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 22, Loss: 0.3095343869924545 steps without improvement: 0 best accuracy: 0.9096
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 23, Loss: 0.3002591232955456 steps without improvement: 0 best accuracy: 0.9109
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 24, Loss: 0.2937988052517176 steps without improvement: 0 best accuracy: 0.916
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 25, Loss: 0.28606393963098525 steps without improvement: 1 best accuracy: 0.916
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 26, Loss: 0.277923201918602 steps without improvement: 0 best accuracy: 0.9201
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 27, Loss: 0.2730299501121044 steps without improvement: 1 best accuracy: 0.9201
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 28, Loss: 0.2672539108246565 steps without improvement: 0 best accuracy: 0.9222
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 29, Loss: 0.26208484143018723 steps without improvement: 0 best accuracy: 0.9223
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 30, Loss: 0.25569049164652824 steps without improvement: 0 best accuracy: 0.9237
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.20it/s]


Epoch 31, Loss: 0.2516340529918671 steps without improvement: 0 best accuracy: 0.9268
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 32, Loss: 0.24607016295194625 steps without improvement: 0 best accuracy: 0.9269
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 33, Loss: 0.241300368309021 steps without improvement: 0 best accuracy: 0.9279
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 34, Loss: 0.23754602625966073 steps without improvement: 1 best accuracy: 0.9279
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 35, Loss: 0.2335574971139431 steps without improvement: 2 best accuracy: 0.9279
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 36, Loss: 0.23065002426505088 steps without improvement: 0 best accuracy: 0.9294
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 37, Loss: 0.23171515874564647 steps without improvement: 0 best accuracy: 0.9304
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 38, Loss: 0.22331178702414037 steps without improvement: 1 best accuracy: 0.9304
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 39, Loss: 0.22110709510743617 steps without improvement: 0 best accuracy: 0.9323
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 40, Loss: 0.21837964244186878 steps without improvement: 1 best accuracy: 0.9323
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 41, Loss: 0.21643984362483024 steps without improvement: 0 best accuracy: 0.9334
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 42, Loss: 0.21277442075312136 steps without improvement: 0 best accuracy: 0.9359
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 43, Loss: 0.20935774952173233 steps without improvement: 1 best accuracy: 0.9359
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 44, Loss: 0.20637720324099063 steps without improvement: 2 best accuracy: 0.9359
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 45, Loss: 0.20524048060178757 steps without improvement: 0 best accuracy: 0.9384
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 46, Loss: 0.20055474855005742 steps without improvement: 1 best accuracy: 0.9384
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 47, Loss: 0.19844071552157402 steps without improvement: 2 best accuracy: 0.9384
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 48, Loss: 0.1962680784612894 steps without improvement: 0 best accuracy: 0.9393
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 49, Loss: 0.19273396961390973 steps without improvement: 0 best accuracy: 0.9421
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 50, Loss: 0.1908230186998844 steps without improvement: 0 best accuracy: 0.9426
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 51, Loss: 0.1868833827972412 steps without improvement: 1 best accuracy: 0.9426
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 52, Loss: 0.18346350692212582 steps without improvement: 0 best accuracy: 0.9433
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 53, Loss: 0.18086023956537248 steps without improvement: 0 best accuracy: 0.944
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 54, Loss: 0.1785276098549366 steps without improvement: 0 best accuracy: 0.9442
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 55, Loss: 0.1767831140011549 steps without improvement: 0 best accuracy: 0.9465
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 56, Loss: 0.17400335423648358 steps without improvement: 1 best accuracy: 0.9465
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 57, Loss: 0.17189357958734036 steps without improvement: 0 best accuracy: 0.9488
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 58, Loss: 0.16690258465707303 steps without improvement: 1 best accuracy: 0.9488
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 59, Loss: 0.16407147616147996 steps without improvement: 0 best accuracy: 0.949
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 60, Loss: 0.16273448899388313 steps without improvement: 0 best accuracy: 0.9513
[SYST] Epoch 60


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 61, Loss: 0.1626896271854639 steps without improvement: 1 best accuracy: 0.9513
[SYST] Epoch 61


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 62, Loss: 0.1565700038522482 steps without improvement: 0 best accuracy: 0.9525
[SYST] Epoch 62


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 63, Loss: 0.15421624705195427 steps without improvement: 1 best accuracy: 0.9525
[SYST] Epoch 63


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 64, Loss: 0.1535992818325758 steps without improvement: 2 best accuracy: 0.9525
[SYST] Epoch 64


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 65, Loss: 0.14805098470300437 steps without improvement: 0 best accuracy: 0.9536
[SYST] Epoch 65


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 66, Loss: 0.1515452613681555 steps without improvement: 1 best accuracy: 0.9536
[SYST] Epoch 66


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 67, Loss: 0.14255621291697027 steps without improvement: 0 best accuracy: 0.9551
[SYST] Epoch 67


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 68, Loss: 0.13899210281670094 steps without improvement: 0 best accuracy: 0.9559
[SYST] Epoch 68


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 69, Loss: 0.13567863173782826 steps without improvement: 0 best accuracy: 0.9572
[SYST] Epoch 69


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 70, Loss: 0.1341118121519685 steps without improvement: 0 best accuracy: 0.9581
[SYST] Epoch 70


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 71, Loss: 0.13070153255015612 steps without improvement: 0 best accuracy: 0.9596
[SYST] Epoch 71


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 72, Loss: 0.12577939230948687 steps without improvement: 0 best accuracy: 0.9617
[SYST] Epoch 72


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 73, Loss: 0.12245006445795298 steps without improvement: 1 best accuracy: 0.9617
[SYST] Epoch 73


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 74, Loss: 0.1354381200671196 steps without improvement: 0 best accuracy: 0.9634
[SYST] Epoch 74


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 75, Loss: 0.11663088753819466 steps without improvement: 0 best accuracy: 0.965
[SYST] Epoch 75


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 76, Loss: 0.11491604909300804 steps without improvement: 1 best accuracy: 0.965
[SYST] Epoch 76


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 77, Loss: 0.11260743577033282 steps without improvement: 0 best accuracy: 0.9673
[SYST] Epoch 77


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 78, Loss: 0.10923868998885154 steps without improvement: 0 best accuracy: 0.9675
[SYST] Epoch 78


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 79, Loss: 0.1070674428716302 steps without improvement: 0 best accuracy: 0.9692
[SYST] Epoch 79


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 80, Loss: 0.10453362282365561 steps without improvement: 1 best accuracy: 0.9692
[SYST] Epoch 80


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 81, Loss: 0.11057587973773479 steps without improvement: 0 best accuracy: 0.9711
[SYST] Epoch 81


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 82, Loss: 0.09840897057205439 steps without improvement: 0 best accuracy: 0.9732
[SYST] Epoch 82


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 83, Loss: 0.09465810913592577 steps without improvement: 0 best accuracy: 0.9743
[SYST] Epoch 83


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 84, Loss: 0.09098206240683794 steps without improvement: 0 best accuracy: 0.9748
[SYST] Epoch 84


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 85, Loss: 0.08853580463677645 steps without improvement: 0 best accuracy: 0.9765
[SYST] Epoch 85


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 86, Loss: 0.08601560961455107 steps without improvement: 0 best accuracy: 0.9769
[SYST] Epoch 86


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 87, Loss: 0.08304573439061641 steps without improvement: 0 best accuracy: 0.978
[SYST] Epoch 87


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 88, Loss: 0.09675071310251951 steps without improvement: 0 best accuracy: 0.9787
[SYST] Epoch 88


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 89, Loss: 0.07986336916685105 steps without improvement: 0 best accuracy: 0.9794
[SYST] Epoch 89


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 90, Loss: 0.07814220741391181 steps without improvement: 0 best accuracy: 0.98
[SYST] Epoch 90


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 91, Loss: 0.07664738779887557 steps without improvement: 1 best accuracy: 0.98
[SYST] Epoch 91


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 92, Loss: 0.07580217404291034 steps without improvement: 0 best accuracy: 0.9809
[SYST] Epoch 92


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 93, Loss: 0.07438941264525056 steps without improvement: 1 best accuracy: 0.9809
[SYST] Epoch 93


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 94, Loss: 0.07395113211125136 steps without improvement: 2 best accuracy: 0.9809
[SYST] Epoch 94


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 95, Loss: 0.0948022310435772 steps without improvement: 3 best accuracy: 0.9809
[SYST] Epoch 95


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 96, Loss: 0.07390006940811872 steps without improvement: 0 best accuracy: 0.981
[SYST] Epoch 96


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 97, Loss: 0.07056236715987324 steps without improvement: 1 best accuracy: 0.981
[SYST] Epoch 97


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 98, Loss: 0.06991508554667235 steps without improvement: 2 best accuracy: 0.981
[SYST] Epoch 98


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 99, Loss: 0.06933147978037596 steps without improvement: 0 best accuracy: 0.9813
[SYST] Epoch 99


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 100, Loss: 0.06858742222189904 steps without improvement: 0 best accuracy: 0.9819
[SYST] Epoch 100


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 101, Loss: 0.06770016735419632 steps without improvement: 1 best accuracy: 0.9819
[SYST] Epoch 101


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 102, Loss: 0.06837962929159402 steps without improvement: 2 best accuracy: 0.9819
[SYST] Epoch 102


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 103, Loss: 0.06657892366871238 steps without improvement: 3 best accuracy: 0.9819
[SYST] Epoch 103


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 104, Loss: 0.0657444279640913 steps without improvement: 0 best accuracy: 0.9822
[SYST] Epoch 104


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 105, Loss: 0.07829984487965704 steps without improvement: 0 best accuracy: 0.9828
[SYST] Epoch 105


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 106, Loss: 0.06434351582080126 steps without improvement: 1 best accuracy: 0.9828
[SYST] Epoch 106


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 107, Loss: 0.06391414538025857 steps without improvement: 2 best accuracy: 0.9828
[SYST] Epoch 107


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 108, Loss: 0.06303423512727022 steps without improvement: 0 best accuracy: 0.9829
[SYST] Epoch 108


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 109, Loss: 0.06250750416889787 steps without improvement: 0 best accuracy: 0.9833
[SYST] Epoch 109


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 110, Loss: 0.062208997905254367 steps without improvement: 1 best accuracy: 0.9833
[SYST] Epoch 110


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 111, Loss: 0.0747911991737783 steps without improvement: 2 best accuracy: 0.9833
[SYST] Epoch 111


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 112, Loss: 0.06559005437418819 steps without improvement: 0 best accuracy: 0.9839
[SYST] Epoch 112


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.22it/s]


Epoch 113, Loss: 0.060493497941643 steps without improvement: 0 best accuracy: 0.9847
[SYST] Epoch 113


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 114, Loss: 0.06012637900188565 steps without improvement: 1 best accuracy: 0.9847
[SYST] Epoch 114


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 115, Loss: 0.05941477607935667 steps without improvement: 2 best accuracy: 0.9847
[SYST] Epoch 115


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 116, Loss: 0.0593525517731905 steps without improvement: 3 best accuracy: 0.9847
[SYST] Epoch 116


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 117, Loss: 0.059319175072014334 steps without improvement: 0 best accuracy: 0.9849
[SYST] Epoch 117


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 118, Loss: 0.058122434578835966 steps without improvement: 0 best accuracy: 0.9851
[SYST] Epoch 118


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 119, Loss: 0.057968949899077415 steps without improvement: 1 best accuracy: 0.9851
[SYST] Epoch 119


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 120, Loss: 0.057990813683718445 steps without improvement: 2 best accuracy: 0.9851
[SYST] Epoch 120


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 121, Loss: 0.05718952039256692 steps without improvement: 3 best accuracy: 0.9851
[SYST] Epoch 121


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 122, Loss: 0.06597937606275081 steps without improvement: 0 best accuracy: 0.9859
[SYST] Epoch 122


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 123, Loss: 0.056109441835433246 steps without improvement: 0 best accuracy: 0.9865
[SYST] Epoch 123


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 124, Loss: 0.05577709924429655 steps without improvement: 1 best accuracy: 0.9865
[SYST] Epoch 124


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 125, Loss: 0.05536549288779497 steps without improvement: 2 best accuracy: 0.9865
[SYST] Epoch 125


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 126, Loss: 0.05552339321002364 steps without improvement: 3 best accuracy: 0.9865
[SYST] Epoch 126


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Test Accuracy: 98.59%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859}}]
Layer3 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11945.58it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12654.87it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12681.44it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 82512.19it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 113567.98it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 115135.14it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 1, Loss: 11.840057351589202 steps without improvement: 0 best accuracy: 0.5332
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 2, Loss: 4.533112319707871 steps without improvement: 0 best accuracy: 0.5541
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 3, Loss: 3.663232834339142 steps without improvement: 0 best accuracy: 0.5709
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 4, Loss: 3.318366900682449 steps without improvement: 0 best accuracy: 0.5755
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 5, Loss: 3.077553061246872 steps without improvement: 0 best accuracy: 0.6045
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 6, Loss: 2.8988770949840545 steps without improvement: 0 best accuracy: 0.6078
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 7, Loss: 2.7531096279621123 steps without improvement: 0 best accuracy: 0.6109
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 8, Loss: 2.608789857625961 steps without improvement: 0 best accuracy: 0.6186
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 9, Loss: 2.470546714067459 steps without improvement: 0 best accuracy: 0.6269
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 10, Loss: 2.3304621887207033 steps without improvement: 0 best accuracy: 0.6317
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 11, Loss: 2.209318540096283 steps without improvement: 0 best accuracy: 0.6324
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 12, Loss: 2.105936167836189 steps without improvement: 0 best accuracy: 0.635
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 13, Loss: 2.0017820692062376 steps without improvement: 0 best accuracy: 0.6367
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 14, Loss: 1.8882473063468934 steps without improvement: 0 best accuracy: 0.6432
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 15, Loss: 1.7566943150758743 steps without improvement: 0 best accuracy: 0.6467
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 16, Loss: 1.611881959438324 steps without improvement: 1 best accuracy: 0.6467
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 17, Loss: 1.512414862513542 steps without improvement: 0 best accuracy: 0.65
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 18, Loss: 1.4421588349342347 steps without improvement: 0 best accuracy: 0.6511
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 19, Loss: 1.3893922781944275 steps without improvement: 1 best accuracy: 0.6511
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 20, Loss: 1.3592916685342789 steps without improvement: 2 best accuracy: 0.6511
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 21, Loss: 1.3301434707641602 steps without improvement: 3 best accuracy: 0.6511
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Test Accuracy: 64.49%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449}}]
Layer3 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11883.70it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12526.01it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12442.50it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:17<00:00, 74063.01it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 109530.44it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 117896.68it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 1, Loss: 6.688098316192627 steps without improvement: 0 best accuracy: 0.5247
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 2, Loss: 3.5206785666942597 steps without improvement: 0 best accuracy: 0.5318
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 3, Loss: 2.7172250080108644 steps without improvement: 0 best accuracy: 0.5465
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 4, Loss: 2.288272713422775 steps without improvement: 0 best accuracy: 0.558
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 5, Loss: 2.0330398374795915 steps without improvement: 0 best accuracy: 0.5697
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 6, Loss: 1.892371373772621 steps without improvement: 0 best accuracy: 0.5755
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 7, Loss: 1.7930201876163483 steps without improvement: 0 best accuracy: 0.5936
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 8, Loss: 1.735586603283882 steps without improvement: 1 best accuracy: 0.5936
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 9, Loss: 1.7053459775447846 steps without improvement: 0 best accuracy: 0.6016
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 10, Loss: 1.6799905014038086 steps without improvement: 0 best accuracy: 0.6022
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 11, Loss: 1.6594609838724137 steps without improvement: 1 best accuracy: 0.6022
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 12, Loss: 1.640425580739975 steps without improvement: 0 best accuracy: 0.6027
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 13, Loss: 1.6313624048233033 steps without improvement: 1 best accuracy: 0.6027
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 14, Loss: 1.6113251179456711 steps without improvement: 0 best accuracy: 0.604
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 15, Loss: 1.5954764807224273 steps without improvement: 0 best accuracy: 0.6068
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 16, Loss: 1.5743286436796189 steps without improvement: 0 best accuracy: 0.6097
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 17, Loss: 1.5532983475923539 steps without improvement: 1 best accuracy: 0.6097
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 18, Loss: 1.5415917378664017 steps without improvement: 0 best accuracy: 0.6118
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 19, Loss: 1.5222507840394974 steps without improvement: 1 best accuracy: 0.6118
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 20, Loss: 1.498634497523308 steps without improvement: 0 best accuracy: 0.6123
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 21, Loss: 1.4824404567480087 steps without improvement: 0 best accuracy: 0.6151
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 22, Loss: 1.472381465435028 steps without improvement: 0 best accuracy: 0.6156
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 23, Loss: 1.470611042380333 steps without improvement: 1 best accuracy: 0.6156
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 24, Loss: 1.4590340512990951 steps without improvement: 0 best accuracy: 0.618
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 25, Loss: 1.4507816886901856 steps without improvement: 1 best accuracy: 0.618
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 26, Loss: 1.4456965166330338 steps without improvement: 0 best accuracy: 0.6196
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 27, Loss: 1.4395135521888733 steps without improvement: 1 best accuracy: 0.6196
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 28, Loss: 1.4337682157754899 steps without improvement: 2 best accuracy: 0.6196
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 29, Loss: 1.4270650666952134 steps without improvement: 3 best accuracy: 0.6196
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.58it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Test Accuracy: 62.04%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}]


100%|█████████████████████████████████████████████| 1048576/1048576 [00:12<00:00, 86219.02it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 85943.39it/s]
100%|██████████████████████████████████████████████████████| 1024/1024 [01:24<00:00, 12.05it/s]


Epoch 1, Loss: 0.44120322678645607 steps without improvement: 7 best accuracy: 0.9491


100%|██████████████████████████████████████████████████████| 1024/1024 [01:27<00:00, 11.76it/s]


Epoch 2, Loss: 0.04542580041425026 steps without improvement: 24 best accuracy: 0.9968


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.80it/s]


Epoch 3, Loss: 0.007974065492135196 steps without improvement: 0 best accuracy: 0.9989


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.83it/s]


Epoch 4, Loss: 0.003915650254953107 steps without improvement: 237 best accuracy: 0.9996


100%|██████████████████████████████████████████████████████| 1024/1024 [01:27<00:00, 11.75it/s]


Epoch 5, Loss: 0.0025442849594981 steps without improvement: 637 best accuracy: 0.9997


100%|██████████████████████████████████████████████████████| 1024/1024 [01:27<00:00, 11.76it/s]


Epoch 6, Loss: 0.0018440733194893255 steps without improvement: 821 best accuracy: 0.9998


 20%|██████████▉                                            | 203/1024 [00:17<01:10, 11.63it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 86372.75it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 157.15it/s]


Test Accuracy: 0.9996
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:49<00:00, 11719.57it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12602.38it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12618.49it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:16<00:00, 78047.21it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 108782.19it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 106307.10it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 1, Loss: 21.88687870502472 steps without improvement: 0 best accuracy: 0.5347
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 2, Loss: 7.924473459720612 steps without improvement: 0 best accuracy: 0.6017
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 3, Loss: 5.745112299919128 steps without improvement: 0 best accuracy: 0.6284
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 4, Loss: 5.026270341873169 steps without improvement: 0 best accuracy: 0.6426
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 5, Loss: 4.492947108745575 steps without improvement: 0 best accuracy: 0.6562
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 6, Loss: 3.9876916813850403 steps without improvement: 0 best accuracy: 0.672
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 7, Loss: 3.5804925143718718 steps without improvement: 0 best accuracy: 0.7016
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 8, Loss: 3.207052558660507 steps without improvement: 0 best accuracy: 0.746
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 9, Loss: 2.756584048271179 steps without improvement: 0 best accuracy: 0.7814
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 10, Loss: 2.258387202620506 steps without improvement: 0 best accuracy: 0.8178
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 11, Loss: 1.8173031961917878 steps without improvement: 0 best accuracy: 0.8547
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 12, Loss: 1.4511279082298278 steps without improvement: 0 best accuracy: 0.8841
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 13, Loss: 1.1393891170620918 steps without improvement: 0 best accuracy: 0.9018
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 14, Loss: 0.8553623417019844 steps without improvement: 0 best accuracy: 0.9241
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 15, Loss: 0.6328188356757164 steps without improvement: 0 best accuracy: 0.9358
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 16, Loss: 0.5079737587273121 steps without improvement: 0 best accuracy: 0.9432
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 17, Loss: 0.43236108422279357 steps without improvement: 0 best accuracy: 0.9503
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 18, Loss: 0.37479254946112633 steps without improvement: 0 best accuracy: 0.9544
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 19, Loss: 0.33352663949131967 steps without improvement: 0 best accuracy: 0.9588
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 20, Loss: 0.2949260615557432 steps without improvement: 0 best accuracy: 0.9627
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 21, Loss: 0.25783049061894414 steps without improvement: 0 best accuracy: 0.9639
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 22, Loss: 0.22411715745925903 steps without improvement: 0 best accuracy: 0.9689
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 23, Loss: 0.19198251262307167 steps without improvement: 0 best accuracy: 0.9698
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 24, Loss: 0.1670345365256071 steps without improvement: 0 best accuracy: 0.9718
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 25, Loss: 0.14597463935613633 steps without improvement: 0 best accuracy: 0.9752
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 26, Loss: 0.12894542288035155 steps without improvement: 0 best accuracy: 0.9771
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 27, Loss: 0.11606645602732897 steps without improvement: 0 best accuracy: 0.9774
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 28, Loss: 0.10651678271591664 steps without improvement: 0 best accuracy: 0.9789
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 29, Loss: 0.10090605091303587 steps without improvement: 0 best accuracy: 0.98
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 30, Loss: 0.09195067506283522 steps without improvement: 0 best accuracy: 0.9825
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 31, Loss: 0.08654951993376017 steps without improvement: 1 best accuracy: 0.9825
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 32, Loss: 0.08214055445045233 steps without improvement: 0 best accuracy: 0.9844
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 33, Loss: 0.07899951661005616 steps without improvement: 1 best accuracy: 0.9844
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 34, Loss: 0.07494695715606213 steps without improvement: 2 best accuracy: 0.9844
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 35, Loss: 0.07308232866227626 steps without improvement: 0 best accuracy: 0.9846
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 36, Loss: 0.06937460632994771 steps without improvement: 0 best accuracy: 0.9869
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 37, Loss: 0.067309549767524 steps without improvement: 1 best accuracy: 0.9869
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 38, Loss: 0.06434041354805231 steps without improvement: 2 best accuracy: 0.9869
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 39, Loss: 0.06424496416002512 steps without improvement: 3 best accuracy: 0.9869
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 40, Loss: 0.061383024621754885 steps without improvement: 0 best accuracy: 0.987
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 41, Loss: 0.0595207728818059 steps without improvement: 1 best accuracy: 0.987
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 42, Loss: 0.05974354106932878 steps without improvement: 0 best accuracy: 0.9876
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 43, Loss: 0.057471750769764185 steps without improvement: 1 best accuracy: 0.9876
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 44, Loss: 0.05556165946647525 steps without improvement: 2 best accuracy: 0.9876
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 45, Loss: 0.05366312485188246 steps without improvement: 0 best accuracy: 0.9888
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 46, Loss: 0.05174076864495873 steps without improvement: 0 best accuracy: 0.9891
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 47, Loss: 0.050896926783025265 steps without improvement: 0 best accuracy: 0.9893
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 48, Loss: 0.04992156218737364 steps without improvement: 1 best accuracy: 0.9893
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 49, Loss: 0.0495135036110878 steps without improvement: 0 best accuracy: 0.99
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 50, Loss: 0.04825484752655029 steps without improvement: 0 best accuracy: 0.9903
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 51, Loss: 0.046958109550178054 steps without improvement: 1 best accuracy: 0.9903
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 52, Loss: 0.046488516107201575 steps without improvement: 2 best accuracy: 0.9903
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 53, Loss: 0.04510296828113496 steps without improvement: 0 best accuracy: 0.9905
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 54, Loss: 0.04402845040895045 steps without improvement: 1 best accuracy: 0.9905
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 55, Loss: 0.043073528297245506 steps without improvement: 2 best accuracy: 0.9905
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 56, Loss: 0.042526431921869515 steps without improvement: 0 best accuracy: 0.9908
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 57, Loss: 0.041500239549204704 steps without improvement: 0 best accuracy: 0.9911
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 58, Loss: 0.041509049739688636 steps without improvement: 0 best accuracy: 0.9918
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 59, Loss: 0.04024426706135273 steps without improvement: 1 best accuracy: 0.9918
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 60, Loss: 0.04132472057826817 steps without improvement: 2 best accuracy: 0.9918
[SYST] Epoch 60


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 61, Loss: 0.03920012982562184 steps without improvement: 0 best accuracy: 0.9921
[SYST] Epoch 61


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 62, Loss: 0.03857135684229433 steps without improvement: 1 best accuracy: 0.9921
[SYST] Epoch 62


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 63, Loss: 0.0386244413908571 steps without improvement: 2 best accuracy: 0.9921
[SYST] Epoch 63


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 64, Loss: 0.03789203592576087 steps without improvement: 3 best accuracy: 0.9921
[SYST] Epoch 64


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 65, Loss: 0.037959240386262534 steps without improvement: 0 best accuracy: 0.9922
[SYST] Epoch 65


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 66, Loss: 0.03659325293265283 steps without improvement: 1 best accuracy: 0.9922
[SYST] Epoch 66


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 67, Loss: 0.036155540868639945 steps without improvement: 2 best accuracy: 0.9922
[SYST] Epoch 67


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 68, Loss: 0.03574910088442266 steps without improvement: 0 best accuracy: 0.9923
[SYST] Epoch 68


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 69, Loss: 0.03580226881429553 steps without improvement: 1 best accuracy: 0.9923
[SYST] Epoch 69


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 70, Loss: 0.03430212600156665 steps without improvement: 2 best accuracy: 0.9923
[SYST] Epoch 70


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 71, Loss: 0.033730350891128184 steps without improvement: 0 best accuracy: 0.9925
[SYST] Epoch 71


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 72, Loss: 0.03420690480619669 steps without improvement: 0 best accuracy: 0.9926
[SYST] Epoch 72


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 73, Loss: 0.03483003637753427 steps without improvement: 1 best accuracy: 0.9926
[SYST] Epoch 73


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 74, Loss: 0.0336909091193229 steps without improvement: 0 best accuracy: 0.9927
[SYST] Epoch 74


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 75, Loss: 0.03240587217733264 steps without improvement: 0 best accuracy: 0.9929
[SYST] Epoch 75


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 76, Loss: 0.032899043243378404 steps without improvement: 1 best accuracy: 0.9929
[SYST] Epoch 76


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 77, Loss: 0.03203807470388711 steps without improvement: 0 best accuracy: 0.993
[SYST] Epoch 77


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 78, Loss: 0.03182452821172774 steps without improvement: 1 best accuracy: 0.993
[SYST] Epoch 78


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 79, Loss: 0.03174004351720214 steps without improvement: 0 best accuracy: 0.9932
[SYST] Epoch 79


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 80, Loss: 0.030875805760733784 steps without improvement: 1 best accuracy: 0.9932
[SYST] Epoch 80


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 81, Loss: 0.03117628352716565 steps without improvement: 2 best accuracy: 0.9932
[SYST] Epoch 81


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 82, Loss: 0.031015710877254604 steps without improvement: 0 best accuracy: 0.9933
[SYST] Epoch 82


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 83, Loss: 0.030615384923294187 steps without improvement: 1 best accuracy: 0.9933
[SYST] Epoch 83


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 84, Loss: 0.029606878319755198 steps without improvement: 2 best accuracy: 0.9933
[SYST] Epoch 84


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 85, Loss: 0.02948453076183796 steps without improvement: 3 best accuracy: 0.9933
[SYST] Epoch 85


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Test Accuracy: 99.44%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944}}]
Layer1 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11851.29it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12561.84it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12551.42it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 81899.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 112162.76it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 113556.91it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 1, Loss: 21.494390721321107 steps without improvement: 0 best accuracy: 0.5164
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 2, Loss: 10.765022702217102 steps without improvement: 0 best accuracy: 0.5553
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 3, Loss: 6.117169735431671 steps without improvement: 0 best accuracy: 0.6289
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 4, Loss: 4.3794475710392 steps without improvement: 0 best accuracy: 0.6595
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 5, Loss: 3.796591911315918 steps without improvement: 0 best accuracy: 0.7007
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 6, Loss: 3.086210126876831 steps without improvement: 0 best accuracy: 0.7453
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 7, Loss: 2.572892065048218 steps without improvement: 0 best accuracy: 0.7719
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.48it/s]


Epoch 8, Loss: 2.0932731038331984 steps without improvement: 0 best accuracy: 0.8018
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 9, Loss: 1.6609380692243576 steps without improvement: 0 best accuracy: 0.8298
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 10, Loss: 1.3372983264923095 steps without improvement: 0 best accuracy: 0.8453
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 11, Loss: 1.094052356481552 steps without improvement: 0 best accuracy: 0.8545
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 12, Loss: 0.9182146486639976 steps without improvement: 0 best accuracy: 0.8659
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 13, Loss: 0.7910027346014976 steps without improvement: 0 best accuracy: 0.8732
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 14, Loss: 0.6955060014128684 steps without improvement: 0 best accuracy: 0.8817
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 15, Loss: 0.6237082207202911 steps without improvement: 0 best accuracy: 0.8873
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 16, Loss: 0.5670788696408272 steps without improvement: 0 best accuracy: 0.895
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 17, Loss: 0.5171380853652954 steps without improvement: 0 best accuracy: 0.8985
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 18, Loss: 0.47535942077636717 steps without improvement: 0 best accuracy: 0.9039
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 19, Loss: 0.435485925078392 steps without improvement: 0 best accuracy: 0.909
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 20, Loss: 0.4022135576605797 steps without improvement: 0 best accuracy: 0.912
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 21, Loss: 0.3675855708122253 steps without improvement: 0 best accuracy: 0.9206
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 22, Loss: 0.33844967663288117 steps without improvement: 0 best accuracy: 0.9232
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 23, Loss: 0.3105770808458328 steps without improvement: 0 best accuracy: 0.9283
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 24, Loss: 0.2882143376767635 steps without improvement: 0 best accuracy: 0.9334
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 25, Loss: 0.2689864741265774 steps without improvement: 0 best accuracy: 0.9359
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 26, Loss: 0.2538648718595505 steps without improvement: 0 best accuracy: 0.9395
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 27, Loss: 0.2437455653399229 steps without improvement: 0 best accuracy: 0.9415
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 28, Loss: 0.23327779687941075 steps without improvement: 0 best accuracy: 0.9431
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 29, Loss: 0.22657239131629467 steps without improvement: 0 best accuracy: 0.9435
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 30, Loss: 0.22003070160746574 steps without improvement: 1 best accuracy: 0.9435
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 31, Loss: 0.21404009267687799 steps without improvement: 0 best accuracy: 0.9472
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 32, Loss: 0.2095724053680897 steps without improvement: 0 best accuracy: 0.949
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 33, Loss: 0.20551970183849336 steps without improvement: 0 best accuracy: 0.9497
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 34, Loss: 0.20102868109941482 steps without improvement: 0 best accuracy: 0.9525
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 35, Loss: 0.19519556179642678 steps without improvement: 1 best accuracy: 0.9525
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 36, Loss: 0.19144584402441978 steps without improvement: 2 best accuracy: 0.9525
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 37, Loss: 0.1877044727653265 steps without improvement: 0 best accuracy: 0.9542
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 38, Loss: 0.18386730916798114 steps without improvement: 1 best accuracy: 0.9542
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 39, Loss: 0.17809372313320637 steps without improvement: 0 best accuracy: 0.955
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 40, Loss: 0.17428374730050564 steps without improvement: 1 best accuracy: 0.955
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 41, Loss: 0.16907265804708005 steps without improvement: 0 best accuracy: 0.9561
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 42, Loss: 0.16423373363912105 steps without improvement: 0 best accuracy: 0.9593
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 43, Loss: 0.16201323382556437 steps without improvement: 0 best accuracy: 0.9614
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 44, Loss: 0.1579602659493685 steps without improvement: 1 best accuracy: 0.9614
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 45, Loss: 0.1532789821177721 steps without improvement: 0 best accuracy: 0.9621
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 46, Loss: 0.14981806311756374 steps without improvement: 1 best accuracy: 0.9621
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 47, Loss: 0.14734930716454983 steps without improvement: 0 best accuracy: 0.9628
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 48, Loss: 0.1439322853088379 steps without improvement: 0 best accuracy: 0.9652
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 49, Loss: 0.14046972379088402 steps without improvement: 1 best accuracy: 0.9652
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 50, Loss: 0.13824998199939728 steps without improvement: 0 best accuracy: 0.9655
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 51, Loss: 0.13495535515248774 steps without improvement: 1 best accuracy: 0.9655
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 52, Loss: 0.1333650888875127 steps without improvement: 2 best accuracy: 0.9655
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 53, Loss: 0.1304424847662449 steps without improvement: 0 best accuracy: 0.9659
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 54, Loss: 0.1293389619141817 steps without improvement: 0 best accuracy: 0.9664
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 55, Loss: 0.1262969921156764 steps without improvement: 0 best accuracy: 0.9666
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 56, Loss: 0.12378143075853586 steps without improvement: 0 best accuracy: 0.9687
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 57, Loss: 0.1216329188272357 steps without improvement: 0 best accuracy: 0.9691
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 58, Loss: 0.12146327655762434 steps without improvement: 1 best accuracy: 0.9691
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 59, Loss: 0.11836781542748213 steps without improvement: 2 best accuracy: 0.9691
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 60, Loss: 0.11629774916917085 steps without improvement: 3 best accuracy: 0.9691
[SYST] Epoch 60


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 61, Loss: 0.11464135985821486 steps without improvement: 0 best accuracy: 0.9697
[SYST] Epoch 61


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 62, Loss: 0.11282620560377836 steps without improvement: 1 best accuracy: 0.9697
[SYST] Epoch 62


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 63, Loss: 0.11230812188237906 steps without improvement: 2 best accuracy: 0.9697
[SYST] Epoch 63


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 64, Loss: 0.10959379252046347 steps without improvement: 0 best accuracy: 0.9701
[SYST] Epoch 64


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 65, Loss: 0.10886817388236522 steps without improvement: 0 best accuracy: 0.9718
[SYST] Epoch 65


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 66, Loss: 0.10772146757692098 steps without improvement: 1 best accuracy: 0.9718
[SYST] Epoch 66


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 67, Loss: 0.10596962485462427 steps without improvement: 0 best accuracy: 0.972
[SYST] Epoch 67


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.47it/s]


Epoch 68, Loss: 0.10454682562500238 steps without improvement: 1 best accuracy: 0.972
[SYST] Epoch 68


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 69, Loss: 0.1028555104881525 steps without improvement: 0 best accuracy: 0.9732
[SYST] Epoch 69


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 70, Loss: 0.1025314424932003 steps without improvement: 1 best accuracy: 0.9732
[SYST] Epoch 70


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 71, Loss: 0.10066512182354927 steps without improvement: 2 best accuracy: 0.9732
[SYST] Epoch 71


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 72, Loss: 0.09976759482175111 steps without improvement: 0 best accuracy: 0.9735
[SYST] Epoch 72


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 73, Loss: 0.09873032666742802 steps without improvement: 0 best accuracy: 0.9744
[SYST] Epoch 73


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 74, Loss: 0.09804841589182615 steps without improvement: 1 best accuracy: 0.9744
[SYST] Epoch 74


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 75, Loss: 0.095909578576684 steps without improvement: 2 best accuracy: 0.9744
[SYST] Epoch 75


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 76, Loss: 0.09602510277181864 steps without improvement: 0 best accuracy: 0.975
[SYST] Epoch 76


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 77, Loss: 0.09451250724494457 steps without improvement: 0 best accuracy: 0.9759
[SYST] Epoch 77


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 78, Loss: 0.09494119066745042 steps without improvement: 1 best accuracy: 0.9759
[SYST] Epoch 78


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 79, Loss: 0.09273889660835266 steps without improvement: 2 best accuracy: 0.9759
[SYST] Epoch 79


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 80, Loss: 0.09342994663864373 steps without improvement: 0 best accuracy: 0.9765
[SYST] Epoch 80


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 81, Loss: 0.09087250400334597 steps without improvement: 1 best accuracy: 0.9765
[SYST] Epoch 81


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 82, Loss: 0.09024593334645033 steps without improvement: 2 best accuracy: 0.9765
[SYST] Epoch 82


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 83, Loss: 0.08997739978134632 steps without improvement: 3 best accuracy: 0.9765
[SYST] Epoch 83


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 84, Loss: 0.08888721514493227 steps without improvement: 0 best accuracy: 0.9776
[SYST] Epoch 84


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 85, Loss: 0.0881337172165513 steps without improvement: 1 best accuracy: 0.9776
[SYST] Epoch 85


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.47it/s]


Epoch 86, Loss: 0.08811129838228225 steps without improvement: 2 best accuracy: 0.9776
[SYST] Epoch 86


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 87, Loss: 0.08674183271825314 steps without improvement: 3 best accuracy: 0.9776
[SYST] Epoch 87


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Test Accuracy: 97.62%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762}}]
Layer1 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11852.00it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12527.06it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12628.23it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 84442.67it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 118109.82it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 117158.02it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 1, Loss: 6.896638386249542 steps without improvement: 0 best accuracy: 0.5649
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 2, Loss: 4.451475881338119 steps without improvement: 0 best accuracy: 0.6521
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 3, Loss: 4.034630800485611 steps without improvement: 0 best accuracy: 0.6903
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 4, Loss: 3.819103833436966 steps without improvement: 0 best accuracy: 0.7216
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 5, Loss: 3.5174808573722838 steps without improvement: 0 best accuracy: 0.7719
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 6, Loss: 2.5782823914289477 steps without improvement: 0 best accuracy: 0.8144
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 7, Loss: 1.6200691699981689 steps without improvement: 0 best accuracy: 0.8289
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 8, Loss: 1.2932629400491715 steps without improvement: 0 best accuracy: 0.8403
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 9, Loss: 1.0780087301135064 steps without improvement: 0 best accuracy: 0.8582
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 10, Loss: 0.9252756223082542 steps without improvement: 0 best accuracy: 0.865
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 11, Loss: 0.8043840181827545 steps without improvement: 0 best accuracy: 0.8752
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 12, Loss: 0.7061666861176491 steps without improvement: 0 best accuracy: 0.8863
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 13, Loss: 0.6256891071796418 steps without improvement: 0 best accuracy: 0.8966
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 14, Loss: 0.5584195445477963 steps without improvement: 0 best accuracy: 0.9056
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 15, Loss: 0.5031921751797199 steps without improvement: 0 best accuracy: 0.9082
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 16, Loss: 0.4615513728559017 steps without improvement: 0 best accuracy: 0.9152
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 17, Loss: 0.4267824274301529 steps without improvement: 0 best accuracy: 0.9155
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 18, Loss: 0.39531641140580176 steps without improvement: 0 best accuracy: 0.9181
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 19, Loss: 0.36925734639167784 steps without improvement: 0 best accuracy: 0.9208
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 20, Loss: 0.34439794287085534 steps without improvement: 0 best accuracy: 0.9272
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 21, Loss: 0.31431135192513465 steps without improvement: 0 best accuracy: 0.9312
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 22, Loss: 0.28685815036296847 steps without improvement: 0 best accuracy: 0.9367
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 23, Loss: 0.2675038406252861 steps without improvement: 0 best accuracy: 0.9399
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 24, Loss: 0.25239823006093504 steps without improvement: 0 best accuracy: 0.9419
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 25, Loss: 0.23911048643290997 steps without improvement: 0 best accuracy: 0.9444
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 26, Loss: 0.22852051310241223 steps without improvement: 0 best accuracy: 0.9445
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 27, Loss: 0.21964196257293225 steps without improvement: 0 best accuracy: 0.9468
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 28, Loss: 0.21051173068583012 steps without improvement: 0 best accuracy: 0.9477
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 29, Loss: 0.20363032408058643 steps without improvement: 0 best accuracy: 0.9487
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 30, Loss: 0.19530330710113047 steps without improvement: 0 best accuracy: 0.9488
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 31, Loss: 0.19026072941720484 steps without improvement: 0 best accuracy: 0.9489
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 32, Loss: 0.1841939604282379 steps without improvement: 0 best accuracy: 0.9498
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 33, Loss: 0.17883766815066338 steps without improvement: 0 best accuracy: 0.9516
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 34, Loss: 0.1722498793900013 steps without improvement: 0 best accuracy: 0.9521
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 35, Loss: 0.16726781994104387 steps without improvement: 1 best accuracy: 0.9521
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 36, Loss: 0.16317773647606373 steps without improvement: 0 best accuracy: 0.9546
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 37, Loss: 0.1578144408017397 steps without improvement: 1 best accuracy: 0.9546
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 38, Loss: 0.15245427384972574 steps without improvement: 0 best accuracy: 0.9557
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 39, Loss: 0.14717324890196323 steps without improvement: 1 best accuracy: 0.9557
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 40, Loss: 0.1401834102720022 steps without improvement: 0 best accuracy: 0.9562
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 41, Loss: 0.13426640592515468 steps without improvement: 0 best accuracy: 0.9596
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 42, Loss: 0.12766564559191465 steps without improvement: 1 best accuracy: 0.9596
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 43, Loss: 0.12301584463566542 steps without improvement: 0 best accuracy: 0.9613
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 44, Loss: 0.11664464607834817 steps without improvement: 0 best accuracy: 0.9656
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 45, Loss: 0.11171078830957412 steps without improvement: 1 best accuracy: 0.9656
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 46, Loss: 0.10639972556382418 steps without improvement: 0 best accuracy: 0.9658
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 47, Loss: 0.10222370833158494 steps without improvement: 0 best accuracy: 0.9672
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 48, Loss: 0.09974213656038046 steps without improvement: 0 best accuracy: 0.9699
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 49, Loss: 0.09605029348284005 steps without improvement: 0 best accuracy: 0.9702
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 50, Loss: 0.09321130353957414 steps without improvement: 0 best accuracy: 0.971
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 51, Loss: 0.09142664700746536 steps without improvement: 0 best accuracy: 0.9725
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 52, Loss: 0.08857784632593393 steps without improvement: 0 best accuracy: 0.9739
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 53, Loss: 0.08622001349925995 steps without improvement: 0 best accuracy: 0.9749
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 54, Loss: 0.08384874295443297 steps without improvement: 1 best accuracy: 0.9749
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 55, Loss: 0.08185456970706582 steps without improvement: 0 best accuracy: 0.9762
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 56, Loss: 0.0822837483882904 steps without improvement: 0 best accuracy: 0.9771
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 57, Loss: 0.07883838571608066 steps without improvement: 1 best accuracy: 0.9771
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 58, Loss: 0.0775764955766499 steps without improvement: 2 best accuracy: 0.9771
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 59, Loss: 0.07683054963126779 steps without improvement: 3 best accuracy: 0.9771
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Test Accuracy: 97.69%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11892.25it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12583.54it/s]
100%|██████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3973.67it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:16<00:00, 77019.86it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 106811.18it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 107739.36it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 1, Loss: 7.953384547233582 steps without improvement: 0 best accuracy: 0.6602
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 2, Loss: 1.4480231285095215 steps without improvement: 0 best accuracy: 0.7453
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 3, Loss: 0.9072174918651581 steps without improvement: 0 best accuracy: 0.7792
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 4, Loss: 0.7291581040620804 steps without improvement: 0 best accuracy: 0.7943
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 5, Loss: 0.6055903905630111 steps without improvement: 0 best accuracy: 0.818
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 6, Loss: 0.5221375469863415 steps without improvement: 0 best accuracy: 0.83
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 7, Loss: 0.46642376139760017 steps without improvement: 0 best accuracy: 0.8517
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 8, Loss: 0.4211428087949753 steps without improvement: 0 best accuracy: 0.8622
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 9, Loss: 0.3845628824830055 steps without improvement: 0 best accuracy: 0.8743
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 10, Loss: 0.3543775987625122 steps without improvement: 0 best accuracy: 0.886
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 11, Loss: 0.327785158008337 steps without improvement: 0 best accuracy: 0.8913
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 12, Loss: 0.30426305055618286 steps without improvement: 0 best accuracy: 0.9028
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 13, Loss: 0.28324642710387704 steps without improvement: 0 best accuracy: 0.9123
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 14, Loss: 0.2632039151340723 steps without improvement: 0 best accuracy: 0.9192
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 15, Loss: 0.2456121753901243 steps without improvement: 0 best accuracy: 0.9257
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 16, Loss: 0.22872380830347538 steps without improvement: 0 best accuracy: 0.9323
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 17, Loss: 0.21237012580037118 steps without improvement: 0 best accuracy: 0.9359
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 18, Loss: 0.1980757164210081 steps without improvement: 0 best accuracy: 0.9411
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 19, Loss: 0.18467205122113228 steps without improvement: 0 best accuracy: 0.9465
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 20, Loss: 0.17161986134946347 steps without improvement: 0 best accuracy: 0.9526
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 21, Loss: 0.15548244282603263 steps without improvement: 0 best accuracy: 0.96
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 22, Loss: 0.13602802995592356 steps without improvement: 0 best accuracy: 0.9646
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 23, Loss: 0.11693838592618704 steps without improvement: 0 best accuracy: 0.9711
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 24, Loss: 0.10073928199708462 steps without improvement: 0 best accuracy: 0.9752
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 25, Loss: 0.08811109915375709 steps without improvement: 0 best accuracy: 0.9775
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 26, Loss: 0.07776026701554656 steps without improvement: 0 best accuracy: 0.9804
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 27, Loss: 0.06893970979377627 steps without improvement: 0 best accuracy: 0.9827
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 28, Loss: 0.0612708406150341 steps without improvement: 0 best accuracy: 0.9842
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 29, Loss: 0.054456717669963836 steps without improvement: 0 best accuracy: 0.9861
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 30, Loss: 0.048351690154522654 steps without improvement: 0 best accuracy: 0.9873
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 31, Loss: 0.04310925165191293 steps without improvement: 0 best accuracy: 0.9884
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 32, Loss: 0.038847301546484234 steps without improvement: 0 best accuracy: 0.9894
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 33, Loss: 0.035267759039998056 steps without improvement: 1 best accuracy: 0.9894
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 34, Loss: 0.03239620272070169 steps without improvement: 0 best accuracy: 0.9905
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 35, Loss: 0.030055983485653998 steps without improvement: 0 best accuracy: 0.9912
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 36, Loss: 0.028008215464651584 steps without improvement: 0 best accuracy: 0.9913
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.19it/s]


Epoch 37, Loss: 0.02639189044944942 steps without improvement: 0 best accuracy: 0.9925
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 38, Loss: 0.024357255939394237 steps without improvement: 0 best accuracy: 0.9928
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 39, Loss: 0.023001362564973534 steps without improvement: 0 best accuracy: 0.9934
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 40, Loss: 0.021357930181548 steps without improvement: 0 best accuracy: 0.9936
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 41, Loss: 0.02027305862866342 steps without improvement: 0 best accuracy: 0.9942
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 42, Loss: 0.018982371715828776 steps without improvement: 1 best accuracy: 0.9942
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 43, Loss: 0.01802985921036452 steps without improvement: 0 best accuracy: 0.9946
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 44, Loss: 0.017042136657983063 steps without improvement: 1 best accuracy: 0.9946
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 45, Loss: 0.016423738654702903 steps without improvement: 0 best accuracy: 0.9948
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 46, Loss: 0.015539725897833706 steps without improvement: 0 best accuracy: 0.9952
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 47, Loss: 0.014785941601730882 steps without improvement: 0 best accuracy: 0.9957
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 48, Loss: 0.014381708325818181 steps without improvement: 1 best accuracy: 0.9957
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 49, Loss: 0.013628594698384405 steps without improvement: 2 best accuracy: 0.9957
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 50, Loss: 0.01323453520424664 steps without improvement: 3 best accuracy: 0.9957
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 51, Loss: 0.012654776086565107 steps without improvement: 0 best accuracy: 0.996
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 52, Loss: 0.01234128205338493 steps without improvement: 1 best accuracy: 0.996
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 53, Loss: 0.011919201263226568 steps without improvement: 0 best accuracy: 0.9962
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 54, Loss: 0.01159370175562799 steps without improvement: 0 best accuracy: 0.9963
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 55, Loss: 0.010987323329318314 steps without improvement: 0 best accuracy: 0.9967
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 56, Loss: 0.010663521585520357 steps without improvement: 1 best accuracy: 0.9967
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 57, Loss: 0.010556524738203734 steps without improvement: 2 best accuracy: 0.9967
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 58, Loss: 0.010251728002913296 steps without improvement: 3 best accuracy: 0.9967
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Test Accuracy: 99.83%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983}}]
Layer2 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11911.86it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12527.44it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12431.51it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 82948.14it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116788.41it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 114647.65it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 1, Loss: 6.358918483257294 steps without improvement: 0 best accuracy: 0.5536
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 2, Loss: 2.9801452422142027 steps without improvement: 0 best accuracy: 0.5744
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 3, Loss: 2.0567033386230467 steps without improvement: 0 best accuracy: 0.5947
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 4, Loss: 1.5033621436357498 steps without improvement: 0 best accuracy: 0.6199
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 5, Loss: 1.1554390916228294 steps without improvement: 0 best accuracy: 0.6431
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 6, Loss: 0.896179549396038 steps without improvement: 0 best accuracy: 0.6727
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 7, Loss: 0.7225714752078056 steps without improvement: 0 best accuracy: 0.7011
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 8, Loss: 0.6330875533819199 steps without improvement: 0 best accuracy: 0.7203
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 9, Loss: 0.5816444328427315 steps without improvement: 0 best accuracy: 0.73
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 10, Loss: 0.5471913221478463 steps without improvement: 0 best accuracy: 0.7425
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 11, Loss: 0.5215884423255921 steps without improvement: 0 best accuracy: 0.7509
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 12, Loss: 0.5004281666874886 steps without improvement: 0 best accuracy: 0.759
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 13, Loss: 0.4818182484805584 steps without improvement: 0 best accuracy: 0.7667
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 14, Loss: 0.46467054694890975 steps without improvement: 0 best accuracy: 0.7756
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 15, Loss: 0.44766690373420714 steps without improvement: 0 best accuracy: 0.7835
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 16, Loss: 0.4303139300644398 steps without improvement: 0 best accuracy: 0.7887
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 17, Loss: 0.41320905432105065 steps without improvement: 0 best accuracy: 0.7963
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 18, Loss: 0.397971068918705 steps without improvement: 0 best accuracy: 0.8
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 19, Loss: 0.38417833894491193 steps without improvement: 0 best accuracy: 0.8138
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 20, Loss: 0.37178039029240606 steps without improvement: 1 best accuracy: 0.8138
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 21, Loss: 0.3606939269602299 steps without improvement: 0 best accuracy: 0.8183
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 22, Loss: 0.3511961305141449 steps without improvement: 0 best accuracy: 0.8214
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 23, Loss: 0.34240190833806994 steps without improvement: 0 best accuracy: 0.831
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.22it/s]


Epoch 24, Loss: 0.3340576121211052 steps without improvement: 0 best accuracy: 0.8435
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 25, Loss: 0.32611411467194557 steps without improvement: 0 best accuracy: 0.8528
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 26, Loss: 0.31837741494178773 steps without improvement: 0 best accuracy: 0.8581
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 27, Loss: 0.3113332733511925 steps without improvement: 0 best accuracy: 0.8673
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 28, Loss: 0.30497548103332517 steps without improvement: 0 best accuracy: 0.8686
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 29, Loss: 0.29929642036557197 steps without improvement: 0 best accuracy: 0.8689
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 30, Loss: 0.2944185023009777 steps without improvement: 0 best accuracy: 0.8715
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 31, Loss: 0.2902652321755886 steps without improvement: 0 best accuracy: 0.8737
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 32, Loss: 0.2864363732933998 steps without improvement: 1 best accuracy: 0.8737
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 33, Loss: 0.2826916427910328 steps without improvement: 0 best accuracy: 0.8749
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 34, Loss: 0.2797963878512382 steps without improvement: 1 best accuracy: 0.8749
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 35, Loss: 0.2758187010884285 steps without improvement: 0 best accuracy: 0.8758
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 36, Loss: 0.27271377146244047 steps without improvement: 1 best accuracy: 0.8758
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 37, Loss: 0.27024155274033546 steps without improvement: 2 best accuracy: 0.8758
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 38, Loss: 0.2666437178850174 steps without improvement: 0 best accuracy: 0.8796
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 39, Loss: 0.26320153892040254 steps without improvement: 0 best accuracy: 0.8836
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 40, Loss: 0.25942894972860814 steps without improvement: 0 best accuracy: 0.8856
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 41, Loss: 0.25413629814982414 steps without improvement: 0 best accuracy: 0.892
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 42, Loss: 0.24889068074524404 steps without improvement: 0 best accuracy: 0.8928
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 43, Loss: 0.2436277198046446 steps without improvement: 0 best accuracy: 0.8944
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 44, Loss: 0.23808709263801575 steps without improvement: 0 best accuracy: 0.8975
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 45, Loss: 0.23210975252091884 steps without improvement: 0 best accuracy: 0.8997
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 46, Loss: 0.22447817385196686 steps without improvement: 0 best accuracy: 0.9088
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 47, Loss: 0.21511902652680873 steps without improvement: 0 best accuracy: 0.9135
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 48, Loss: 0.20528069734573365 steps without improvement: 0 best accuracy: 0.9219
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 49, Loss: 0.19644910171628 steps without improvement: 0 best accuracy: 0.9229
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 50, Loss: 0.18988668166100978 steps without improvement: 0 best accuracy: 0.9286
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 51, Loss: 0.18418775148689748 steps without improvement: 0 best accuracy: 0.9329
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 52, Loss: 0.17937479317188262 steps without improvement: 0 best accuracy: 0.9333
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.20it/s]


Epoch 53, Loss: 0.174639228656888 steps without improvement: 0 best accuracy: 0.936
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 54, Loss: 0.1707686524093151 steps without improvement: 1 best accuracy: 0.936
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 55, Loss: 0.16227560997009277 steps without improvement: 0 best accuracy: 0.9402
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 56, Loss: 0.15256888702511787 steps without improvement: 0 best accuracy: 0.944
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 57, Loss: 0.14701119378209115 steps without improvement: 1 best accuracy: 0.944
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 58, Loss: 0.1413263636827469 steps without improvement: 0 best accuracy: 0.9446
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 59, Loss: 0.1372278568521142 steps without improvement: 0 best accuracy: 0.9452
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 60, Loss: 0.13332796439528466 steps without improvement: 0 best accuracy: 0.9485
[SYST] Epoch 60


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 61, Loss: 0.13002127818763257 steps without improvement: 0 best accuracy: 0.9491
[SYST] Epoch 61


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 62, Loss: 0.12637705486267806 steps without improvement: 1 best accuracy: 0.9491
[SYST] Epoch 62


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 63, Loss: 0.12367318116128445 steps without improvement: 0 best accuracy: 0.9497
[SYST] Epoch 63


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 64, Loss: 0.12059811301529408 steps without improvement: 0 best accuracy: 0.9528
[SYST] Epoch 64


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 65, Loss: 0.11820713147521018 steps without improvement: 0 best accuracy: 0.9545
[SYST] Epoch 65


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 66, Loss: 0.12872538931667804 steps without improvement: 0 best accuracy: 0.9559
[SYST] Epoch 66


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 67, Loss: 0.11462209325283766 steps without improvement: 0 best accuracy: 0.956
[SYST] Epoch 67


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 68, Loss: 0.11350861672312021 steps without improvement: 1 best accuracy: 0.956
[SYST] Epoch 68


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 69, Loss: 0.11203323137015105 steps without improvement: 0 best accuracy: 0.9577
[SYST] Epoch 69


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 70, Loss: 0.11081975623965264 steps without improvement: 1 best accuracy: 0.9577
[SYST] Epoch 70


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 71, Loss: 0.11047031830996275 steps without improvement: 0 best accuracy: 0.9582
[SYST] Epoch 71


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 72, Loss: 0.10890386931598187 steps without improvement: 0 best accuracy: 0.9585
[SYST] Epoch 72


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 73, Loss: 0.10780452404171229 steps without improvement: 1 best accuracy: 0.9585
[SYST] Epoch 73


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 74, Loss: 0.1072990994900465 steps without improvement: 2 best accuracy: 0.9585
[SYST] Epoch 74


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 75, Loss: 0.1059981806948781 steps without improvement: 3 best accuracy: 0.9585
[SYST] Epoch 75


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.21it/s]


Epoch 76, Loss: 0.10552717685699463 steps without improvement: 0 best accuracy: 0.9589
[SYST] Epoch 76


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 77, Loss: 0.10471623431891203 steps without improvement: 1 best accuracy: 0.9589
[SYST] Epoch 77


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 78, Loss: 0.10359952621161937 steps without improvement: 0 best accuracy: 0.9622
[SYST] Epoch 78


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 79, Loss: 0.10168103914707899 steps without improvement: 0 best accuracy: 0.9651
[SYST] Epoch 79


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 80, Loss: 0.09734506521373987 steps without improvement: 0 best accuracy: 0.9706
[SYST] Epoch 80


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 81, Loss: 0.09266497928649187 steps without improvement: 0 best accuracy: 0.9738
[SYST] Epoch 81


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 82, Loss: 0.08820746578276158 steps without improvement: 0 best accuracy: 0.9755
[SYST] Epoch 82


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 83, Loss: 0.08467468086630106 steps without improvement: 1 best accuracy: 0.9755
[SYST] Epoch 83


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 84, Loss: 0.08195418510586024 steps without improvement: 0 best accuracy: 0.9765
[SYST] Epoch 84


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 85, Loss: 0.08159909296780825 steps without improvement: 0 best accuracy: 0.9782
[SYST] Epoch 85


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 86, Loss: 0.07664642490446567 steps without improvement: 1 best accuracy: 0.9782
[SYST] Epoch 86


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 87, Loss: 0.07510131236165762 steps without improvement: 0 best accuracy: 0.9801
[SYST] Epoch 87


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 88, Loss: 0.0732731818407774 steps without improvement: 1 best accuracy: 0.9801
[SYST] Epoch 88


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 89, Loss: 0.07144521510228515 steps without improvement: 0 best accuracy: 0.9812
[SYST] Epoch 89


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 90, Loss: 0.07164358451962471 steps without improvement: 0 best accuracy: 0.9813
[SYST] Epoch 90


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 91, Loss: 0.06964983919635415 steps without improvement: 1 best accuracy: 0.9813
[SYST] Epoch 91


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 92, Loss: 0.06797129537910224 steps without improvement: 0 best accuracy: 0.9844
[SYST] Epoch 92


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 93, Loss: 0.06724176267161966 steps without improvement: 1 best accuracy: 0.9844
[SYST] Epoch 93


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 94, Loss: 0.06573616625741124 steps without improvement: 2 best accuracy: 0.9844
[SYST] Epoch 94


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 95, Loss: 0.072986581325531 steps without improvement: 0 best accuracy: 0.9848
[SYST] Epoch 95


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 96, Loss: 0.06275705590844155 steps without improvement: 0 best accuracy: 0.985
[SYST] Epoch 96


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 97, Loss: 0.061994229666888716 steps without improvement: 1 best accuracy: 0.985
[SYST] Epoch 97


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 98, Loss: 0.06121743969619274 steps without improvement: 0 best accuracy: 0.9861
[SYST] Epoch 98


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.14it/s]


Epoch 99, Loss: 0.06051496813073754 steps without improvement: 0 best accuracy: 0.9864
[SYST] Epoch 99


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 100, Loss: 0.06079665821045637 steps without improvement: 0 best accuracy: 0.9871
[SYST] Epoch 100


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 101, Loss: 0.05931900218129158 steps without improvement: 0 best accuracy: 0.9878
[SYST] Epoch 101


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 102, Loss: 0.058109922725707294 steps without improvement: 0 best accuracy: 0.988
[SYST] Epoch 102


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 103, Loss: 0.057641587741672995 steps without improvement: 1 best accuracy: 0.988
[SYST] Epoch 103


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 104, Loss: 0.056838245391845704 steps without improvement: 2 best accuracy: 0.988
[SYST] Epoch 104


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 105, Loss: 0.0572865285910666 steps without improvement: 3 best accuracy: 0.988
[SYST] Epoch 105


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 106, Loss: 0.05541406977921724 steps without improvement: 0 best accuracy: 0.9881
[SYST] Epoch 106


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 107, Loss: 0.0546789756603539 steps without improvement: 1 best accuracy: 0.9881
[SYST] Epoch 107


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 108, Loss: 0.05350877782329917 steps without improvement: 2 best accuracy: 0.9881
[SYST] Epoch 108


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 109, Loss: 0.05273842787370086 steps without improvement: 3 best accuracy: 0.9881
[SYST] Epoch 109


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Test Accuracy: 98.65%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865}}]
Layer2 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11820.99it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12653.24it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12626.93it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 83876.62it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116115.59it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116517.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 1, Loss: 5.780360621213913 steps without improvement: 0 best accuracy: 0.5965
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 2, Loss: 3.3548781764507294 steps without improvement: 0 best accuracy: 0.6288
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 3, Loss: 2.805046067237854 steps without improvement: 0 best accuracy: 0.6625
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 4, Loss: 2.1996674233675004 steps without improvement: 0 best accuracy: 0.6841
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 5, Loss: 1.4777223992347717 steps without improvement: 0 best accuracy: 0.6905
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 6, Loss: 0.8241369107365608 steps without improvement: 0 best accuracy: 0.7177
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 7, Loss: 0.6531871137022972 steps without improvement: 0 best accuracy: 0.7451
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 8, Loss: 0.5793533101677895 steps without improvement: 0 best accuracy: 0.765
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 9, Loss: 0.5235294376313686 steps without improvement: 0 best accuracy: 0.7844
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 10, Loss: 0.4762431198358536 steps without improvement: 0 best accuracy: 0.7968
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 11, Loss: 0.43575880080461504 steps without improvement: 0 best accuracy: 0.8128
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 12, Loss: 0.40191551581025126 steps without improvement: 0 best accuracy: 0.8235
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 13, Loss: 0.37426081478595735 steps without improvement: 0 best accuracy: 0.8391
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 14, Loss: 0.35024347588419913 steps without improvement: 0 best accuracy: 0.8527
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 15, Loss: 0.3285871359705925 steps without improvement: 0 best accuracy: 0.8611
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 16, Loss: 0.30893503308296205 steps without improvement: 0 best accuracy: 0.8722
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 17, Loss: 0.2879923340678215 steps without improvement: 0 best accuracy: 0.8858
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 18, Loss: 0.26613938860595227 steps without improvement: 0 best accuracy: 0.8951
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 19, Loss: 0.24864533238112926 steps without improvement: 0 best accuracy: 0.9066
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 20, Loss: 0.23388575471937656 steps without improvement: 0 best accuracy: 0.9136
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 21, Loss: 0.22084341704845428 steps without improvement: 0 best accuracy: 0.9176
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 22, Loss: 0.21006202533841134 steps without improvement: 0 best accuracy: 0.9248
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 23, Loss: 0.200162021741271 steps without improvement: 0 best accuracy: 0.9302
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 24, Loss: 0.1919985979050398 steps without improvement: 0 best accuracy: 0.9317
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 25, Loss: 0.18386201620101927 steps without improvement: 0 best accuracy: 0.9332
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 26, Loss: 0.1760404323041439 steps without improvement: 0 best accuracy: 0.9385
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 27, Loss: 0.16438326708972453 steps without improvement: 0 best accuracy: 0.9394
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 28, Loss: 0.1576498644798994 steps without improvement: 0 best accuracy: 0.9411
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 29, Loss: 0.15229777030646802 steps without improvement: 0 best accuracy: 0.943
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 30, Loss: 0.14708561785519123 steps without improvement: 0 best accuracy: 0.9475
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 31, Loss: 0.14281708620488642 steps without improvement: 1 best accuracy: 0.9475
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 32, Loss: 0.13857500184327365 steps without improvement: 0 best accuracy: 0.9484
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 33, Loss: 0.13542279291898013 steps without improvement: 1 best accuracy: 0.9484
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 34, Loss: 0.13255700625479222 steps without improvement: 0 best accuracy: 0.9495
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 35, Loss: 0.12967717964202166 steps without improvement: 0 best accuracy: 0.9506
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 36, Loss: 0.12557194497436286 steps without improvement: 0 best accuracy: 0.9542
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 37, Loss: 0.12249180693179369 steps without improvement: 0 best accuracy: 0.9546
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 38, Loss: 0.11944742389023304 steps without improvement: 0 best accuracy: 0.9573
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 39, Loss: 0.11714926309883594 steps without improvement: 1 best accuracy: 0.9573
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 40, Loss: 0.11451544024050236 steps without improvement: 0 best accuracy: 0.9597
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 41, Loss: 0.11201558042317629 steps without improvement: 0 best accuracy: 0.9598
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 42, Loss: 0.10980882488191128 steps without improvement: 0 best accuracy: 0.9616
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 43, Loss: 0.10681394316256046 steps without improvement: 0 best accuracy: 0.9625
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 44, Loss: 0.10520275976508855 steps without improvement: 0 best accuracy: 0.9639
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 45, Loss: 0.10241507552564144 steps without improvement: 1 best accuracy: 0.9639
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 46, Loss: 0.10080054719001055 steps without improvement: 2 best accuracy: 0.9639
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 47, Loss: 0.09872430492192506 steps without improvement: 0 best accuracy: 0.9655
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 48, Loss: 0.09689091868698597 steps without improvement: 0 best accuracy: 0.9677
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 49, Loss: 0.09467155184596777 steps without improvement: 0 best accuracy: 0.9694
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 50, Loss: 0.09326365094631911 steps without improvement: 0 best accuracy: 0.9701
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 51, Loss: 0.09184660285711288 steps without improvement: 0 best accuracy: 0.9712
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 52, Loss: 0.0897296480089426 steps without improvement: 1 best accuracy: 0.9712
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 53, Loss: 0.08826731633394956 steps without improvement: 0 best accuracy: 0.9715
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 54, Loss: 0.08675037074834108 steps without improvement: 0 best accuracy: 0.974
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 55, Loss: 0.08550068072974681 steps without improvement: 1 best accuracy: 0.974
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 56, Loss: 0.08402975849807262 steps without improvement: 2 best accuracy: 0.974
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 57, Loss: 0.08216640055179596 steps without improvement: 3 best accuracy: 0.974
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 58, Loss: 0.08112788781523704 steps without improvement: 0 best accuracy: 0.9758
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 59, Loss: 0.07937981754541397 steps without improvement: 1 best accuracy: 0.9758
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 60, Loss: 0.07873076034709811 steps without improvement: 0 best accuracy: 0.9767
[SYST] Epoch 60


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 61, Loss: 0.07711953053250908 steps without improvement: 1 best accuracy: 0.9767
[SYST] Epoch 61


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 62, Loss: 0.07624885473400354 steps without improvement: 0 best accuracy: 0.9771
[SYST] Epoch 62


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 63, Loss: 0.07414365569129586 steps without improvement: 0 best accuracy: 0.9779
[SYST] Epoch 63


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 64, Loss: 0.07337262505665422 steps without improvement: 1 best accuracy: 0.9779
[SYST] Epoch 64


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 65, Loss: 0.07194543153047561 steps without improvement: 0 best accuracy: 0.9783
[SYST] Epoch 65


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 66, Loss: 0.0706787276826799 steps without improvement: 1 best accuracy: 0.9783
[SYST] Epoch 66


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 67, Loss: 0.06953747849911451 steps without improvement: 2 best accuracy: 0.9783
[SYST] Epoch 67


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 68, Loss: 0.0678467933088541 steps without improvement: 0 best accuracy: 0.9789
[SYST] Epoch 68


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 69, Loss: 0.06650411427021026 steps without improvement: 1 best accuracy: 0.9789
[SYST] Epoch 69


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 70, Loss: 0.06665859511122108 steps without improvement: 2 best accuracy: 0.9789
[SYST] Epoch 70


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 71, Loss: 0.06442289218306542 steps without improvement: 0 best accuracy: 0.9796
[SYST] Epoch 71


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 72, Loss: 0.06412068694829941 steps without improvement: 1 best accuracy: 0.9796
[SYST] Epoch 72


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 73, Loss: 0.06343585729599 steps without improvement: 2 best accuracy: 0.9796
[SYST] Epoch 73


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 74, Loss: 0.06189665429294109 steps without improvement: 0 best accuracy: 0.9803
[SYST] Epoch 74


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 75, Loss: 0.061175172310322525 steps without improvement: 1 best accuracy: 0.9803
[SYST] Epoch 75


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 76, Loss: 0.06057332841679454 steps without improvement: 2 best accuracy: 0.9803
[SYST] Epoch 76


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 77, Loss: 0.059016444534063336 steps without improvement: 0 best accuracy: 0.982
[SYST] Epoch 77


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 78, Loss: 0.05840384464710951 steps without improvement: 1 best accuracy: 0.982
[SYST] Epoch 78


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 79, Loss: 0.057604574635624885 steps without improvement: 0 best accuracy: 0.9827
[SYST] Epoch 79


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 80, Loss: 0.05677506579086185 steps without improvement: 1 best accuracy: 0.9827
[SYST] Epoch 80


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 81, Loss: 0.05640706609934568 steps without improvement: 2 best accuracy: 0.9827
[SYST] Epoch 81


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 82, Loss: 0.0551078899204731 steps without improvement: 3 best accuracy: 0.9827
[SYST] Epoch 82


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 83, Loss: 0.05420317281037569 steps without improvement: 0 best accuracy: 0.984
[SYST] Epoch 83


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 84, Loss: 0.0533633079752326 steps without improvement: 1 best accuracy: 0.984
[SYST] Epoch 84


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 85, Loss: 0.05279863664880395 steps without improvement: 2 best accuracy: 0.984
[SYST] Epoch 85


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 86, Loss: 0.05244234846904874 steps without improvement: 3 best accuracy: 0.984
[SYST] Epoch 86


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Test Accuracy: 98.56%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11826.05it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12550.12it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12578.55it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:16<00:00, 79321.11it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 105706.69it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 51459.43it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 1, Loss: 6.678150924444199 steps without improvement: 0 best accuracy: 0.5546
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 2, Loss: 2.5748679250478745 steps without improvement: 0 best accuracy: 0.6167
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 3, Loss: 1.7056887203454971 steps without improvement: 0 best accuracy: 0.6678
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.21it/s]


Epoch 4, Loss: 1.3049181121587754 steps without improvement: 0 best accuracy: 0.7341
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 5, Loss: 1.0158081445097924 steps without improvement: 0 best accuracy: 0.7881
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 6, Loss: 0.8174043154716492 steps without improvement: 0 best accuracy: 0.8124
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 7, Loss: 0.6370736053586006 steps without improvement: 0 best accuracy: 0.8256
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 8, Loss: 0.41670117795467376 steps without improvement: 0 best accuracy: 0.8687
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 9, Loss: 0.2897020082175732 steps without improvement: 0 best accuracy: 0.9099
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 10, Loss: 0.22355686008930206 steps without improvement: 0 best accuracy: 0.9303
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 11, Loss: 0.18147449560463427 steps without improvement: 0 best accuracy: 0.9439
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 12, Loss: 0.15357908800244333 steps without improvement: 0 best accuracy: 0.9514
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 13, Loss: 0.1326159692928195 steps without improvement: 0 best accuracy: 0.9556
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 14, Loss: 0.11533194169402122 steps without improvement: 0 best accuracy: 0.9632
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 15, Loss: 0.10182447023689747 steps without improvement: 0 best accuracy: 0.9666
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 16, Loss: 0.09162519369274377 steps without improvement: 0 best accuracy: 0.9705
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 17, Loss: 0.08349715562537313 steps without improvement: 0 best accuracy: 0.9744
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 18, Loss: 0.07763930004090071 steps without improvement: 0 best accuracy: 0.9772
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 19, Loss: 0.07154757581651211 steps without improvement: 0 best accuracy: 0.9788
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 20, Loss: 0.06699642520397901 steps without improvement: 0 best accuracy: 0.9806
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 21, Loss: 0.0634400068037212 steps without improvement: 0 best accuracy: 0.9808
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 22, Loss: 0.05993872832506895 steps without improvement: 0 best accuracy: 0.9821
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 23, Loss: 0.05579392930492759 steps without improvement: 0 best accuracy: 0.9832
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 24, Loss: 0.053017310202121734 steps without improvement: 0 best accuracy: 0.9843
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 25, Loss: 0.04967316627502441 steps without improvement: 0 best accuracy: 0.9857
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 26, Loss: 0.04725837435573339 steps without improvement: 0 best accuracy: 0.9865
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 27, Loss: 0.04444385543465614 steps without improvement: 0 best accuracy: 0.9877
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 28, Loss: 0.04251602996140719 steps without improvement: 1 best accuracy: 0.9877
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 29, Loss: 0.039291073102504015 steps without improvement: 0 best accuracy: 0.9899
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 30, Loss: 0.03737001661211252 steps without improvement: 0 best accuracy: 0.9914
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 31, Loss: 0.03551526430994272 steps without improvement: 0 best accuracy: 0.9919
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 32, Loss: 0.03408094139769673 steps without improvement: 0 best accuracy: 0.9921
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 33, Loss: 0.033697631545364856 steps without improvement: 0 best accuracy: 0.9923
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 34, Loss: 0.03211432539857924 steps without improvement: 1 best accuracy: 0.9923
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 35, Loss: 0.0309922406822443 steps without improvement: 2 best accuracy: 0.9923
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.21it/s]


Epoch 36, Loss: 0.030148439249023794 steps without improvement: 0 best accuracy: 0.993
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.12it/s]


Epoch 37, Loss: 0.02868542494252324 steps without improvement: 0 best accuracy: 0.994
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 38, Loss: 0.026851041167974474 steps without improvement: 0 best accuracy: 0.9946
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 39, Loss: 0.026050826916471124 steps without improvement: 1 best accuracy: 0.9946
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 40, Loss: 0.025825081896036862 steps without improvement: 0 best accuracy: 0.9948
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 41, Loss: 0.02398086707573384 steps without improvement: 0 best accuracy: 0.9954
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.23it/s]


Epoch 42, Loss: 0.023574657533317805 steps without improvement: 0 best accuracy: 0.9959
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.22it/s]


Epoch 43, Loss: 0.022552887019701304 steps without improvement: 1 best accuracy: 0.9959
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 44, Loss: 0.02205645751208067 steps without improvement: 0 best accuracy: 0.996
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 45, Loss: 0.021375590804964303 steps without improvement: 1 best accuracy: 0.996
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 46, Loss: 0.021116749299690128 steps without improvement: 2 best accuracy: 0.996
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 47, Loss: 0.02087349447887391 steps without improvement: 0 best accuracy: 0.9964
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 48, Loss: 0.01984454713296145 steps without improvement: 0 best accuracy: 0.9967
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 49, Loss: 0.01975080163218081 steps without improvement: 1 best accuracy: 0.9967
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 50, Loss: 0.019198052301071585 steps without improvement: 0 best accuracy: 0.9969
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 51, Loss: 0.019472933723591268 steps without improvement: 1 best accuracy: 0.9969
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 52, Loss: 0.018177150674164297 steps without improvement: 2 best accuracy: 0.9969
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 53, Loss: 0.018087049718014895 steps without improvement: 3 best accuracy: 0.9969
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Test Accuracy: 99.57%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957}}]
Layer3 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11765.85it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12519.99it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12549.89it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 83677.94it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 113651.68it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 112696.18it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 1, Loss: 6.073939398527146 steps without improvement: 0 best accuracy: 0.5339
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 2, Loss: 2.949335515499115 steps without improvement: 0 best accuracy: 0.5599
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 3, Loss: 2.268700571060181 steps without improvement: 0 best accuracy: 0.6097
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 4, Loss: 1.6909177827835082 steps without improvement: 0 best accuracy: 0.6632
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 5, Loss: 1.1923306420445443 steps without improvement: 0 best accuracy: 0.7309
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 6, Loss: 0.8745758545398712 steps without improvement: 0 best accuracy: 0.7753
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 7, Loss: 0.6572325614094734 steps without improvement: 0 best accuracy: 0.8307
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 8, Loss: 0.46887806192040443 steps without improvement: 0 best accuracy: 0.869
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 9, Loss: 0.32397387847304343 steps without improvement: 0 best accuracy: 0.9155
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 10, Loss: 0.22552549742162228 steps without improvement: 0 best accuracy: 0.9363
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 11, Loss: 0.18723387509584427 steps without improvement: 0 best accuracy: 0.9456
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 12, Loss: 0.16658933147788046 steps without improvement: 0 best accuracy: 0.9533
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 13, Loss: 0.15323030151426792 steps without improvement: 0 best accuracy: 0.9569
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 14, Loss: 0.143721634298563 steps without improvement: 0 best accuracy: 0.9593
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 15, Loss: 0.13508984908461572 steps without improvement: 0 best accuracy: 0.9628
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 16, Loss: 0.12841329257935286 steps without improvement: 0 best accuracy: 0.9629
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 17, Loss: 0.12322962768375874 steps without improvement: 0 best accuracy: 0.9664
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 18, Loss: 0.11706203624606132 steps without improvement: 0 best accuracy: 0.9675
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 19, Loss: 0.1120596145093441 steps without improvement: 0 best accuracy: 0.9694
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 20, Loss: 0.10554876338690519 steps without improvement: 0 best accuracy: 0.971
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 21, Loss: 0.10096333798021079 steps without improvement: 0 best accuracy: 0.9744
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 22, Loss: 0.09460658371448517 steps without improvement: 1 best accuracy: 0.9744
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 23, Loss: 0.08935760580003262 steps without improvement: 0 best accuracy: 0.9759
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 24, Loss: 0.08466958941891789 steps without improvement: 0 best accuracy: 0.9786
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 25, Loss: 0.08028052600100637 steps without improvement: 0 best accuracy: 0.9794
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 26, Loss: 0.07682728808373213 steps without improvement: 0 best accuracy: 0.9804
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 27, Loss: 0.07345713760703802 steps without improvement: 0 best accuracy: 0.9816
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 28, Loss: 0.07144102429971098 steps without improvement: 1 best accuracy: 0.9816
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 29, Loss: 0.06816393224522471 steps without improvement: 0 best accuracy: 0.9818
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 30, Loss: 0.06563815653324127 steps without improvement: 1 best accuracy: 0.9818
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 31, Loss: 0.0636954889446497 steps without improvement: 0 best accuracy: 0.9831
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 32, Loss: 0.06097243145108223 steps without improvement: 0 best accuracy: 0.9836
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 33, Loss: 0.059309462644159795 steps without improvement: 0 best accuracy: 0.9843
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 34, Loss: 0.057935092952102425 steps without improvement: 1 best accuracy: 0.9843
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 35, Loss: 0.05577589560300112 steps without improvement: 0 best accuracy: 0.9845
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 36, Loss: 0.053807178363204006 steps without improvement: 0 best accuracy: 0.9856
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 37, Loss: 0.06916458452120423 steps without improvement: 0 best accuracy: 0.9862
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 38, Loss: 0.050612599328160285 steps without improvement: 1 best accuracy: 0.9862
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 39, Loss: 0.04942675262689591 steps without improvement: 0 best accuracy: 0.9869
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 40, Loss: 0.04861727517098188 steps without improvement: 0 best accuracy: 0.9874
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 41, Loss: 0.04742029722779989 steps without improvement: 0 best accuracy: 0.988
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 42, Loss: 0.04672672251239419 steps without improvement: 0 best accuracy: 0.9889
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 43, Loss: 0.045321331471204755 steps without improvement: 1 best accuracy: 0.9889
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 44, Loss: 0.04437169070355594 steps without improvement: 0 best accuracy: 0.9894
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 45, Loss: 0.04361631344072521 steps without improvement: 0 best accuracy: 0.9896
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 46, Loss: 0.042452817372977736 steps without improvement: 1 best accuracy: 0.9896
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 47, Loss: 0.04123924912884831 steps without improvement: 0 best accuracy: 0.9898
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 48, Loss: 0.040608443664386866 steps without improvement: 0 best accuracy: 0.99
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 49, Loss: 0.03941957280039787 steps without improvement: 1 best accuracy: 0.99
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 50, Loss: 0.03818807504139841 steps without improvement: 0 best accuracy: 0.9903
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 51, Loss: 0.03747093668207526 steps without improvement: 0 best accuracy: 0.9907
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 52, Loss: 0.036608032099902627 steps without improvement: 0 best accuracy: 0.9912
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 53, Loss: 0.06591417784802615 steps without improvement: 0 best accuracy: 0.9919
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 54, Loss: 0.03509579944424331 steps without improvement: 1 best accuracy: 0.9919
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 55, Loss: 0.03428753594867885 steps without improvement: 2 best accuracy: 0.9919
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 56, Loss: 0.03370084748603404 steps without improvement: 3 best accuracy: 0.9919
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Test Accuracy: 99.09%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909}}]
Layer3 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11797.26it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12588.79it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12642.25it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:17<00:00, 74207.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 117918.22it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 115898.37it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 1, Loss: 4.13834588766098 steps without improvement: 0 best accuracy: 0.4889
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 2, Loss: 2.991466906070709 steps without improvement: 0 best accuracy: 0.5134
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 3, Loss: 2.770683960914612 steps without improvement: 1 best accuracy: 0.5134
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 4, Loss: 2.31628020465374 steps without improvement: 0 best accuracy: 0.5626
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 5, Loss: 1.307265158891678 steps without improvement: 0 best accuracy: 0.5932
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 6, Loss: 1.148106986284256 steps without improvement: 0 best accuracy: 0.6005
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 7, Loss: 1.0707829183340072 steps without improvement: 0 best accuracy: 0.611
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 8, Loss: 1.0114324191212654 steps without improvement: 0 best accuracy: 0.6176
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 9, Loss: 0.945567741394043 steps without improvement: 0 best accuracy: 0.6346
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 10, Loss: 0.9147719660401344 steps without improvement: 0 best accuracy: 0.6408
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 11, Loss: 0.8920535948872567 steps without improvement: 0 best accuracy: 0.6426
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 12, Loss: 0.871785541176796 steps without improvement: 0 best accuracy: 0.6566
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 13, Loss: 0.8537477985024452 steps without improvement: 0 best accuracy: 0.6582
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 14, Loss: 0.8370519316196442 steps without improvement: 0 best accuracy: 0.6632
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 15, Loss: 0.8224138870835305 steps without improvement: 0 best accuracy: 0.6639
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 16, Loss: 0.808367730975151 steps without improvement: 1 best accuracy: 0.6639
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 17, Loss: 0.7955214381217957 steps without improvement: 0 best accuracy: 0.672
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 18, Loss: 0.7823521503806115 steps without improvement: 0 best accuracy: 0.6739
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 19, Loss: 0.7719411590695381 steps without improvement: 0 best accuracy: 0.6811
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 20, Loss: 0.7591102534532547 steps without improvement: 1 best accuracy: 0.6811
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 21, Loss: 0.7478721663355827 steps without improvement: 0 best accuracy: 0.6845
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 22, Loss: 0.7364029243588448 steps without improvement: 0 best accuracy: 0.6908
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 23, Loss: 0.7277778965234757 steps without improvement: 1 best accuracy: 0.6908
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 24, Loss: 0.7189737033843994 steps without improvement: 0 best accuracy: 0.697
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 25, Loss: 0.7096792301535606 steps without improvement: 1 best accuracy: 0.697
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 26, Loss: 0.7008204281330108 steps without improvement: 0 best accuracy: 0.6971
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 27, Loss: 0.6806893813610077 steps without improvement: 0 best accuracy: 0.7069
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 28, Loss: 0.6564429050683975 steps without improvement: 0 best accuracy: 0.7188
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 29, Loss: 0.6410115736722947 steps without improvement: 0 best accuracy: 0.7199
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 30, Loss: 0.6290730211138725 steps without improvement: 0 best accuracy: 0.7331
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 31, Loss: 0.6135817411541938 steps without improvement: 0 best accuracy: 0.7369
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 32, Loss: 0.6065196484327317 steps without improvement: 0 best accuracy: 0.7426
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 33, Loss: 0.5951415041089058 steps without improvement: 0 best accuracy: 0.7464
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 34, Loss: 0.5893955045938492 steps without improvement: 1 best accuracy: 0.7464
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 35, Loss: 0.5841293886303902 steps without improvement: 0 best accuracy: 0.7515
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 36, Loss: 0.5759446290135384 steps without improvement: 0 best accuracy: 0.7524
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 37, Loss: 0.5733666604757309 steps without improvement: 0 best accuracy: 0.7654
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 38, Loss: 0.5677642133831978 steps without improvement: 1 best accuracy: 0.7654
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 39, Loss: 0.559866433441639 steps without improvement: 2 best accuracy: 0.7654
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 40, Loss: 0.554460951089859 steps without improvement: 3 best accuracy: 0.7654
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 41, Loss: 0.5515697279572487 steps without improvement: 0 best accuracy: 0.7698
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 42, Loss: 0.5465299823880195 steps without improvement: 0 best accuracy: 0.7715
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 43, Loss: 0.5411744280159474 steps without improvement: 1 best accuracy: 0.7715
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 44, Loss: 0.5370179009437561 steps without improvement: 0 best accuracy: 0.7757
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 45, Loss: 0.5366632282733917 steps without improvement: 0 best accuracy: 0.7798
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 46, Loss: 0.528924401551485 steps without improvement: 1 best accuracy: 0.7798
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 47, Loss: 0.5245139200985431 steps without improvement: 0 best accuracy: 0.7868
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 48, Loss: 0.5199737010896206 steps without improvement: 0 best accuracy: 0.7871
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 49, Loss: 0.5153812332451344 steps without improvement: 1 best accuracy: 0.7871
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 50, Loss: 0.5123956555128097 steps without improvement: 0 best accuracy: 0.7908
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 51, Loss: 0.5067982944846153 steps without improvement: 0 best accuracy: 0.7923
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 52, Loss: 0.5033547116816044 steps without improvement: 0 best accuracy: 0.7974
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 53, Loss: 0.49922769829630853 steps without improvement: 1 best accuracy: 0.7974
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 54, Loss: 0.4952858059108257 steps without improvement: 0 best accuracy: 0.8057
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 55, Loss: 0.4896997864544392 steps without improvement: 0 best accuracy: 0.8086
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 56, Loss: 0.4874712944030762 steps without improvement: 1 best accuracy: 0.8086
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 57, Loss: 0.4826636539399624 steps without improvement: 0 best accuracy: 0.8099
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 58, Loss: 0.4772107410430908 steps without improvement: 0 best accuracy: 0.8107
[SYST] Epoch 58


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 59, Loss: 0.47457802563905715 steps without improvement: 0 best accuracy: 0.8179
[SYST] Epoch 59


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 60, Loss: 0.4711064580082893 steps without improvement: 0 best accuracy: 0.8191
[SYST] Epoch 60


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 61, Loss: 0.4669333066046238 steps without improvement: 0 best accuracy: 0.8226
[SYST] Epoch 61


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 62, Loss: 0.46359835147857664 steps without improvement: 1 best accuracy: 0.8226
[SYST] Epoch 62


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 63, Loss: 0.4595808060467243 steps without improvement: 2 best accuracy: 0.8226
[SYST] Epoch 63


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 64, Loss: 0.45637749835848807 steps without improvement: 0 best accuracy: 0.8266
[SYST] Epoch 64


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 65, Loss: 0.45411300629377366 steps without improvement: 0 best accuracy: 0.8276
[SYST] Epoch 65


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 66, Loss: 0.4487790587544441 steps without improvement: 1 best accuracy: 0.8276
[SYST] Epoch 66


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 67, Loss: 0.4448915712535381 steps without improvement: 0 best accuracy: 0.8321
[SYST] Epoch 67


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 68, Loss: 0.4435142117738724 steps without improvement: 1 best accuracy: 0.8321
[SYST] Epoch 68


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 69, Loss: 0.4397856278717518 steps without improvement: 2 best accuracy: 0.8321
[SYST] Epoch 69


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 70, Loss: 0.4361109374463558 steps without improvement: 3 best accuracy: 0.8321
[SYST] Epoch 70


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 71, Loss: 0.4331639452278614 steps without improvement: 0 best accuracy: 0.8376
[SYST] Epoch 71


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 72, Loss: 0.43035301893949507 steps without improvement: 0 best accuracy: 0.8389
[SYST] Epoch 72


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 73, Loss: 0.42583090186119077 steps without improvement: 1 best accuracy: 0.8389
[SYST] Epoch 73


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 74, Loss: 0.42363431259989737 steps without improvement: 0 best accuracy: 0.8394
[SYST] Epoch 74


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 75, Loss: 0.4218725971877575 steps without improvement: 1 best accuracy: 0.8394
[SYST] Epoch 75


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 76, Loss: 0.41838872343301775 steps without improvement: 2 best accuracy: 0.8394
[SYST] Epoch 76


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 77, Loss: 0.4145125886797905 steps without improvement: 3 best accuracy: 0.8394
[SYST] Epoch 77


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 78, Loss: 0.4126162214577198 steps without improvement: 0 best accuracy: 0.8435
[SYST] Epoch 78


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 79, Loss: 0.411062176078558 steps without improvement: 1 best accuracy: 0.8435
[SYST] Epoch 79


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 80, Loss: 0.4090127877891064 steps without improvement: 0 best accuracy: 0.8477
[SYST] Epoch 80


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 81, Loss: 0.4067934249341488 steps without improvement: 1 best accuracy: 0.8477
[SYST] Epoch 81


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 82, Loss: 0.40245226815342905 steps without improvement: 2 best accuracy: 0.8477
[SYST] Epoch 82


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 83, Loss: 0.3997618559002876 steps without improvement: 0 best accuracy: 0.8486
[SYST] Epoch 83


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 84, Loss: 0.39803850948810576 steps without improvement: 1 best accuracy: 0.8486
[SYST] Epoch 84


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 85, Loss: 0.3968926754593849 steps without improvement: 2 best accuracy: 0.8486
[SYST] Epoch 85


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 86, Loss: 0.39362176820635797 steps without improvement: 0 best accuracy: 0.8521
[SYST] Epoch 86


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 87, Loss: 0.3919319097697735 steps without improvement: 1 best accuracy: 0.8521
[SYST] Epoch 87


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 88, Loss: 0.3894749562442303 steps without improvement: 2 best accuracy: 0.8521
[SYST] Epoch 88


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 89, Loss: 0.38684044167399406 steps without improvement: 3 best accuracy: 0.8521
[SYST] Epoch 89


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 90, Loss: 0.38573514521121977 steps without improvement: 0 best accuracy: 0.8527
[SYST] Epoch 90


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 91, Loss: 0.3834653078019619 steps without improvement: 0 best accuracy: 0.8554
[SYST] Epoch 91


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 92, Loss: 0.38172733783721924 steps without improvement: 0 best accuracy: 0.8575
[SYST] Epoch 92


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 93, Loss: 0.3794003610312939 steps without improvement: 1 best accuracy: 0.8575
[SYST] Epoch 93


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 94, Loss: 0.3780710382759571 steps without improvement: 2 best accuracy: 0.8575
[SYST] Epoch 94


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 95, Loss: 0.37707248359918594 steps without improvement: 0 best accuracy: 0.8591
[SYST] Epoch 95


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 96, Loss: 0.37457713052630426 steps without improvement: 1 best accuracy: 0.8591
[SYST] Epoch 96


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 97, Loss: 0.37420951008796693 steps without improvement: 2 best accuracy: 0.8591
[SYST] Epoch 97


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 98, Loss: 0.3698559023439884 steps without improvement: 0 best accuracy: 0.8602
[SYST] Epoch 98


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 99, Loss: 0.3704374799132347 steps without improvement: 1 best accuracy: 0.8602
[SYST] Epoch 99


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 100, Loss: 0.36702866956591607 steps without improvement: 0 best accuracy: 0.8614
[SYST] Epoch 100


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 101, Loss: 0.3663429282605648 steps without improvement: 1 best accuracy: 0.8614
[SYST] Epoch 101


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 102, Loss: 0.36442750319838524 steps without improvement: 2 best accuracy: 0.8614
[SYST] Epoch 102


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 103, Loss: 0.364251174479723 steps without improvement: 0 best accuracy: 0.862
[SYST] Epoch 103


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 104, Loss: 0.36318149119615556 steps without improvement: 0 best accuracy: 0.8651
[SYST] Epoch 104


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 105, Loss: 0.3633081096410751 steps without improvement: 1 best accuracy: 0.8651
[SYST] Epoch 105


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 106, Loss: 0.3578918635845184 steps without improvement: 0 best accuracy: 0.8661
[SYST] Epoch 106


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 107, Loss: 0.35634149581193925 steps without improvement: 0 best accuracy: 0.8676
[SYST] Epoch 107


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 108, Loss: 0.3579028564691544 steps without improvement: 1 best accuracy: 0.8676
[SYST] Epoch 108


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 109, Loss: 0.3544545412063599 steps without improvement: 2 best accuracy: 0.8676
[SYST] Epoch 109


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 110, Loss: 0.35489697054028513 steps without improvement: 3 best accuracy: 0.8676
[SYST] Epoch 110


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Test Accuracy: 86.60%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}]


100%|█████████████████████████████████████████████| 1048576/1048576 [00:12<00:00, 85412.22it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 86101.12it/s]
100%|██████████████████████████████████████████████████████| 1024/1024 [01:24<00:00, 12.09it/s]


Epoch 1, Loss: 0.5134716425818624 steps without improvement: 0 best accuracy: 0.9346


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.82it/s]


Epoch 2, Loss: 0.09746356774485321 steps without improvement: 17 best accuracy: 0.9873


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.78it/s]


Epoch 3, Loss: 0.04095428697473835 steps without improvement: 108 best accuracy: 0.9919


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.88it/s]


Epoch 4, Loss: 0.02679423983590823 steps without improvement: 90 best accuracy: 0.9939


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.87it/s]


Epoch 5, Loss: 0.01994893678738663 steps without improvement: 1 best accuracy: 0.9954


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.86it/s]


Epoch 6, Loss: 0.015772420925259212 steps without improvement: 267 best accuracy: 0.9965


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.82it/s]


Epoch 7, Loss: 0.01282383801094511 steps without improvement: 303 best accuracy: 0.9975


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.79it/s]


Epoch 8, Loss: 0.010766439757844637 steps without improvement: 353 best accuracy: 0.9981


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.81it/s]


Epoch 9, Loss: 0.009400518181791995 steps without improvement: 263 best accuracy: 0.9987


100%|██████████████████████████████████████████████████████| 1024/1024 [01:27<00:00, 11.75it/s]


Epoch 10, Loss: 0.008212724772192814 steps without improvement: 448 best accuracy: 0.9988


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.80it/s]


Epoch 11, Loss: 0.007249159295724894 steps without improvement: 112 best accuracy: 0.999


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.82it/s]


Epoch 12, Loss: 0.006303120372990634 steps without improvement: 186 best accuracy: 0.9993


100%|██████████████████████████████████████████████████████| 1024/1024 [01:26<00:00, 11.77it/s]


Epoch 13, Loss: 0.005650277724953412 steps without improvement: 204 best accuracy: 0.9995


 80%|████████████████████████████████████████████           | 820/1024 [01:09<00:17, 11.78it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 85052.32it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 157.70it/s]


Test Accuracy: 0.9985
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11807.24it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12710.99it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12721.47it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:16<00:00, 78680.68it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 107262.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 109139.98it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 1, Loss: 34.048571014404295 steps without improvement: 0 best accuracy: 0.5465
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 2, Loss: 13.052219934463501 steps without improvement: 0 best accuracy: 0.5513
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 3, Loss: 10.088255567550659 steps without improvement: 0 best accuracy: 0.559
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 4, Loss: 8.39171644449234 steps without improvement: 0 best accuracy: 0.576
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 5, Loss: 6.992666034698487 steps without improvement: 0 best accuracy: 0.6063
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 6, Loss: 5.88549427986145 steps without improvement: 0 best accuracy: 0.6156
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 7, Loss: 5.1397606468200685 steps without improvement: 0 best accuracy: 0.629
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 8, Loss: 4.546437833309174 steps without improvement: 0 best accuracy: 0.6424
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 9, Loss: 4.074215487241745 steps without improvement: 0 best accuracy: 0.6628
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 10, Loss: 3.758054082393646 steps without improvement: 0 best accuracy: 0.6721
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 11, Loss: 3.558110570907593 steps without improvement: 0 best accuracy: 0.6815
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 12, Loss: 3.424546525478363 steps without improvement: 0 best accuracy: 0.6904
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 13, Loss: 3.3037332487106323 steps without improvement: 0 best accuracy: 0.6964
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 14, Loss: 3.2099084627628325 steps without improvement: 0 best accuracy: 0.7008
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 15, Loss: 3.1341269505023956 steps without improvement: 0 best accuracy: 0.7064
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 16, Loss: 3.0586815595626833 steps without improvement: 1 best accuracy: 0.7064
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 17, Loss: 2.987676694393158 steps without improvement: 2 best accuracy: 0.7064
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 18, Loss: 2.9183595824241637 steps without improvement: 0 best accuracy: 0.713
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 19, Loss: 2.8526336550712585 steps without improvement: 0 best accuracy: 0.7152
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 20, Loss: 2.7877654695510863 steps without improvement: 1 best accuracy: 0.7152
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 21, Loss: 2.7068722999095916 steps without improvement: 0 best accuracy: 0.7181
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 22, Loss: 2.600052734613419 steps without improvement: 0 best accuracy: 0.7268
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 23, Loss: 2.4951525151729586 steps without improvement: 1 best accuracy: 0.7268
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 24, Loss: 2.4152973353862763 steps without improvement: 2 best accuracy: 0.7268
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 25, Loss: 2.339292823076248 steps without improvement: 0 best accuracy: 0.7279
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 26, Loss: 2.285477684736252 steps without improvement: 1 best accuracy: 0.7279
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 27, Loss: 2.2383476704359055 steps without improvement: 0 best accuracy: 0.7318
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 28, Loss: 2.195817431807518 steps without improvement: 1 best accuracy: 0.7318
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 29, Loss: 2.1574904614686967 steps without improvement: 2 best accuracy: 0.7318
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 30, Loss: 2.1073434227705 steps without improvement: 0 best accuracy: 0.7386
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 31, Loss: 2.070998234152794 steps without improvement: 0 best accuracy: 0.7442
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 32, Loss: 2.0254351061582567 steps without improvement: 1 best accuracy: 0.7442
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 33, Loss: 1.9972797518968581 steps without improvement: 0 best accuracy: 0.7475
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 34, Loss: 1.9633323848247528 steps without improvement: 1 best accuracy: 0.7475
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 35, Loss: 1.929525253176689 steps without improvement: 0 best accuracy: 0.7544
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 36, Loss: 1.8955665427446364 steps without improvement: 0 best accuracy: 0.755
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 37, Loss: 1.8788421750068665 steps without improvement: 0 best accuracy: 0.7586
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 38, Loss: 1.8520905804634094 steps without improvement: 1 best accuracy: 0.7586
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 39, Loss: 1.8371822744607926 steps without improvement: 0 best accuracy: 0.7627
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 40, Loss: 1.8115599763393402 steps without improvement: 0 best accuracy: 0.7662
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 41, Loss: 1.7961352062225342 steps without improvement: 1 best accuracy: 0.7662
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 42, Loss: 1.7789334762096405 steps without improvement: 2 best accuracy: 0.7662
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 43, Loss: 1.7621212881803512 steps without improvement: 0 best accuracy: 0.7664
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 44, Loss: 1.7498533529043199 steps without improvement: 0 best accuracy: 0.7685
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 45, Loss: 1.7381270349025726 steps without improvement: 0 best accuracy: 0.7697
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 46, Loss: 1.7225126349925994 steps without improvement: 1 best accuracy: 0.7697
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 47, Loss: 1.713992057442665 steps without improvement: 0 best accuracy: 0.771
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 48, Loss: 1.7113879376649856 steps without improvement: 0 best accuracy: 0.7731
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 49, Loss: 1.7010033267736435 steps without improvement: 0 best accuracy: 0.7755
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 50, Loss: 1.6846796923875809 steps without improvement: 1 best accuracy: 0.7755
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 51, Loss: 1.6770216047763824 steps without improvement: 2 best accuracy: 0.7755
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 52, Loss: 1.6674025630950928 steps without improvement: 3 best accuracy: 0.7755
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Test Accuracy: 76.83%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}, {'accuracy': 0.9985, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.7683}}]
Layer1 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11879.02it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12567.45it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12595.65it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 83541.04it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 115664.42it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 113171.15it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 1, Loss: 41.61353686332703 steps without improvement: 0 best accuracy: 0.5325
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 2, Loss: 14.761735496520997 steps without improvement: 0 best accuracy: 0.5346
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 3, Loss: 11.889407873153687 steps without improvement: 1 best accuracy: 0.5346
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 4, Loss: 10.139848127365113 steps without improvement: 0 best accuracy: 0.5443
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 5, Loss: 8.999971914291383 steps without improvement: 1 best accuracy: 0.5443
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 6, Loss: 8.442830998897552 steps without improvement: 0 best accuracy: 0.5506
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 7, Loss: 8.055618598461152 steps without improvement: 0 best accuracy: 0.5511
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 8, Loss: 7.723621845245361 steps without improvement: 0 best accuracy: 0.5536
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 9, Loss: 7.428525340557099 steps without improvement: 0 best accuracy: 0.5575
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 10, Loss: 7.135035812854767 steps without improvement: 0 best accuracy: 0.5599
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 11, Loss: 6.909315755367279 steps without improvement: 0 best accuracy: 0.5625
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 12, Loss: 6.752904868125915 steps without improvement: 0 best accuracy: 0.5643
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 13, Loss: 6.623373186588287 steps without improvement: 0 best accuracy: 0.573
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 14, Loss: 6.53174777507782 steps without improvement: 0 best accuracy: 0.5739
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 15, Loss: 6.447276906967163 steps without improvement: 1 best accuracy: 0.5739
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 16, Loss: 6.360257868766785 steps without improvement: 0 best accuracy: 0.5773
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 17, Loss: 6.291934275627137 steps without improvement: 0 best accuracy: 0.5803
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 18, Loss: 6.224054853916169 steps without improvement: 1 best accuracy: 0.5803
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 19, Loss: 6.15721658706665 steps without improvement: 2 best accuracy: 0.5803
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 20, Loss: 6.107812960147857 steps without improvement: 3 best accuracy: 0.5803
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 21, Loss: 6.056133801937103 steps without improvement: 0 best accuracy: 0.5823
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 22, Loss: 6.001534147262573 steps without improvement: 1 best accuracy: 0.5823
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 23, Loss: 5.94955438375473 steps without improvement: 2 best accuracy: 0.5823
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 24, Loss: 5.905235316753387 steps without improvement: 0 best accuracy: 0.5832
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 25, Loss: 5.846099350452423 steps without improvement: 1 best accuracy: 0.5832
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 26, Loss: 5.798363733291626 steps without improvement: 2 best accuracy: 0.5832
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 27, Loss: 5.728484950065613 steps without improvement: 3 best accuracy: 0.5832
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Test Accuracy: 60.09%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}, {'accuracy': 0.9985, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.7683, '[[0, 1], [2, 3]]': 0.6009}}]
Layer1 : [

100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11806.81it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12609.39it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12624.38it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:14<00:00, 85335.11it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116681.85it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 120628.58it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 1, Loss: 17.156528191566466 steps without improvement: 0 best accuracy: 0.5417
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 2, Loss: 10.348644466400147 steps without improvement: 1 best accuracy: 0.5417
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 3, Loss: 9.415816788673402 steps without improvement: 0 best accuracy: 0.5543
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 4, Loss: 8.82082184791565 steps without improvement: 0 best accuracy: 0.5606
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 5, Loss: 8.408085975646973 steps without improvement: 0 best accuracy: 0.5611
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 6, Loss: 8.181379570960999 steps without improvement: 0 best accuracy: 0.5661
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 7, Loss: 8.019983930587768 steps without improvement: 0 best accuracy: 0.5664
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 8, Loss: 7.860868961811065 steps without improvement: 1 best accuracy: 0.5664
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 9, Loss: 7.646889238357544 steps without improvement: 0 best accuracy: 0.5708
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 10, Loss: 7.404434113502503 steps without improvement: 1 best accuracy: 0.5708
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 11, Loss: 7.191790428161621 steps without improvement: 2 best accuracy: 0.5708
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 12, Loss: 6.940619306564331 steps without improvement: 3 best accuracy: 0.5708
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Test Accuracy: 56.70%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}, {'accuracy': 0.9985, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.7683, '[[0, 1], [2, 3]]': 0.6009, '[[0], [1]]'

100%|█████████████████████████████████████████████| 1280000/1280000 [01:49<00:00, 11739.28it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12679.70it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12682.73it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:16<00:00, 78027.08it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 106956.90it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 107753.75it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 1, Loss: 26.42193682670593 steps without improvement: 0 best accuracy: 0.6964
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 2, Loss: 5.928781254291534 steps without improvement: 0 best accuracy: 0.7423
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 3, Loss: 3.1050945746898653 steps without improvement: 0 best accuracy: 0.7852
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 4, Loss: 2.0290575724840165 steps without improvement: 0 best accuracy: 0.8001
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 5, Loss: 1.6388435101509093 steps without improvement: 0 best accuracy: 0.8079
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 6, Loss: 1.382291295528412 steps without improvement: 0 best accuracy: 0.8275
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 7, Loss: 1.1650711762905122 steps without improvement: 0 best accuracy: 0.8381
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 8, Loss: 0.9155691900849342 steps without improvement: 0 best accuracy: 0.8453
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 9, Loss: 0.713698410987854 steps without improvement: 0 best accuracy: 0.859
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 10, Loss: 0.6171159902215004 steps without improvement: 0 best accuracy: 0.8727
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 11, Loss: 0.5599820446968079 steps without improvement: 0 best accuracy: 0.8796
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.21it/s]


Epoch 12, Loss: 0.5167499147355556 steps without improvement: 1 best accuracy: 0.8796
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 13, Loss: 0.4801804147660732 steps without improvement: 0 best accuracy: 0.8876
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 14, Loss: 0.44880261823534967 steps without improvement: 1 best accuracy: 0.8876
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 15, Loss: 0.4218117713928223 steps without improvement: 0 best accuracy: 0.8967
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 16, Loss: 0.3962004478275776 steps without improvement: 0 best accuracy: 0.9022
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 17, Loss: 0.3710318933427334 steps without improvement: 0 best accuracy: 0.9083
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 18, Loss: 0.34769850194454194 steps without improvement: 0 best accuracy: 0.9136
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 19, Loss: 0.32841048911213877 steps without improvement: 0 best accuracy: 0.9206
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 20, Loss: 0.3138590832054615 steps without improvement: 0 best accuracy: 0.9218
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 21, Loss: 0.3015876211225986 steps without improvement: 1 best accuracy: 0.9218
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 22, Loss: 0.2933883212506771 steps without improvement: 0 best accuracy: 0.926
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 23, Loss: 0.2818589233607054 steps without improvement: 0 best accuracy: 0.9282
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.47it/s]


Epoch 24, Loss: 0.2730857767909765 steps without improvement: 0 best accuracy: 0.93
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 25, Loss: 0.26599849969148637 steps without improvement: 0 best accuracy: 0.9308
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 26, Loss: 0.25948980674147604 steps without improvement: 0 best accuracy: 0.9337
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.27it/s]


Epoch 27, Loss: 0.2529518723487854 steps without improvement: 0 best accuracy: 0.9338
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 28, Loss: 0.24655480206012725 steps without improvement: 0 best accuracy: 0.9373
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 29, Loss: 0.24142354764044285 steps without improvement: 1 best accuracy: 0.9373
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 30, Loss: 0.23836318656802177 steps without improvement: 0 best accuracy: 0.9412
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 31, Loss: 0.23249421268701553 steps without improvement: 0 best accuracy: 0.9431
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 32, Loss: 0.22770489819347858 steps without improvement: 1 best accuracy: 0.9431
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 33, Loss: 0.22454676836729048 steps without improvement: 0 best accuracy: 0.945
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 34, Loss: 0.22193064503371715 steps without improvement: 0 best accuracy: 0.9464
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 35, Loss: 0.21663785338401795 steps without improvement: 1 best accuracy: 0.9464
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 36, Loss: 0.21339217111468314 steps without improvement: 0 best accuracy: 0.9467
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 37, Loss: 0.20831999719142913 steps without improvement: 0 best accuracy: 0.9471
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 38, Loss: 0.2046654858440161 steps without improvement: 0 best accuracy: 0.9478
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 39, Loss: 0.20311952665448188 steps without improvement: 0 best accuracy: 0.9501
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 40, Loss: 0.2042158731818199 steps without improvement: 0 best accuracy: 0.9518
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 41, Loss: 0.19719249114394188 steps without improvement: 1 best accuracy: 0.9518
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 42, Loss: 0.1924776778370142 steps without improvement: 2 best accuracy: 0.9518
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 43, Loss: 0.19328826643526553 steps without improvement: 3 best accuracy: 0.9518
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Test Accuracy: 95.28%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}, {'accuracy': 0.9985, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.7683, '[[0, 1], [2, 3]]': 0.6009, '[[0], [1]]'

100%|█████████████████████████████████████████████| 1280000/1280000 [01:48<00:00, 11798.51it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12618.10it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12597.78it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 82031.15it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 114310.82it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 117329.75it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 1, Loss: 36.08736524581909 steps without improvement: 0 best accuracy: 0.5354
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 2, Loss: 10.054598274230957 steps without improvement: 0 best accuracy: 0.5506
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 3, Loss: 7.582532353401184 steps without improvement: 0 best accuracy: 0.5579
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 4, Loss: 6.522174897193909 steps without improvement: 0 best accuracy: 0.5661
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 5, Loss: 5.655451447963714 steps without improvement: 0 best accuracy: 0.5891
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 6, Loss: 4.697820086479187 steps without improvement: 0 best accuracy: 0.6102
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.48it/s]


Epoch 7, Loss: 4.18804486989975 steps without improvement: 0 best accuracy: 0.6159
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 8, Loss: 3.836064028739929 steps without improvement: 0 best accuracy: 0.6213
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 9, Loss: 3.5480710244178773 steps without improvement: 0 best accuracy: 0.624
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 10, Loss: 3.298022096157074 steps without improvement: 0 best accuracy: 0.6333
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 11, Loss: 3.0875199222564698 steps without improvement: 0 best accuracy: 0.6407
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 12, Loss: 2.903356034755707 steps without improvement: 0 best accuracy: 0.6488
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 13, Loss: 2.7359333860874178 steps without improvement: 0 best accuracy: 0.6519
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 14, Loss: 2.5923543417453767 steps without improvement: 0 best accuracy: 0.6604
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 15, Loss: 2.4609525489807127 steps without improvement: 0 best accuracy: 0.6648
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 16, Loss: 2.340984466075897 steps without improvement: 0 best accuracy: 0.6724
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 17, Loss: 2.2401280403137207 steps without improvement: 1 best accuracy: 0.6724
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 18, Loss: 2.154554923772812 steps without improvement: 0 best accuracy: 0.6798
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 19, Loss: 2.070416720509529 steps without improvement: 0 best accuracy: 0.6819
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 20, Loss: 1.9820966774225235 steps without improvement: 0 best accuracy: 0.6901
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 21, Loss: 1.8897535550594329 steps without improvement: 0 best accuracy: 0.6944
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 22, Loss: 1.8075277191400527 steps without improvement: 0 best accuracy: 0.7003
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 23, Loss: 1.7082422375679016 steps without improvement: 0 best accuracy: 0.7006
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 24, Loss: 1.6013772082328797 steps without improvement: 0 best accuracy: 0.7057
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 25, Loss: 1.4840471357107163 steps without improvement: 0 best accuracy: 0.7078
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 26, Loss: 1.3710725116729736 steps without improvement: 0 best accuracy: 0.7172
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 27, Loss: 1.271725941300392 steps without improvement: 1 best accuracy: 0.7172
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 28, Loss: 1.1804985642433166 steps without improvement: 2 best accuracy: 0.7172
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 29, Loss: 1.0919051867723466 steps without improvement: 3 best accuracy: 0.7172
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Test Accuracy: 71.26%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}, {'accuracy': 0.9985, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.7683, '[[0, 1], [2, 3]]': 0.6009, '[[0], [1]]'

100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11867.56it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12668.41it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12594.66it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 83534.32it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 114790.10it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116485.15it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 1, Loss: 42.302337141036986 steps without improvement: 0 best accuracy: 0.5499
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Epoch 2, Loss: 10.713924942016602 steps without improvement: 0 best accuracy: 0.5974
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 3, Loss: 8.315057187080383 steps without improvement: 0 best accuracy: 0.6255
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.49it/s]


Epoch 4, Loss: 6.914696638584137 steps without improvement: 0 best accuracy: 0.6544
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 5, Loss: 5.710236711502075 steps without improvement: 0 best accuracy: 0.6741
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 6, Loss: 5.0921093845367436 steps without improvement: 0 best accuracy: 0.6857
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 7, Loss: 4.489031785726548 steps without improvement: 0 best accuracy: 0.7006
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 8, Loss: 3.936547954082489 steps without improvement: 0 best accuracy: 0.7117
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 9, Loss: 3.541111458539963 steps without improvement: 0 best accuracy: 0.7197
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 10, Loss: 3.246916835308075 steps without improvement: 0 best accuracy: 0.7299
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 11, Loss: 3.035414469242096 steps without improvement: 0 best accuracy: 0.7358
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 12, Loss: 2.8680887949466705 steps without improvement: 0 best accuracy: 0.7408
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 13, Loss: 2.72073212146759 steps without improvement: 0 best accuracy: 0.7468
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 14, Loss: 2.574586482048035 steps without improvement: 0 best accuracy: 0.7524
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 15, Loss: 2.4090940380096435 steps without improvement: 0 best accuracy: 0.757
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 16, Loss: 2.23340174973011 steps without improvement: 0 best accuracy: 0.7684
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 17, Loss: 2.0909963619709013 steps without improvement: 0 best accuracy: 0.7707
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 18, Loss: 1.9580421489477158 steps without improvement: 0 best accuracy: 0.7751
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 19, Loss: 1.8334010314941407 steps without improvement: 0 best accuracy: 0.7787
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 20, Loss: 1.7101609194278717 steps without improvement: 0 best accuracy: 0.7821
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 21, Loss: 1.5947799897193908 steps without improvement: 0 best accuracy: 0.7829
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 22, Loss: 1.494277372956276 steps without improvement: 0 best accuracy: 0.7861
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 23, Loss: 1.397878075838089 steps without improvement: 0 best accuracy: 0.7928
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.54it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 24, Loss: 1.3158679521083831 steps without improvement: 0 best accuracy: 0.8021
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 25, Loss: 1.199061712026596 steps without improvement: 0 best accuracy: 0.807
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 26, Loss: 1.0445450681447983 steps without improvement: 1 best accuracy: 0.807
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 27, Loss: 0.9100255608558655 steps without improvement: 0 best accuracy: 0.8112
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.45it/s]


Epoch 28, Loss: 0.8164662650227547 steps without improvement: 1 best accuracy: 0.8112
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.46it/s]


Epoch 29, Loss: 0.7408530268073082 steps without improvement: 2 best accuracy: 0.8112
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 30, Loss: 0.6959863874316216 steps without improvement: 3 best accuracy: 0.8112
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:35<00:00,  5.58it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.44it/s]


Test Accuracy: 80.69%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}, {'accuracy': 0.9985, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.7683, '[[0, 1], [2, 3]]': 0.6009, '[[0], [1]]'

100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11909.16it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12647.29it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12671.51it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:18<00:00, 69595.99it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 103290.43it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 106917.64it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 1, Loss: 15.103561372756959 steps without improvement: 0 best accuracy: 0.7108
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 2, Loss: 4.076953428983688 steps without improvement: 0 best accuracy: 0.7862
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 3, Loss: 1.8077514493465423 steps without improvement: 0 best accuracy: 0.8388
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 4, Loss: 1.0860080188512802 steps without improvement: 0 best accuracy: 0.8617
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 5, Loss: 0.7751253682374954 steps without improvement: 0 best accuracy: 0.8839
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 6, Loss: 0.6116272713243961 steps without improvement: 0 best accuracy: 0.8944
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 7, Loss: 0.5049623276293278 steps without improvement: 0 best accuracy: 0.9148
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 8, Loss: 0.43550309881567956 steps without improvement: 0 best accuracy: 0.922
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 9, Loss: 0.3856864510476589 steps without improvement: 0 best accuracy: 0.9297
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 10, Loss: 0.34156881988048554 steps without improvement: 0 best accuracy: 0.9374
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 11, Loss: 0.3023378100246191 steps without improvement: 0 best accuracy: 0.9442
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 12, Loss: 0.2744199828803539 steps without improvement: 0 best accuracy: 0.9476
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 13, Loss: 0.24976405687630177 steps without improvement: 0 best accuracy: 0.9544
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 14, Loss: 0.22696193598210812 steps without improvement: 0 best accuracy: 0.957
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 15, Loss: 0.20693325847387314 steps without improvement: 0 best accuracy: 0.962
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 16, Loss: 0.18854544259607792 steps without improvement: 0 best accuracy: 0.9645
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 17, Loss: 0.17319762736558914 steps without improvement: 0 best accuracy: 0.9684
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 18, Loss: 0.15782999858260155 steps without improvement: 0 best accuracy: 0.9716
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 19, Loss: 0.14432937271893023 steps without improvement: 0 best accuracy: 0.9732
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 20, Loss: 0.13377612259238958 steps without improvement: 0 best accuracy: 0.9746
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 21, Loss: 0.12437501307576895 steps without improvement: 1 best accuracy: 0.9746
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 22, Loss: 0.11648575901985168 steps without improvement: 0 best accuracy: 0.9775
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 23, Loss: 0.11021889194846153 steps without improvement: 0 best accuracy: 0.9777
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 24, Loss: 0.10491080708801746 steps without improvement: 0 best accuracy: 0.9801
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 25, Loss: 0.09947596274316312 steps without improvement: 0 best accuracy: 0.9807
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 26, Loss: 0.0954310604557395 steps without improvement: 0 best accuracy: 0.9817
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 27, Loss: 0.09021618012338876 steps without improvement: 1 best accuracy: 0.9817
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 28, Loss: 0.0866404414921999 steps without improvement: 0 best accuracy: 0.9823
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 29, Loss: 0.08313882255926729 steps without improvement: 0 best accuracy: 0.9835
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 30, Loss: 0.07924082919955254 steps without improvement: 0 best accuracy: 0.9841
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 31, Loss: 0.07631766855716705 steps without improvement: 0 best accuracy: 0.9842
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 32, Loss: 0.07387559697031974 steps without improvement: 0 best accuracy: 0.9844
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.42it/s]


Epoch 33, Loss: 0.0694170985929668 steps without improvement: 0 best accuracy: 0.9851
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.25it/s]


Epoch 34, Loss: 0.0669224021397531 steps without improvement: 0 best accuracy: 0.986
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 35, Loss: 0.06510184198617935 steps without improvement: 0 best accuracy: 0.9869
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 36, Loss: 0.06292544052004814 steps without improvement: 1 best accuracy: 0.9869
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:41<00:00,  4.81it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  6.83it/s]


Epoch 37, Loss: 0.06087204040959478 steps without improvement: 0 best accuracy: 0.9878
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:41<00:00,  4.85it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  6.77it/s]


Epoch 38, Loss: 0.059578836672008036 steps without improvement: 1 best accuracy: 0.9878
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:41<00:00,  4.80it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.78it/s]


Epoch 39, Loss: 0.05787231355905533 steps without improvement: 2 best accuracy: 0.9878
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:41<00:00,  4.86it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.87it/s]


Epoch 40, Loss: 0.056522603817284106 steps without improvement: 3 best accuracy: 0.9878
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:41<00:00,  4.79it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  6.57it/s]


Epoch 41, Loss: 0.05515900760889053 steps without improvement: 0 best accuracy: 0.9888
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:41<00:00,  4.85it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  6.46it/s]


Epoch 42, Loss: 0.05351766612380743 steps without improvement: 1 best accuracy: 0.9888
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:37<00:00,  5.40it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 43, Loss: 0.05262146370485425 steps without improvement: 2 best accuracy: 0.9888
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.42it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 44, Loss: 0.051407175371423364 steps without improvement: 3 best accuracy: 0.9888
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Test Accuracy: 98.99%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}, {'accuracy': 0.9985, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.7683, '[[0, 1], [2, 3]]': 0.6009, '[[0], [1]]'

100%|█████████████████████████████████████████████| 1280000/1280000 [01:46<00:00, 12032.95it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12621.14it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12764.94it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:17<00:00, 72287.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 114890.40it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 114339.18it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 1, Loss: 9.120717632770539 steps without improvement: 0 best accuracy: 0.5896
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.26it/s]


Epoch 2, Loss: 4.795813258886337 steps without improvement: 0 best accuracy: 0.6389
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:37<00:00,  5.37it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 3, Loss: 3.256204458475113 steps without improvement: 0 best accuracy: 0.6688
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 4, Loss: 2.5520870089530945 steps without improvement: 0 best accuracy: 0.6983
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 5, Loss: 2.168544537425041 steps without improvement: 0 best accuracy: 0.7141
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 6, Loss: 1.9216150617599488 steps without improvement: 0 best accuracy: 0.7238
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 7, Loss: 1.6903567159175872 steps without improvement: 0 best accuracy: 0.7449
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 8, Loss: 1.5317600482702256 steps without improvement: 0 best accuracy: 0.7643
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 9, Loss: 1.4013791489601135 steps without improvement: 0 best accuracy: 0.7793
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 10, Loss: 1.3070383816957474 steps without improvement: 0 best accuracy: 0.7817
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 11, Loss: 1.2243500769138336 steps without improvement: 0 best accuracy: 0.7993
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 12, Loss: 1.1533656018972396 steps without improvement: 1 best accuracy: 0.7993
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.22it/s]


Epoch 13, Loss: 1.0905030056834222 steps without improvement: 0 best accuracy: 0.8095
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 14, Loss: 1.042635824084282 steps without improvement: 0 best accuracy: 0.8151
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.23it/s]


Epoch 15, Loss: 0.9943119007349014 steps without improvement: 0 best accuracy: 0.8273
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.41it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 16, Loss: 0.9481658858060836 steps without improvement: 0 best accuracy: 0.8308
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:37<00:00,  5.28it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 17, Loss: 0.9012995210289955 steps without improvement: 0 best accuracy: 0.8376
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 18, Loss: 0.8623256322741508 steps without improvement: 0 best accuracy: 0.8461
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 19, Loss: 0.8204048725962639 steps without improvement: 0 best accuracy: 0.8528
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:39<00:00,  5.08it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.36it/s]


Epoch 20, Loss: 0.7767556536197663 steps without improvement: 0 best accuracy: 0.8636
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:37<00:00,  5.36it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.19it/s]


Epoch 21, Loss: 0.7274638429284096 steps without improvement: 0 best accuracy: 0.8718
[SYST] Epoch 21


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 22, Loss: 0.6760683891177177 steps without improvement: 0 best accuracy: 0.8805
[SYST] Epoch 22


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.42it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.21it/s]


Epoch 23, Loss: 0.6169230413436889 steps without improvement: 0 best accuracy: 0.8897
[SYST] Epoch 23


100%|████████████████████████████████████████████████████████| 200/200 [00:37<00:00,  5.39it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 24, Loss: 0.5586085239052773 steps without improvement: 0 best accuracy: 0.8977
[SYST] Epoch 24


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 25, Loss: 0.5125078399479389 steps without improvement: 0 best accuracy: 0.902
[SYST] Epoch 25


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.43it/s]


Epoch 26, Loss: 0.48123338997364046 steps without improvement: 0 best accuracy: 0.9081
[SYST] Epoch 26


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 27, Loss: 0.4571393908560276 steps without improvement: 0 best accuracy: 0.9124
[SYST] Epoch 27


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 28, Loss: 0.4375085496902466 steps without improvement: 0 best accuracy: 0.9143
[SYST] Epoch 28


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 29, Loss: 0.41434128761291505 steps without improvement: 0 best accuracy: 0.9192
[SYST] Epoch 29


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.16it/s]


Epoch 30, Loss: 0.39839895457029345 steps without improvement: 0 best accuracy: 0.9224
[SYST] Epoch 30


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 31, Loss: 0.3831017880141735 steps without improvement: 0 best accuracy: 0.9268
[SYST] Epoch 31


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 32, Loss: 0.36726680397987366 steps without improvement: 0 best accuracy: 0.9307
[SYST] Epoch 32


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 33, Loss: 0.35252916902303694 steps without improvement: 0 best accuracy: 0.9332
[SYST] Epoch 33


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 34, Loss: 0.3400278753042221 steps without improvement: 0 best accuracy: 0.9333
[SYST] Epoch 34


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 35, Loss: 0.32769030541181565 steps without improvement: 0 best accuracy: 0.9379
[SYST] Epoch 35


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 36, Loss: 0.31727417588233947 steps without improvement: 0 best accuracy: 0.9412
[SYST] Epoch 36


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 37, Loss: 0.3074116979539394 steps without improvement: 0 best accuracy: 0.9416
[SYST] Epoch 37


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 38, Loss: 0.29850070640444754 steps without improvement: 0 best accuracy: 0.9471
[SYST] Epoch 38


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 39, Loss: 0.29085775047540663 steps without improvement: 0 best accuracy: 0.9482
[SYST] Epoch 39


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 40, Loss: 0.27853516265749934 steps without improvement: 0 best accuracy: 0.9492
[SYST] Epoch 40


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.43it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 41, Loss: 0.2737384746968746 steps without improvement: 0 best accuracy: 0.9521
[SYST] Epoch 41


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 42, Loss: 0.2665297289937735 steps without improvement: 1 best accuracy: 0.9521
[SYST] Epoch 42


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 43, Loss: 0.2612511382251978 steps without improvement: 0 best accuracy: 0.9545
[SYST] Epoch 43


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 44, Loss: 0.2560065007209778 steps without improvement: 1 best accuracy: 0.9545
[SYST] Epoch 44


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.10it/s]


Epoch 45, Loss: 0.2514359937608242 steps without improvement: 0 best accuracy: 0.9565
[SYST] Epoch 45


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 46, Loss: 0.24487439841032027 steps without improvement: 0 best accuracy: 0.9573
[SYST] Epoch 46


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.41it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.24it/s]


Epoch 47, Loss: 0.2402686884254217 steps without improvement: 0 best accuracy: 0.9578
[SYST] Epoch 47


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.41it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 48, Loss: 0.2382304047048092 steps without improvement: 0 best accuracy: 0.959
[SYST] Epoch 48


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 49, Loss: 0.23331864684820175 steps without improvement: 1 best accuracy: 0.959
[SYST] Epoch 49


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 50, Loss: 0.23280499167740346 steps without improvement: 0 best accuracy: 0.9592
[SYST] Epoch 50


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.30it/s]


Epoch 51, Loss: 0.22737885035574437 steps without improvement: 1 best accuracy: 0.9592
[SYST] Epoch 51


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 52, Loss: 0.22417431868612767 steps without improvement: 0 best accuracy: 0.9611
[SYST] Epoch 52


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 53, Loss: 0.22410575896501542 steps without improvement: 1 best accuracy: 0.9611
[SYST] Epoch 53


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 54, Loss: 0.22079074412584304 steps without improvement: 0 best accuracy: 0.9618
[SYST] Epoch 54


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.23it/s]


Epoch 55, Loss: 0.21842203475534916 steps without improvement: 1 best accuracy: 0.9618
[SYST] Epoch 55


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.13it/s]


Epoch 56, Loss: 0.21525097727775575 steps without improvement: 2 best accuracy: 0.9618
[SYST] Epoch 56


100%|████████████████████████████████████████████████████████| 200/200 [00:37<00:00,  5.37it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 57, Loss: 0.21282766312360762 steps without improvement: 3 best accuracy: 0.9618
[SYST] Epoch 57


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Test Accuracy: 96.06%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9928, '[[0, 1], [2, 3]]': 0.9329, '[[0], [1]]': 0.6733}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9953, '[[0, 1], [2, 3]]': 0.7484, '[[0], [1]]': 0.9889}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9859, '[[0, 1], [2, 3]]': 0.6449, '[[0], [1]]': 0.6204}}, {'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9944, '[[0, 1], [2, 3]]': 0.9762, '[[0], [1]]': 0.9769}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9983, '[[0, 1], [2, 3]]': 0.9865, '[[0], [1]]': 0.9856}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.9957, '[[0, 1], [2, 3]]': 0.9909, '[[0], [1]]': 0.866}}, {'accuracy': 0.9985, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.7683, '[[0, 1], [2, 3]]': 0.6009, '[[0], [1]]'

100%|█████████████████████████████████████████████| 1280000/1280000 [01:47<00:00, 11880.07it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12680.52it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 12590.77it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:15<00:00, 80144.76it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116269.45it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 116383.66it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:37<00:00,  5.37it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 1, Loss: 11.41600730419159 steps without improvement: 0 best accuracy: 0.5905
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 2, Loss: 6.770573656558991 steps without improvement: 0 best accuracy: 0.623
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:37<00:00,  5.39it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.36it/s]


Epoch 3, Loss: 5.19965919971466 steps without improvement: 0 best accuracy: 0.7058
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 4, Loss: 3.3720372664928435 steps without improvement: 0 best accuracy: 0.7132
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.34it/s]


Epoch 5, Loss: 2.415735360980034 steps without improvement: 0 best accuracy: 0.7456
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 6, Loss: 1.8047742623090743 steps without improvement: 0 best accuracy: 0.7704
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.33it/s]


Epoch 7, Loss: 1.5037911874055863 steps without improvement: 0 best accuracy: 0.7906
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.21it/s]


Epoch 8, Loss: 1.31781230032444 steps without improvement: 0 best accuracy: 0.8008
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.48it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.12it/s]


Epoch 9, Loss: 1.1973138970136643 steps without improvement: 0 best accuracy: 0.8119
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.41it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 10, Loss: 1.1082057416439057 steps without improvement: 0 best accuracy: 0.8198
[SYST] Epoch 10


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.39it/s]


Epoch 11, Loss: 1.0483983811736106 steps without improvement: 0 best accuracy: 0.8293
[SYST] Epoch 11


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.35it/s]


Epoch 12, Loss: 0.9932701125741005 steps without improvement: 0 best accuracy: 0.8363
[SYST] Epoch 12


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.37it/s]


Epoch 13, Loss: 0.937934430539608 steps without improvement: 0 best accuracy: 0.8466
[SYST] Epoch 13


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.43it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.28it/s]


Epoch 14, Loss: 0.8954905784130096 steps without improvement: 0 best accuracy: 0.8492
[SYST] Epoch 14


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.45it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.15it/s]


Epoch 15, Loss: 0.8480690225958825 steps without improvement: 0 best accuracy: 0.8543
[SYST] Epoch 15


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.31it/s]


Epoch 16, Loss: 0.8099047708511352 steps without improvement: 0 best accuracy: 0.8621
[SYST] Epoch 16


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.29it/s]


Epoch 17, Loss: 0.7719102782011033 steps without improvement: 0 best accuracy: 0.8654
[SYST] Epoch 17


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.32it/s]


Epoch 18, Loss: 0.7295266619324684 steps without improvement: 0 best accuracy: 0.8675
[SYST] Epoch 18


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.51it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.40it/s]


Epoch 19, Loss: 0.6979507514834404 steps without improvement: 1 best accuracy: 0.8675
[SYST] Epoch 19


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.43it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.41it/s]


Epoch 20, Loss: 0.669073184132576 steps without improvement: 0 best accuracy: 0.8753
[SYST] Epoch 20


100%|████████████████████████████████████████████████████████| 200/200 [00:36<00:00,  5.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  7.38it/s]


Epoch 21, Loss: 0.6443591850996018 steps without improvement: 0 best accuracy: 0.8762
[SYST] Epoch 21


 63%|███████████████████████████████████▎                    | 126/200 [00:23<00:13,  5.37it/s]

In [None]:
import json
with open('results.json', 'w') as f:
    json.dump(results, f)
