In [1]:
#check if model stays the same
#reimplement data generation

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
import pickle
from tqdm import tqdm
import random
import numpy as np
import copy

DEVICE="cpu"


In [3]:
def set_seed(seed):
    # Set the seed for the random module
    random.seed(seed)
    
    # Set the seed for numpy
    np.random.seed(seed)
    
    # Set the seed for PyTorch (CPU)
    torch.manual_seed(seed)
    
    # Set the seed for PyTorch (GPU) if you are using CUDA
    if torch.cuda.is_available():
        torch.cuda.manual_seed(seed)
        torch.cuda.manual_seed_all(seed)  # For multi-GPU setups
    
    # Ensure deterministic behavior in PyTorch
    torch.backends.cudnn.deterministic = True  # This makes the computations deterministic
    torch.backends.cudnn.benchmark = False  # Disable auto-tuning for performance optimization
    
    # For reproducibility of other libraries like Python's `random`
    torch.random.manual_seed(seed)



In [4]:


class MLPBlock(nn.Module):
    def __init__(self, in_features=16, out_features=16, dropout_prob=0.0):
        super(MLPBlock, self).__init__()
        self.ff1 = nn.Linear(in_features, out_features)
        self.act = nn.ReLU()
        self.dropout = nn.Dropout(p=dropout_prob)

    def forward(self, x):
        x = self.ff1(x)
        x = self.act(x)
        x = self.dropout(x)
        return x

class MLPModel(nn.Module):
    def __init__(self, input_size=16, hidden_size=16, num_blocks=3, dropout_prob=0.0):
        super(MLPModel, self).__init__()
        self.dropout = nn.Dropout(p=dropout_prob)
        self.h = nn.ModuleList([MLPBlock(hidden_size, hidden_size, dropout_prob) for _ in range(num_blocks)])

    def forward(self, x):
        x = self.dropout(x)
        for layer in self.h:
            x = layer(x)
        return x

class MLPForClassification(nn.Module):
    def __init__(self, input_size=16, hidden_size=16, num_classes=2, num_blocks=3, dropout_prob=0.0):
        super(MLPForClassification, self).__init__()
        self.mlp = MLPModel(input_size, hidden_size, num_blocks, dropout_prob)
        self.score = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        x = self.mlp(x)
        x = self.score(x)
        return x



In [5]:
def randvec(n=50, lower=-0.5, upper=0.5):
    """
    Returns a random vector of length `n`. `w` is ignored.

    """
    return np.array([random.uniform(lower, upper) for i in range(n)])

def create_same_pair(embedding_size):
    vec=randvec(embedding_size)
    return vec,vec

def create_diff_pair(embedding_size):
    similar=True
    while similar:
        vec1=randvec(embedding_size)
        vec2=randvec(embedding_size)
        if not (vec1 == vec2).all():
            similar=False
    return vec1,vec2


def make_dataset_sample_model(embedding_size,variable1=False,variable2=False):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
        
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label

def make_model_dataset(size,embedding_size):
    model_inputs=[]
    labels=[]
    for _ in tqdm(range(size)):
        model_input,label=make_dataset_sample_model(embedding_size)
        model_inputs.append(model_input)
        labels.append(label)
    return torch.tensor(model_inputs, dtype=torch.float32).to(DEVICE),torch.tensor(labels, dtype=torch.float32).to(DEVICE)



def make_dataset_sample_variable_intervention(embedding_size,variable1=False,variable2=False):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
    source_first_pair=[(np.zeros(embedding_size),np.zeros(embedding_size)),(np.zeros(embedding_size),np.zeros(embedding_size))]
    if variable1:
        First_pair_same=random.choice([True,False])
        if First_pair_same:
            source_first_pair=create_same_pair(embedding_size)
        else:
            source_first_pair=create_diff_pair(embedding_size)
        if random.choice([True,False]):
            source_first_pair=[source_first_pair,create_same_pair(embedding_size)]
        else:
            source_first_pair=[source_first_pair,create_diff_pair(embedding_size)]
        
    
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)
    source_second_pair=[(np.zeros(embedding_size),np.zeros(embedding_size)),(np.zeros(embedding_size),np.zeros(embedding_size))]
    if variable2:
        Second_pair_same=random.choice([True,False])
        if Second_pair_same:
            source_second_pair=create_same_pair(embedding_size)
        else:
            source_second_pair=create_diff_pair(embedding_size)
        if random.choice([True,False]):
            source_second_pair=[create_same_pair(embedding_size),source_second_pair]
        else:
            source_second_pair=[create_diff_pair(embedding_size),source_second_pair]
    
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    source0=np.concatenate(source_first_pair, axis=None)
    source1=np.concatenate(source_second_pair, axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label,source0,source1

def make_intervention_dataset_variable_intervention_all(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        variable1,variable2=random.choice([(True,False),(False,True),(True,True)])
        base,label,source0,source1=make_dataset_sample_variable_intervention(embedding_size,variable1=variable1,variable2=variable2)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source0,source1], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[variable1,variable2]
        #print(intervention_data[-1])
    return intervention_data

def make_intervention_dataset_variable_intervention_first(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        base,label,source0,source1=make_dataset_sample_variable_intervention(embedding_size,variable1=True,variable2=False)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source0,source1], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[True,False]
        #print(intervention_data[-1])
    return intervention_data




def make_dataset_sample_first_input_intervention(embedding_size):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
    
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)


    source=[]
    First_pair_same=random.choice([True,False])
    if First_pair_same: #equal or not in first variable
        if random.choice([True,False]): #Same source pair
            source.append((First_pair[1],First_pair[1]))
        else: #Different source pair
            new_vec=randvec(embedding_size)
            while (new_vec == First_pair[1]).all():
                new_vec=randvec(embedding_size)
            source.append((First_pair[1],new_vec))
            
    else:
        new_vec1=randvec(embedding_size)
        while (new_vec1 == First_pair[1]).all():
            new_vec1=randvec(embedding_size)
        if random.choice([True,False]): #Same source pair
            source.append((new_vec1,new_vec1))
        else: #Different source pair
            new_vec2=randvec(embedding_size)
            while (new_vec2 == new_vec1).all():
                new_vec2=randvec(embedding_size)
            source.append((new_vec1,new_vec2))

    if random.choice([True,False]):
        source.append(create_same_pair(embedding_size))
    else:
        source.append(create_diff_pair(embedding_size))
    
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    source=np.concatenate(source, axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label,source
    


def make_intervention_dataset_first_input_intervention(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        base,label,source=make_dataset_sample_first_input_intervention(embedding_size)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[True]
    return intervention_data




In [6]:
def train_model(model,batch_size = 1024,epochs=3,early_stopping_threshold=1024):
    #Training
    X_train,y_train=make_model_dataset(1048576,4)
    X_eval,y_eval=make_model_dataset(10000,4)
    # Create DataLoader
    
    
    train_dataset = TensorDataset(X_train, y_train)
    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
    
    # Initialize model, loss function, and optimizer
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    
    # Train
    model.train()
    best_accuracy=-1
    no_improvement=0
    best_model=None
    early_stopping=False
    for epoch in range(epochs):
        total_loss = 0
        for X_batch, y_batch in tqdm(train_loader):
            optimizer.zero_grad()
            outputs = model(X_batch)
            loss = criterion(outputs, y_batch.squeeze().long())
            loss.backward()
            optimizer.step()
            total_loss += loss.item()
            eval_accuracy=eval_model(model,X_eval,y_eval,batch_size = 1024)
            if eval_accuracy>best_accuracy:
                best_accuracy=eval_accuracy
                no_improvement=0
                best_model = copy.deepcopy(model)
            elif no_improvement>=early_stopping_threshold:
                early_stopping=True
                break
            else:
                no_improvement+=1
            #print("ES",no_improvement,"AC",best_accuracy)
        if early_stopping:
            break
        print(f"Epoch {epoch+1}, Loss: {total_loss / len(train_loader)}","steps without improvement:",no_improvement,"best accuracy:",best_accuracy)
    return best_model

In [7]:
def eval_model(model,X_eval,y_eval,batch_size = 1024):
    #Testing:
    test_dataset = TensorDataset(X_eval, y_eval)
    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)
    
    
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for X_batch, y_batch in test_loader:
            outputs = model(X_batch)
            _, predicted = torch.max(outputs, 1)
            correct += (predicted == y_batch.squeeze()).sum().item()
            total += y_batch.size(0)
    accuracy = correct / total
    model.train()
    return accuracy

In [8]:
def test_model(model,batch_size = 1024):
    #Testing:
    X_test,y_test=make_model_dataset(10000,4)
    test_dataset = TensorDataset(X_test, y_test)
    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)
    
    
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for X_batch, y_batch in tqdm(test_loader):
            outputs = model(X_batch)
            _, predicted = torch.max(outputs, 1)
            correct += (predicted == y_batch.squeeze()).sum().item()
            total += y_batch.size(0)
    accuracy = correct / total
    print(f"Test Accuracy: {accuracy:.4f}")
    return accuracy

In [9]:
def make_model(epochs=3):
    model = MLPForClassification()
    model.to(DEVICE)
    model=train_model(model,epochs=epochs)
    accuracy=test_model(model)
    return model,accuracy

In [10]:
class RotateLayer(torch.nn.Module):
    """A learnable linear transformation initialized as an orthogonal matrix."""

    def __init__(self, n, init_orth=True):
        """
        Args:
            n (int): Dimension of the square transformation matrix.
            init_orth (bool): If True, initializes the matrix with an orthogonal weight.
        """
        super().__init__()
        weight = torch.empty(n, n)  # Create an empty n x n matrix
        
        # We don't need initialization if loading from a pretrained checkpoint.
        # You can explore different initialization strategies if necessary, but this isn't our focus.
        if init_orth:
            torch.nn.init.orthogonal_(weight)
        
        self.weight = torch.nn.Parameter(weight, requires_grad=True)  # Learnable weight matrix

    def forward(self, x):
        """Applies the rotation matrix to the input tensor."""
        return torch.matmul(x.to(self.weight.dtype), self.weight)
        

class Transformation_Function(nn.Module):
    """Encapsulates the rotation transformation as a PyTorch module."""

    def __init__(self, embed_dim=16):
        """
        Args:
            embed_dim (int): The embedding dimension (size of the transformation matrix).
        """
        super(Transformation_Function, self).__init__()
        
        rotate_layer = RotateLayer(embed_dim)  # Initialize the rotation layer
        # Ensure the transformation remains an orthogonal matrix
        self.rotate_layer = torch.nn.utils.parametrizations.orthogonal(rotate_layer)

    def forward(self, x):
        """Applies the orthogonal transformation to the input tensor."""
        return self.rotate_layer(x)


class InverseTransformation_Function(nn.Module):
    """Computes the inverse of the given transformation function (phi)."""

    def __init__(self, transformation_function: Transformation_Function):
        """
        Args:
            transformation_function (Transformation_Function): The forward transformation function.
        """
        super(InverseTransformation_Function, self).__init__()
        self.transformation_function = transformation_function  # Store reference to the transformation

    def forward(self, x):
        """Applies the inverse transformation by transposing the orthogonal weight matrix."""
        weight_T = self.transformation_function.rotate_layer.weight.T  # Use matrix transpose as inverse
        return torch.matmul(x.to(weight_T.dtype), weight_T)

class phi_class:
    def __init__(self, phi,phi_inv,criterion,optimizer):
        self.phi=phi
        self.phi_inv=phi_inv
        self.criterion=criterion
        self.optimizer=optimizer



In [11]:
class Distributed_Alignment_Search:

    
    def __init__(self, 
                 Model,
                 Model_Layer,
                 Train_Data_Raw,
                 Test_Data_Raw,
                 Eval_Data_Raw,
                 Hidden_Layer_Size,
                 Variable_Dimensions,
                 Transformation_Class,
                 Device):
        self.Model=Model
        self.Model_Layer=Model_Layer
        self.Hidden_Layer_Size=Hidden_Layer_Size
        self.Variable_Dimensions=Variable_Dimensions
        self.Num_Varibales=len(self.Variable_Dimensions)
        self.Transformation_Class=Transformation_Class
        self.Device=Device

        self.mode_info=None
        self.base_activations=None
        self.source_activations=None

        
        self.Train_Dataset,self.Train_Sample_Number=self.Prepare_Dataset(Train_Data_Raw)
        self.Test_Dataset,self.Test_Samples_Number=self.Prepare_Dataset(Test_Data_Raw)
        self.Eval_Dataset,self.Eval_Samples_Number=self.Prepare_Dataset(Eval_Data_Raw)

   
        self.Hook=self.register_intervention_hook(self.Model_Layer)
        

    def Prepare_Dataset(self,Raw_Dataset): 
        Clean_Dataset={}
        Clean_Dataset["base"]=[]
        Clean_Dataset["sources"]=[]
        for _ in range(self.Num_Varibales):
            Clean_Dataset["sources"].append([])
        Clean_Dataset["label"]=[]
        Clean_Dataset["intervention"]=[]

        #Actually adapted to the dataset I am using. Needs to be changed later:
        print("[SYST] Prepare Data")
        for ac_DP_pos in tqdm(range(len(Raw_Dataset))):
            #base input
            ac_DP=Raw_Dataset[ac_DP_pos]
            Clean_Dataset["base"].append(ac_DP["base"])

            #expected label after intervention
            Clean_Dataset["label"].append(ac_DP["label"])

            #source inputs
            for var_dim in range(ac_DP['sources'].shape[0]):
                Clean_Dataset["sources"][var_dim].append(ac_DP['sources'][var_dim])

            #intervention data
            Clean_Dataset["intervention"].append([])
            for Hidden_Dimension in range(self.Hidden_Layer_Size):
                dim_found=False
                for ac_dimensions_pos,ac_dimensions in enumerate(self.Variable_Dimensions):
                    if Hidden_Dimension in ac_dimensions:
                        dim_found=True
                        if ac_DP["intervention"][ac_dimensions_pos]:
                            Clean_Dataset["intervention"][-1].append(True)
                        else:
                            Clean_Dataset["intervention"][-1].append(False)
                        break
                if not dim_found:
                    Clean_Dataset["intervention"][-1].append(False)
            Raw_Dataset[ac_DP_pos]=None

        sample_number=len(Clean_Dataset["label"])
        Clean_Dataset["base"]=torch.stack(Clean_Dataset["base"]).to(self.Device)
        Clean_Dataset["label"]=torch.stack(Clean_Dataset["label"]).to(self.Device)
        for i in range(len(Clean_Dataset["sources"])):
            Clean_Dataset["sources"][i]=torch.stack(Clean_Dataset["sources"][i]).to(self.Device)
        Clean_Dataset["intervention"]=torch.tensor(Clean_Dataset["intervention"]).to(self.Device)
        return Clean_Dataset,sample_number
                        
        
    def register_intervention_hook(self, layer):
        def hook_fn(module, input, output):
            if self.mode_info[0] == "source":
                # Extract row indices (list)
                row_indices = self.mode_info[2]
                #print("SO",output)
                
                # Extract column indices (list)
                col_indices = self.Variable_Dimensions[self.mode_info[1]]
                #print("CI",col_indices)
                #print(self.source_activations.shape)
                #print("SB",self.source_activations)
                #print(output)
                
                # Get values from the transformation tensor
                transformed_values = self.Transformation_Class.phi(output.detach())[:, col_indices]
                #print("TV",transformed_values)
                
                # Assign these values to the corresponding positions in source_activations
                self.source_activations[torch.tensor(row_indices).unsqueeze(1), torch.tensor(col_indices).unsqueeze(0)] = transformed_values
                #print("SA",self.source_activations)
                #print("***")
            elif self.mode_info[0] == "intervene":
                result_tensor = self.Transformation_Class.phi(output.detach())
                #print("II",self.mode_info[1])
                #print("IBO",output)
                #print("IBT",result_tensor)
                #print("IBOR",self.Transformation_Class.phi_inv(result_tensor))
                result_tensor = torch.where(self.mode_info[1], self.source_activations, result_tensor)
                #print("IR",result_tensor)
                return self.Transformation_Class.phi_inv(result_tensor)
        
        return layer.register_forward_hook(hook_fn)

    
    def train_test(self,batch_size,epochs=1,mode=1,early_stopping_threshold=3): #1=train,2=test,3=eval

        self.Model.eval()
        for param in self.Model.parameters():
            param.requires_grad = False  # This freezes the weights

        if mode==1:
            self.Transformation_Class.phi.train()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = True  # This unfreezes the weights
            data=self.Train_Dataset
            Sample_Indices=list(range(self.Train_Sample_Number))
        elif mode==2:
            self.Transformation_Class.phi.eval()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = False  # This freezes the weights
            data=self.Test_Dataset
            Sample_Indices=list(range(self.Test_Samples_Number))
        elif mode==3:
            self.Transformation_Class.phi.eval()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = False  # This freezes the weights
            data=self.Eval_Dataset
            Sample_Indices=list(range(self.Eval_Samples_Number))
        
        best_accuracy=-1
        steps_without_improvement=0
        Best_Phi=None
        for epoch in range(epochs):
            print("[SYST] Epoch",epoch)
            total_correct = 0
            total_samples = 0
            total_loss = 0
        
            #Make Batches
            random.shuffle(Sample_Indices)
            DAS_Train_Batches=self.chunk_list(Sample_Indices, batch_size)
            
            for ac_batch in tqdm(DAS_Train_Batches):

                if mode==1: 
                    self.Transformation_Class.optimizer.zero_grad()
                
                #Prepare Source Activations
                self.source_activations = torch.zeros(len(ac_batch), self.Hidden_Layer_Size).to(self.Device)
                
                for ac_source_pos in range(len(data["sources"])):
                    #add info needed for optimization... no sense in running inputs who are not used:
                    used_source_indices=self.extract_sources_to_run(ac_source_pos,ac_batch,data)
                    if len(used_source_indices)>0:
                        #print("Hey")
                        self.mode_info=["source",ac_source_pos,used_source_indices]
                        ac_source=data["sources"][ac_source_pos][ac_batch][used_source_indices]
                        #print("SI",ac_source)
                        model(ac_source)
        
                #Intervention
                ac_base=data["base"][ac_batch]
                intervention_bools=data["intervention"][ac_batch]
                self.mode_info=["intervene",intervention_bools]
                #print("BI",ac_base)
                outputs=model(ac_base)
                labels=data["label"][ac_batch]
                #print("L",labels)
                if mode==1:
                    loss = self.Transformation_Class.criterion(outputs, labels.squeeze().long())
                    loss.backward()
                    self.Transformation_Class.optimizer.step()
                    #print(self.Transformation_Class.phi.rotate_layer.weight)
                    total_loss += loss.item()

                else:
                    predictions = torch.argmax(outputs, dim=1) 
                    correct = (predictions.squeeze() == labels.squeeze()).sum().item()
                    total_correct += correct
                    total_samples += labels.size(0)
            
            if mode==1:
                eval_acc=self.train_test(batch_size,epochs=1,mode=3)
                if eval_acc>best_accuracy:
                    best_accuracy=eval_acc
                    steps_without_improvement=0
                    Best_Phi=copy.deepcopy(self.Transformation_Class.phi)
                elif steps_without_improvement>=early_stopping_threshold:
                    Best_Phi.to(self.Device)
                    Best_Phi_inverse=InverseTransformation_Function(Best_Phi)
                    criterion = nn.CrossEntropyLoss()
                    optimizer = optim.Adam(Best_Phi.parameters(), lr=0.001)
                    self.Transformation_Class=phi_class(Best_Phi,Best_Phi_inverse,criterion,optimizer)
                    break
                else:
                    steps_without_improvement+=1
                print(f"Epoch {epoch+1}, Loss: {total_loss / len(DAS_Train_Batches)}","steps without improvement:",steps_without_improvement,"best accuracy:",best_accuracy)
                    
        if mode==2: 
            accuracy = total_correct / total_samples
            print(f"Test Accuracy: {accuracy * 100:.2f}%")
            return accuracy
        if mode==3:
            self.Transformation_Class.phi.train()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = True  # This unfreezes the weights
            accuracy = total_correct / total_samples
            return accuracy
                

    def extract_sources_to_run(self,which_variable,batch_indices,data):
        used_source_indices=[]
        for ip, i in enumerate(batch_indices):
            is_used=data["intervention"][i][self.Variable_Dimensions[which_variable][0]]
            if is_used:
                used_source_indices.append(ip)
        return used_source_indices

    
    def chunk_list(self, input_list, batch_size):
        return [input_list[i:i + batch_size] for i in range(0, len(input_list), batch_size)]

    
    def Cleanup(self):
        self.Hook.remove()

In [None]:
results=[]
for acseed in [4287, 3837, 9097, 2635, 5137, 6442, 5234, 4641, 8039, 2266]:
    results.append({})
    set_seed(acseed)
    model,accuracy=make_model(epochs=20)
    Layers=[]
    Layers.append(("Layer1",model.mlp.h[0]))
    Layers.append(("Layer2",model.mlp.h[1]))
    Layers.append(("Layer3",model.mlp.h[2]))
    inter_dims=[]
    
    inter_dims.append([list(range(0,8)),list(range(8,16))])
    inter_dims.append([list(range(0,2)),list(range(2,4))])
    inter_dims.append([list(range(0,1)),list(range(1,2))])
    """
    inter_dims.append([list(range(0,8))])
    inter_dims.append([list(range(0,2))])
    inter_dims.append([list(range(0,1))])
    """
    results[-1]["accuracy"]=accuracy
    for LayerName,Layer in Layers:
        results[-1][LayerName]={}
        for inter_dim in inter_dims:
            print(LayerName,":",inter_dim)
            #DAS_Train=make_intervention_dataset_variable_intervention_all(1280000,4)
            #DAS_Test=make_intervention_dataset_variable_intervention_all(10000,4)
            #DAS_Eval=make_intervention_dataset_variable_intervention_all(10000,4)
            DAS_Train=make_intervention_dataset_variable_intervention_first(1280000,4)
            DAS_Test=make_intervention_dataset_variable_intervention_first(10000,4)
            DAS_Eval=make_intervention_dataset_variable_intervention_first(10000,4)
            #DAS_Train=make_intervention_dataset_first_input_intervention(1280000,4)
            #DAS_Test=make_intervention_dataset_first_input_intervention(10000,4)
            #DAS_Eval=make_intervention_dataset_first_input_intervention(10000,4)
    
            #Initialize transformation function
            p=Transformation_Function(16)
            p.to(DEVICE)
            p_inverse=InverseTransformation_Function(p)
            
            criterion = nn.CrossEntropyLoss()
            optimizer = optim.Adam(p.parameters(), lr=0.001)
            
            phi=phi_class(p,p_inverse,criterion,optimizer)
    
            
    
            DAS_Experiment=Distributed_Alignment_Search(Model=model,
                                                        Model_Layer=Layer,
                                                        Train_Data_Raw=DAS_Train,
                                                        Test_Data_Raw=DAS_Test,
                                                        Eval_Data_Raw=DAS_Eval,
                                                        Hidden_Layer_Size=16,
                                                        Variable_Dimensions=inter_dim,
                                                        Transformation_Class=phi,
                                                        Device=DEVICE)
    
            DAS_Experiment.train_test(batch_size=6400,
                                      epochs=50,
                                      mode=1) #Train
    
            accuracy=DAS_Experiment.train_test(batch_size=6400,
                                               mode=2)#Test
            
            results[-1][LayerName][str(inter_dim)]=accuracy
            DAS_Experiment.Cleanup()
            DAS_Experiment=None
            print(results)

100%|██████████████████████████████| 1048576/1048576 [00:21<00:00, 48954.60it/s]
  return torch.tensor(model_inputs, dtype=torch.float32).to(DEVICE),torch.tensor(labels, dtype=torch.float32).to(DEVICE)
100%|██████████████████████████████████| 10000/10000 [00:00<00:00, 49100.69it/s]
100%|███████████████████████████████████████| 1024/1024 [02:05<00:00,  8.14it/s]


Epoch 1, Loss: 0.3914253892726265 steps without improvement: 6 best accuracy: 0.9835


100%|█████████████████████████████████████████████████████| 1024/1024 [02:04<00:00,  8.21it/s]


Epoch 2, Loss: 0.0275444183066611 steps without improvement: 117 best accuracy: 0.9964


100%|█████████████████████████████████████████████████████| 1024/1024 [02:04<00:00,  8.20it/s]


Epoch 3, Loss: 0.008764004307067808 steps without improvement: 2 best accuracy: 0.9984


100%|█████████████████████████████████████████████████████| 1024/1024 [02:05<00:00,  8.19it/s]


Epoch 4, Loss: 0.004665201721309131 steps without improvement: 306 best accuracy: 0.9992


100%|█████████████████████████████████████████████████████| 1024/1024 [02:04<00:00,  8.20it/s]


Epoch 5, Loss: 0.0027582885465733398 steps without improvement: 171 best accuracy: 0.9996


100%|█████████████████████████████████████████████████████| 1024/1024 [02:04<00:00,  8.21it/s]


Epoch 6, Loss: 0.001844607559007727 steps without improvement: 478 best accuracy: 0.9998


 53%|████████████████████████████▊                         | 546/1024 [01:06<00:58,  8.19it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 49114.03it/s]
100%|████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 103.37it/s]


Test Accuracy: 0.9996
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:14<00:00, 9519.23it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10078.09it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10086.72it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51224.35it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 62898.87it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 62791.24it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 1, Loss: 7.726920104026794 steps without improvement: 0 best accuracy: 0.7155
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]


Epoch 2, Loss: 1.8556142061948777 steps without improvement: 0 best accuracy: 0.801
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 3, Loss: 1.3431384909152984 steps without improvement: 0 best accuracy: 0.8138
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 4, Loss: 1.1766065597534179 steps without improvement: 0 best accuracy: 0.8188
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.65it/s]


Epoch 5, Loss: 1.0572142806649207 steps without improvement: 1 best accuracy: 0.8188
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 6, Loss: 0.9568347844481468 steps without improvement: 2 best accuracy: 0.8188
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 7, Loss: 0.9101756229996681 steps without improvement: 0 best accuracy: 0.8205
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.15it/s]

Epoch 8, Loss: 0.8883296263217926 steps without improvement: 0 best accuracy: 0.8242
[SYST] Epoch 8



100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 9, Loss: 0.8728019484877586 steps without improvement: 0 best accuracy: 0.8266
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 10, Loss: 0.8521940523386001 steps without improvement: 0 best accuracy: 0.8268
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 11, Loss: 0.8250385588407516 steps without improvement: 0 best accuracy: 0.8272
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.88it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 12, Loss: 0.8078491899371147 steps without improvement: 0 best accuracy: 0.8323
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 13, Loss: 0.7978914847970009 steps without improvement: 0 best accuracy: 0.833
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 14, Loss: 0.7901924711465835 steps without improvement: 1 best accuracy: 0.833
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 15, Loss: 0.784048199057579 steps without improvement: 0 best accuracy: 0.8349
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 16, Loss: 0.7782107904553414 steps without improvement: 1 best accuracy: 0.8349
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 17, Loss: 0.7715850594639778 steps without improvement: 0 best accuracy: 0.839
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.39it/s]


Epoch 18, Loss: 0.7659273067116737 steps without improvement: 0 best accuracy: 0.8393
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 19, Loss: 0.7616243839263916 steps without improvement: 0 best accuracy: 0.8413
[SYST] Epoch 19


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 20, Loss: 0.7580173259973526 steps without improvement: 0 best accuracy: 0.8424
[SYST] Epoch 20


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.31it/s]


Epoch 21, Loss: 0.7555333983898163 steps without improvement: 1 best accuracy: 0.8424
[SYST] Epoch 21


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 22, Loss: 0.7535928469896317 steps without improvement: 2 best accuracy: 0.8424
[SYST] Epoch 22


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 23, Loss: 0.752149806022644 steps without improvement: 0 best accuracy: 0.844
[SYST] Epoch 23


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 24, Loss: 0.7500556385517121 steps without improvement: 1 best accuracy: 0.844
[SYST] Epoch 24


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 25, Loss: 0.7489238220453263 steps without improvement: 0 best accuracy: 0.8448
[SYST] Epoch 25


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 26, Loss: 0.7482259598374367 steps without improvement: 1 best accuracy: 0.8448
[SYST] Epoch 26


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.59it/s]


Epoch 27, Loss: 0.7466162756085396 steps without improvement: 2 best accuracy: 0.8448
[SYST] Epoch 27


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.89it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 28, Loss: 0.7455449694395065 steps without improvement: 3 best accuracy: 0.8448
[SYST] Epoch 28


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 29, Loss: 0.7445691278576851 steps without improvement: 0 best accuracy: 0.8466
[SYST] Epoch 29


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.94it/s]


Epoch 30, Loss: 0.7435700565576553 steps without improvement: 1 best accuracy: 0.8466
[SYST] Epoch 30


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 31, Loss: 0.7428114119172097 steps without improvement: 2 best accuracy: 0.8466
[SYST] Epoch 31


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 32, Loss: 0.7417780858278274 steps without improvement: 0 best accuracy: 0.8471
[SYST] Epoch 32


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 33, Loss: 0.7407876694202423 steps without improvement: 0 best accuracy: 0.8473
[SYST] Epoch 33


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 34, Loss: 0.7399816638231278 steps without improvement: 1 best accuracy: 0.8473
[SYST] Epoch 34


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 35, Loss: 0.7394687864184379 steps without improvement: 2 best accuracy: 0.8473
[SYST] Epoch 35


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 36, Loss: 0.7385800004005432 steps without improvement: 3 best accuracy: 0.8473
[SYST] Epoch 36


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.73it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]

Test Accuracy: 83.45%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345}}]
Layer1 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9793.29it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9732.27it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9725.02it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48936.57it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 60176.61it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65176.31it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.17it/s]

Epoch 1, Loss: 8.914518387317658 steps without improvement: 0 best accuracy: 0.6906
[SYST] Epoch 1



100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.36it/s]


Epoch 2, Loss: 2.189133427739143 steps without improvement: 0 best accuracy: 0.7972
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.70it/s]


Epoch 3, Loss: 1.4780966156721116 steps without improvement: 0 best accuracy: 0.8012
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 4, Loss: 1.3977826738357544 steps without improvement: 1 best accuracy: 0.8012
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 5, Loss: 1.3686634421348571 steps without improvement: 2 best accuracy: 0.8012
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 6, Loss: 1.3540710812807084 steps without improvement: 3 best accuracy: 0.8012
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]

Test Accuracy: 80.29%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029}}]
Layer1 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9697.87it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9986.29it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10046.30it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53609.60it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67531.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66213.76it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 1, Loss: 10.245443172454834 steps without improvement: 0 best accuracy: 0.6676
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 2, Loss: 3.906156278848648 steps without improvement: 0 best accuracy: 0.773
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 3, Loss: 2.021151424050331 steps without improvement: 0 best accuracy: 0.7812
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 4, Loss: 1.942840089201927 steps without improvement: 1 best accuracy: 0.7812
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 5, Loss: 1.941664514541626 steps without improvement: 2 best accuracy: 0.7812
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 6, Loss: 1.9413613092899322 steps without improvement: 3 best accuracy: 0.7812
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.18it/s]

Test Accuracy: 78.73%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9646.46it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10080.22it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10254.39it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51640.74it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63765.03it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63940.29it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 1, Loss: 13.141864714622498 steps without improvement: 0 best accuracy: 0.464
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.56it/s]


Epoch 2, Loss: 10.191646647453307 steps without improvement: 0 best accuracy: 0.4645
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.54it/s]


Epoch 3, Loss: 9.76231828212738 steps without improvement: 0 best accuracy: 0.4681
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.13it/s]

Epoch 4, Loss: 9.277142848968506 steps without improvement: 0 best accuracy: 0.4713
[SYST] Epoch 4



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.31it/s]


Epoch 5, Loss: 9.094934220314025 steps without improvement: 0 best accuracy: 0.4743
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.44it/s]


Epoch 6, Loss: 9.031742386817932 steps without improvement: 0 best accuracy: 0.4797
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 7, Loss: 9.008499994277955 steps without improvement: 1 best accuracy: 0.4797
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.21it/s]


Epoch 8, Loss: 8.994839959144592 steps without improvement: 2 best accuracy: 0.4797
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.30it/s]


Epoch 9, Loss: 8.985588746070862 steps without improvement: 3 best accuracy: 0.4797
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]

Test Accuracy: 47.82%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782}}]
Layer2 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9729.31it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10087.35it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10235.18it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53476.47it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66070.86it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 39274.57it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 1, Loss: 10.579953751564027 steps without improvement: 0 best accuracy: 0.5555
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 2, Loss: 9.733610877990722 steps without improvement: 1 best accuracy: 0.5555
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 3, Loss: 9.525611262321473 steps without improvement: 2 best accuracy: 0.5555
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.29it/s]


Epoch 4, Loss: 9.42136968612671 steps without improvement: 3 best accuracy: 0.5555
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]

Test Accuracy: 55.81%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581}}]
Layer2 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9594.16it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10004.93it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10189.17it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53986.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66718.91it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66807.43it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 1, Loss: 11.860044984817504 steps without improvement: 0 best accuracy: 0.5083
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 2, Loss: 10.993089985847472 steps without improvement: 0 best accuracy: 0.5635
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.36it/s]


Epoch 3, Loss: 10.49111560344696 steps without improvement: 0 best accuracy: 0.5769
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 4, Loss: 10.312226252555847 steps without improvement: 1 best accuracy: 0.5769
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.47it/s]


Epoch 5, Loss: 10.251781797409057 steps without improvement: 2 best accuracy: 0.5769
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.68it/s]


Epoch 6, Loss: 10.2346568775177 steps without improvement: 3 best accuracy: 0.5769
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 7, Loss: 10.229923558235168 steps without improvement: 0 best accuracy: 0.5771
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 8, Loss: 10.22907865524292 steps without improvement: 0 best accuracy: 0.5774
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 9, Loss: 10.228780131340027 steps without improvement: 1 best accuracy: 0.5774
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 10, Loss: 10.228745470046997 steps without improvement: 2 best accuracy: 0.5774
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.50it/s]


Epoch 11, Loss: 10.228764595985412 steps without improvement: 3 best accuracy: 0.5774
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]

Test Accuracy: 57.85%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9598.13it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9998.23it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10164.90it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47248.75it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65068.62it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63377.50it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 1, Loss: 10.304641189575195 steps without improvement: 0 best accuracy: 0.502
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 2, Loss: 10.255511298179627 steps without improvement: 0 best accuracy: 0.5043
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 3, Loss: 10.255318078994751 steps without improvement: 0 best accuracy: 0.5074
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 4, Loss: 10.254455599784851 steps without improvement: 0 best accuracy: 0.5079
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 5, Loss: 10.254619226455688 steps without improvement: 1 best accuracy: 0.5079
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 6, Loss: 10.254571976661682 steps without improvement: 2 best accuracy: 0.5079
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 7, Loss: 10.254478459358216 steps without improvement: 3 best accuracy: 0.5079
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.29it/s]

Test Accuracy: 51.21%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121}}]
Layer3 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9798.28it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10011.81it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10123.58it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48604.62it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65872.57it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66217.63it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.15it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 11.01it/s]


Epoch 1, Loss: 10.38957685470581 steps without improvement: 0 best accuracy: 0.5101
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 2, Loss: 10.252448644638061 steps without improvement: 1 best accuracy: 0.5101
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.51it/s]


Epoch 3, Loss: 10.251998510360718 steps without improvement: 2 best accuracy: 0.5101
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 4, Loss: 10.251911659240722 steps without improvement: 3 best accuracy: 0.5101
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.96it/s]

Test Accuracy: 50.89%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089}}]
Layer3 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9682.32it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9997.97it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10136.34it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53729.40it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67664.14it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 68656.32it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.73it/s]


Epoch 1, Loss: 11.071643681526185 steps without improvement: 0 best accuracy: 0.5133
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.31it/s]


Epoch 2, Loss: 10.24242712020874 steps without improvement: 1 best accuracy: 0.5133
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.13it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 3, Loss: 10.238970036506652 steps without improvement: 2 best accuracy: 0.5133
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.14it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 4, Loss: 10.238244404792786 steps without improvement: 3 best accuracy: 0.5133
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.14it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]

Test Accuracy: 51.76%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}]


100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49401.53it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 49190.18it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:05<00:00,  8.13it/s]


Epoch 1, Loss: 0.44123691122513264 steps without improvement: 2 best accuracy: 0.9495


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 2, Loss: 0.04548790922581247 steps without improvement: 25 best accuracy: 0.9963


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 3, Loss: 0.008154366262601798 steps without improvement: 78 best accuracy: 0.9986


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 4, Loss: 0.003962909675692572 steps without improvement: 37 best accuracy: 0.9994


100%|█████████████████████████████████████████████████████| 1024/1024 [02:05<00:00,  8.13it/s]


Epoch 5, Loss: 0.002554258478568272 steps without improvement: 224 best accuracy: 0.9997


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 6, Loss: 0.0018727425830036282 steps without improvement: 820 best accuracy: 0.9998


 20%|██████████▊                                           | 204/1024 [00:25<01:41,  8.07it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48728.48it/s]
100%|████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 102.49it/s]


Test Accuracy: 0.9995
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9645.23it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10117.52it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10279.03it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51662.05it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64308.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64372.76it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 1, Loss: 4.740746166706085 steps without improvement: 0 best accuracy: 0.7756
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 2, Loss: 1.2042739462852479 steps without improvement: 0 best accuracy: 0.838
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 3, Loss: 0.8881995421648026 steps without improvement: 0 best accuracy: 0.8559
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 4, Loss: 0.7270553413033486 steps without improvement: 0 best accuracy: 0.8678
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 5, Loss: 0.6581037253141403 steps without improvement: 0 best accuracy: 0.8707
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 6, Loss: 0.6375092375278473 steps without improvement: 0 best accuracy: 0.8728
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 7, Loss: 0.6242072907090187 steps without improvement: 1 best accuracy: 0.8728
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 8, Loss: 0.6097755041718483 steps without improvement: 0 best accuracy: 0.8766
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 9, Loss: 0.5953477156162262 steps without improvement: 0 best accuracy: 0.8775
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 10, Loss: 0.5826536309719086 steps without improvement: 0 best accuracy: 0.8792
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 11, Loss: 0.5728033697605133 steps without improvement: 0 best accuracy: 0.8816
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 12, Loss: 0.5654235902428627 steps without improvement: 1 best accuracy: 0.8816
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.42it/s]


Epoch 13, Loss: 0.5603136220574378 steps without improvement: 2 best accuracy: 0.8816
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 14, Loss: 0.5555587491393089 steps without improvement: 3 best accuracy: 0.8816
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 15, Loss: 0.5518964314460755 steps without improvement: 0 best accuracy: 0.8825
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 16, Loss: 0.5488262751698494 steps without improvement: 1 best accuracy: 0.8825
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 17, Loss: 0.545722654312849 steps without improvement: 2 best accuracy: 0.8825
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 18, Loss: 0.5434796570241451 steps without improvement: 3 best accuracy: 0.8825
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]

Test Accuracy: 87.47%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747}}]
Layer1 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9729.21it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10117.06it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10259.38it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48820.31it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67112.94it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67251.44it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 1, Loss: 6.259479122161865 steps without improvement: 0 best accuracy: 0.6878
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 2, Loss: 1.9969902703166007 steps without improvement: 0 best accuracy: 0.8354
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]


Epoch 3, Loss: 0.877134636938572 steps without improvement: 0 best accuracy: 0.8495
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.43it/s]


Epoch 4, Loss: 0.8471038347482681 steps without improvement: 0 best accuracy: 0.8536
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.61it/s]


Epoch 5, Loss: 0.8275736925005913 steps without improvement: 0 best accuracy: 0.8552
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 6, Loss: 0.8135872963070869 steps without improvement: 0 best accuracy: 0.8553
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 7, Loss: 0.8047999155521393 steps without improvement: 0 best accuracy: 0.8581
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 8, Loss: 0.7990412044525147 steps without improvement: 0 best accuracy: 0.8587
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 9, Loss: 0.7954301685094833 steps without improvement: 1 best accuracy: 0.8587
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 10, Loss: 0.7925223469734192 steps without improvement: 2 best accuracy: 0.8587
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 11, Loss: 0.790260891020298 steps without improvement: 3 best accuracy: 0.8587
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.67it/s]

Test Accuracy: 86.45%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645}}]
Layer1 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9842.37it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10061.76it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10229.25it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 49315.31it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65684.10it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66745.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 1, Loss: 5.0423794150352474 steps without improvement: 0 best accuracy: 0.7336
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 2, Loss: 1.7804604357481002 steps without improvement: 0 best accuracy: 0.8334
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 3, Loss: 1.018606494963169 steps without improvement: 0 best accuracy: 0.8369
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 4, Loss: 0.990735435783863 steps without improvement: 1 best accuracy: 0.8369
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 5, Loss: 0.9879490977525711 steps without improvement: 0 best accuracy: 0.8373
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.28it/s]


Epoch 6, Loss: 0.9878730162978172 steps without improvement: 1 best accuracy: 0.8373
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 7, Loss: 0.9878997027873992 steps without improvement: 2 best accuracy: 0.8373
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 8, Loss: 0.9877108842134475 steps without improvement: 3 best accuracy: 0.8373
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]

Test Accuracy: 83.47%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9657.45it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9999.43it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10151.67it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 51014.60it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63496.47it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 62737.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.55it/s]


Epoch 1, Loss: 5.186425607204438 steps without improvement: 0 best accuracy: 0.5205
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 2, Loss: 4.69413907289505 steps without improvement: 0 best accuracy: 0.5358
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 3, Loss: 4.571504545211792 steps without improvement: 0 best accuracy: 0.537
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.47it/s]


Epoch 4, Loss: 4.520108211040497 steps without improvement: 1 best accuracy: 0.537
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 5, Loss: 4.49320184469223 steps without improvement: 2 best accuracy: 0.537
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 6, Loss: 4.4799717020988465 steps without improvement: 3 best accuracy: 0.537
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]

Test Accuracy: 54.71%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471}}]
Layer2 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9728.84it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10062.10it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10183.34it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 53268.65it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66607.97it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67170.34it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 1, Loss: 5.256394057273865 steps without improvement: 0 best accuracy: 0.5241
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 2, Loss: 4.870824315547943 steps without improvement: 0 best accuracy: 0.5293
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 3, Loss: 4.6611075019836425 steps without improvement: 1 best accuracy: 0.5293
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 4, Loss: 4.490303711891174 steps without improvement: 2 best accuracy: 0.5293
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 5, Loss: 4.4247908329963686 steps without improvement: 3 best accuracy: 0.5293
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.15it/s]

Test Accuracy: 52.42%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242}}]
Layer2 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9674.52it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9996.00it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3669.55it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 53137.41it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 68056.54it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67929.78it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]


Epoch 1, Loss: 5.832359099388123 steps without improvement: 0 best accuracy: 0.5093
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 2, Loss: 5.320310537815094 steps without improvement: 0 best accuracy: 0.5185
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.08it/s]


Epoch 3, Loss: 5.123056831359864 steps without improvement: 0 best accuracy: 0.526
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.55it/s]


Epoch 4, Loss: 5.006503570079803 steps without improvement: 0 best accuracy: 0.5332
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.16it/s]


Epoch 5, Loss: 4.976533973217011 steps without improvement: 0 best accuracy: 0.5349
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 6, Loss: 4.970926060676574 steps without improvement: 1 best accuracy: 0.5349
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 7, Loss: 4.9693330073356625 steps without improvement: 2 best accuracy: 0.5349
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.27it/s]


Epoch 8, Loss: 4.968614954948425 steps without improvement: 0 best accuracy: 0.5376
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 9, Loss: 4.9684899306297305 steps without improvement: 1 best accuracy: 0.5376
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 10, Loss: 4.968349194526672 steps without improvement: 2 best accuracy: 0.5376
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 11, Loss: 4.96802665233612 steps without improvement: 3 best accuracy: 0.5376
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]

Test Accuracy: 53.87%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9661.17it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10020.02it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10156.03it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51886.80it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64400.04it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63957.55it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.13it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.96it/s]


Epoch 1, Loss: 4.597040832042694 steps without improvement: 0 best accuracy: 0.5021
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.22it/s]


Epoch 2, Loss: 4.592792932987213 steps without improvement: 1 best accuracy: 0.5021
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 3, Loss: 4.591808590888977 steps without improvement: 2 best accuracy: 0.5021
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 4, Loss: 4.59100480556488 steps without improvement: 3 best accuracy: 0.5021
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.14it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.97it/s]


Epoch 5, Loss: 4.590742053985596 steps without improvement: 0 best accuracy: 0.5023
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.13it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 6, Loss: 4.590190443992615 steps without improvement: 0 best accuracy: 0.5029
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.15it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 7, Loss: 4.589873023033142 steps without improvement: 1 best accuracy: 0.5029
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.14it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 8, Loss: 4.5895405817031865 steps without improvement: 2 best accuracy: 0.5029
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 9, Loss: 4.589842195510864 steps without improvement: 3 best accuracy: 0.5029
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.56it/s]


Test Accuracy: 50.28%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028}}]
Layer3 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9629.84it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10082.66it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10217.30it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53668.72it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66320.24it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66246.81it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.45it/s]


Epoch 1, Loss: 4.60394923210144 steps without improvement: 0 best accuracy: 0.5158
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 2, Loss: 4.591294853687287 steps without improvement: 1 best accuracy: 0.5158
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.29it/s]


Epoch 3, Loss: 4.590499267578125 steps without improvement: 2 best accuracy: 0.5158
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 4, Loss: 4.590325102806092 steps without improvement: 3 best accuracy: 0.5158
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.67it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Test Accuracy: 50.77%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077}}]
Layer3 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:14<00:00, 9516.30it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10055.76it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10200.56it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 54634.91it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67208.55it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66913.37it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 1, Loss: 4.830418450832367 steps without improvement: 0 best accuracy: 0.4938
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 2, Loss: 4.585854818820954 steps without improvement: 0 best accuracy: 0.4965
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 3, Loss: 4.58057852268219 steps without improvement: 0 best accuracy: 0.4986
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 4, Loss: 4.578285596370697 steps without improvement: 0 best accuracy: 0.5014
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 5, Loss: 4.577226140499115 steps without improvement: 0 best accuracy: 0.5022
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 6, Loss: 4.576701741218567 steps without improvement: 0 best accuracy: 0.5056
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 7, Loss: 4.576516671180725 steps without improvement: 0 best accuracy: 0.5065
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 8, Loss: 4.576487774848938 steps without improvement: 1 best accuracy: 0.5065
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 9, Loss: 4.5762800168991085 steps without improvement: 2 best accuracy: 0.5065
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 10, Loss: 4.576237225532532 steps without improvement: 0 best accuracy: 0.5072
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.68it/s]


Epoch 11, Loss: 4.576227400302887 steps without improvement: 1 best accuracy: 0.5072
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 12, Loss: 4.576124517917633 steps without improvement: 2 best accuracy: 0.5072
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 13, Loss: 4.576174454689026 steps without improvement: 3 best accuracy: 0.5072
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.61it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]

Test Accuracy: 49.60%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}]


100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49066.23it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48887.23it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:05<00:00,  8.18it/s]


Epoch 1, Loss: 0.5127051737508737 steps without improvement: 0 best accuracy: 0.9426


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 2, Loss: 0.09122163233041647 steps without improvement: 68 best accuracy: 0.9871


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 3, Loss: 0.03824241242000426 steps without improvement: 48 best accuracy: 0.9929


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 4, Loss: 0.023718349437785946 steps without improvement: 198 best accuracy: 0.995


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 5, Loss: 0.01697288591776669 steps without improvement: 129 best accuracy: 0.9966


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 6, Loss: 0.013048809285010066 steps without improvement: 253 best accuracy: 0.9979


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 7, Loss: 0.010436246243898495 steps without improvement: 29 best accuracy: 0.9987


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 8, Loss: 0.008678382076368507 steps without improvement: 97 best accuracy: 0.9989


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.07it/s]


Epoch 9, Loss: 0.007545745424067718 steps without improvement: 931 best accuracy: 0.999


  9%|████▉                                                  | 93/1024 [00:11<01:55,  8.03it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48492.15it/s]
100%|████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 102.28it/s]


Test Accuracy: 0.9972
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9649.53it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10036.24it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10181.43it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52169.87it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64532.32it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65351.69it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 1, Loss: 9.430802421569824 steps without improvement: 0 best accuracy: 0.563
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 2, Loss: 6.96507004737854 steps without improvement: 0 best accuracy: 0.5842
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 3, Loss: 6.073273849487305 steps without improvement: 0 best accuracy: 0.6136
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 4, Loss: 5.110875613689423 steps without improvement: 0 best accuracy: 0.6667
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 5, Loss: 3.5344829869270327 steps without improvement: 0 best accuracy: 0.6777
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 6, Loss: 2.829365620613098 steps without improvement: 0 best accuracy: 0.6913
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.77it/s]


Epoch 7, Loss: 2.5828447198867797 steps without improvement: 0 best accuracy: 0.6919
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.16it/s]

Epoch 8, Loss: 2.469710509777069 steps without improvement: 0 best accuracy: 0.6953
[SYST] Epoch 8



100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.51it/s]


Epoch 9, Loss: 2.400461981296539 steps without improvement: 1 best accuracy: 0.6953
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 10, Loss: 2.3415113043785096 steps without improvement: 0 best accuracy: 0.6996
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 11, Loss: 2.2849198055267332 steps without improvement: 0 best accuracy: 0.7012
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 12, Loss: 2.234406979084015 steps without improvement: 0 best accuracy: 0.7057
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 13, Loss: 2.1833171343803404 steps without improvement: 0 best accuracy: 0.7079
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 14, Loss: 2.1267837291955947 steps without improvement: 1 best accuracy: 0.7079
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 15, Loss: 2.0756514817476273 steps without improvement: 0 best accuracy: 0.7106
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 16, Loss: 2.038880258202553 steps without improvement: 0 best accuracy: 0.7109
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.03it/s]


Epoch 17, Loss: 2.007763449549675 steps without improvement: 0 best accuracy: 0.7174
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.46it/s]


Epoch 18, Loss: 1.9811296516656876 steps without improvement: 0 best accuracy: 0.7228
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 19, Loss: 1.9579273509979247 steps without improvement: 0 best accuracy: 0.726
[SYST] Epoch 19


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 20, Loss: 1.933430494070053 steps without improvement: 0 best accuracy: 0.73
[SYST] Epoch 20


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 21, Loss: 1.9073449987173081 steps without improvement: 0 best accuracy: 0.7326
[SYST] Epoch 21


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.73it/s]


Epoch 22, Loss: 1.8775949847698212 steps without improvement: 0 best accuracy: 0.7358
[SYST] Epoch 22


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 23, Loss: 1.8475391137599946 steps without improvement: 1 best accuracy: 0.7358
[SYST] Epoch 23


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 24, Loss: 1.8220645028352738 steps without improvement: 0 best accuracy: 0.7378
[SYST] Epoch 24


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 25, Loss: 1.8054023110866546 steps without improvement: 1 best accuracy: 0.7378
[SYST] Epoch 25


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 26, Loss: 1.7949788624048233 steps without improvement: 0 best accuracy: 0.7379
[SYST] Epoch 26


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 27, Loss: 1.788347829580307 steps without improvement: 0 best accuracy: 0.7386
[SYST] Epoch 27


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 28, Loss: 1.7841674345731735 steps without improvement: 0 best accuracy: 0.7403
[SYST] Epoch 28


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.70it/s]


Epoch 29, Loss: 1.7817738217115402 steps without improvement: 1 best accuracy: 0.7403
[SYST] Epoch 29


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.44it/s]


Epoch 30, Loss: 1.7799187064170838 steps without improvement: 2 best accuracy: 0.7403
[SYST] Epoch 30


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.55it/s]


Epoch 31, Loss: 1.7793950498104096 steps without improvement: 3 best accuracy: 0.7403
[SYST] Epoch 31


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Test Accuracy: 74.00%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74}}]
Layer1 : [[0, 1], [2, 3]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:14<00:00, 9511.28it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9979.97it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10143.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52803.27it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67162.16it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67290.39it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.16it/s]


Epoch 1, Loss: 9.08354820728302 steps without improvement: 0 best accuracy: 0.6403
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 2, Loss: 6.224225063323974 steps without improvement: 1 best accuracy: 0.6403
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 3, Loss: 5.232676641941071 steps without improvement: 0 best accuracy: 0.6591
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.11it/s]


Epoch 4, Loss: 4.451912367343903 steps without improvement: 0 best accuracy: 0.6709
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.63it/s]


Epoch 5, Loss: 4.035348355770111 steps without improvement: 0 best accuracy: 0.6763
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 6, Loss: 3.8703969883918763 steps without improvement: 0 best accuracy: 0.6806
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 7, Loss: 3.8566274523735045 steps without improvement: 0 best accuracy: 0.6842
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 8, Loss: 3.856364542245865 steps without improvement: 1 best accuracy: 0.6842
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 9, Loss: 3.8560840713977815 steps without improvement: 2 best accuracy: 0.6842
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.16it/s]


Epoch 10, Loss: 3.855960876941681 steps without improvement: 0 best accuracy: 0.6858
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.35it/s]


Epoch 11, Loss: 3.856014324426651 steps without improvement: 0 best accuracy: 0.6865
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 12, Loss: 3.8564312064647677 steps without improvement: 0 best accuracy: 0.689
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 13, Loss: 3.8555617368221284 steps without improvement: 1 best accuracy: 0.689
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 14, Loss: 3.8555244255065917 steps without improvement: 2 best accuracy: 0.689
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 15, Loss: 3.8561075961589815 steps without improvement: 3 best accuracy: 0.689
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.28it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.34it/s]

Test Accuracy: 68.78%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878}}]
Layer1 : [[0], [1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9724.62it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10006.09it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10164.20it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 49333.31it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66819.88it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66367.14it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 1, Loss: 8.504893732070922 steps without improvement: 0 best accuracy: 0.5476
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.17it/s]

Epoch 2, Loss: 7.594753558635712 steps without improvement: 0 best accuracy: 0.6157
[SYST] Epoch 2



100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.84it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.28it/s]


Epoch 3, Loss: 6.221672115325927 steps without improvement: 0 best accuracy: 0.6873
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.66it/s]


Epoch 4, Loss: 5.640370602607727 steps without improvement: 0 best accuracy: 0.7012
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 5, Loss: 5.55768657207489 steps without improvement: 0 best accuracy: 0.7022
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.27it/s]


Epoch 6, Loss: 5.54955727815628 steps without improvement: 1 best accuracy: 0.7022
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.11it/s]


Epoch 7, Loss: 5.548720405101776 steps without improvement: 0 best accuracy: 0.703
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 8, Loss: 5.548785109519958 steps without improvement: 1 best accuracy: 0.703
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 9, Loss: 5.548946936130523 steps without improvement: 2 best accuracy: 0.703
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 10, Loss: 5.54895251750946 steps without improvement: 3 best accuracy: 0.703
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]

Test Accuracy: 69.70%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}}]
Layer2 : [[0,

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9797.94it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3631.27it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10143.28it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 50766.25it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63285.89it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63475.43it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 1, Loss: 8.26867800951004 steps without improvement: 0 best accuracy: 0.6298
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 2, Loss: 4.730290509462357 steps without improvement: 0 best accuracy: 0.6488
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.24it/s]


Epoch 3, Loss: 3.9555049991607665 steps without improvement: 0 best accuracy: 0.6582
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 4, Loss: 3.672606017589569 steps without improvement: 0 best accuracy: 0.6646
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 5, Loss: 3.522887806892395 steps without improvement: 0 best accuracy: 0.673
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 6, Loss: 3.4352930402755737 steps without improvement: 0 best accuracy: 0.6771
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 7, Loss: 3.3832089495658875 steps without improvement: 1 best accuracy: 0.6771
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.02it/s]


Epoch 8, Loss: 3.345778740644455 steps without improvement: 0 best accuracy: 0.6812
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 9, Loss: 3.3137341701984404 steps without improvement: 1 best accuracy: 0.6812
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 10, Loss: 3.291710969209671 steps without improvement: 0 best accuracy: 0.6859
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 11, Loss: 3.277760637998581 steps without improvement: 0 best accuracy: 0.6929
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 12, Loss: 3.268358677625656 steps without improvement: 1 best accuracy: 0.6929
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 13, Loss: 3.2592948293685913 steps without improvement: 2 best accuracy: 0.6929
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 14, Loss: 3.248014597892761 steps without improvement: 3 best accuracy: 0.6929
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]

Test Accuracy: 69.19%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9692.14it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9988.97it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10131.46it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53498.40it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66989.25it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66892.67it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 1, Loss: 7.802231407165527 steps without improvement: 0 best accuracy: 0.6747
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 2, Loss: 5.339206092357635 steps without improvement: 0 best accuracy: 0.7129
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 3, Loss: 4.539167973995209 steps without improvement: 1 best accuracy: 0.7129
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 4, Loss: 4.135420191287994 steps without improvement: 2 best accuracy: 0.7129
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 5, Loss: 3.9240286600589753 steps without improvement: 3 best accuracy: 0.7129
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]

Test Accuracy: 71.00%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9599.75it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10068.01it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10183.58it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53536.90it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 68175.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67521.23it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 1, Loss: 10.235489382743836 steps without improvement: 0 best accuracy: 0.6162
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 2, Loss: 6.960587091445923 steps without improvement: 0 best accuracy: 0.7131
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 3, Loss: 5.521354718208313 steps without improvement: 0 best accuracy: 0.7245
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.93it/s]


Epoch 4, Loss: 4.984076459407806 steps without improvement: 0 best accuracy: 0.7306
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 5, Loss: 4.7862323379516605 steps without improvement: 0 best accuracy: 0.7319
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.07it/s]


Epoch 6, Loss: 4.716511578559875 steps without improvement: 0 best accuracy: 0.7332
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 7, Loss: 4.695016002655029 steps without improvement: 1 best accuracy: 0.7332
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 8, Loss: 4.6893449926376345 steps without improvement: 2 best accuracy: 0.7332
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 9, Loss: 4.687812328338623 steps without improvement: 3 best accuracy: 0.7332
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]

Test Accuracy: 72.89%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9693.26it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10096.18it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10259.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51945.79it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64370.10it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64815.74it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.15it/s]

Epoch 1, Loss: 8.204234776496888 steps without improvement: 0 best accuracy: 0.5149
[SYST] Epoch 1



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.63it/s]


Epoch 2, Loss: 7.747941515445709 steps without improvement: 0 best accuracy: 0.5152
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 3, Loss: 7.730844402313233 steps without improvement: 1 best accuracy: 0.5152
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 4, Loss: 7.7263541865348815 steps without improvement: 2 best accuracy: 0.5152
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.13it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 5, Loss: 7.724393858909607 steps without improvement: 3 best accuracy: 0.5152
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]

Test Accuracy: 50.76%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:14<00:00, 9532.46it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9960.24it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10105.74it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52911.16it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66596.44it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66745.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.33it/s]


Epoch 1, Loss: 8.312302117347718 steps without improvement: 0 best accuracy: 0.5167
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.14it/s]

Epoch 2, Loss: 7.753365430831909 steps without improvement: 1 best accuracy: 0.5167
[SYST] Epoch 2



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.52it/s]


Epoch 3, Loss: 7.736251220703125 steps without improvement: 2 best accuracy: 0.5167
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 4, Loss: 7.733803071975708 steps without improvement: 3 best accuracy: 0.5167
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.96it/s]

Test Accuracy: 53.29%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9593.48it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9977.64it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10160.36it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53810.19it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67669.16it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67502.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 1, Loss: 8.396903059482575 steps without improvement: 0 best accuracy: 0.5305
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 2, Loss: 7.7629169487953185 steps without improvement: 1 best accuracy: 0.5305
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 3, Loss: 7.723341293334961 steps without improvement: 2 best accuracy: 0.5305
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 4, Loss: 7.714954562187195 steps without improvement: 3 best accuracy: 0.5305
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.51it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.39it/s]

Test Accuracy: 52.33%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49355.18it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48583.76it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 1, Loss: 0.4492460607580142 steps without improvement: 0 best accuracy: 0.9415


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 2, Loss: 0.05776507840164413 steps without improvement: 1 best accuracy: 0.9958


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 3, Loss: 0.013673660534550436 steps without improvement: 71 best accuracy: 0.9983


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 4, Loss: 0.00754725169770154 steps without improvement: 300 best accuracy: 0.9992


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 5, Loss: 0.0051743105420882785 steps without improvement: 69 best accuracy: 0.9998


 93%|██████████████████████████████████████████████████▎   | 955/1024 [01:58<00:08,  8.09it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48244.49it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 52.15it/s]


Test Accuracy: 0.9992
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9635.53it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10064.18it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10153.32it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47493.64it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63787.82it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64673.82it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 1, Loss: 4.468039465546608 steps without improvement: 0 best accuracy: 0.7834
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 2, Loss: 1.2004336404800415 steps without improvement: 0 best accuracy: 0.8193
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.56it/s]


Epoch 3, Loss: 0.9596302691102028 steps without improvement: 0 best accuracy: 0.8312
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 4, Loss: 0.8900318986177445 steps without improvement: 0 best accuracy: 0.8352
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.17it/s]


Epoch 5, Loss: 0.8473774310946465 steps without improvement: 0 best accuracy: 0.8373
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 6, Loss: 0.8064173707365989 steps without improvement: 0 best accuracy: 0.8389
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 7, Loss: 0.7632757407426835 steps without improvement: 0 best accuracy: 0.8395
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 8, Loss: 0.7283684468269348 steps without improvement: 1 best accuracy: 0.8395
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 9, Loss: 0.7039159470796585 steps without improvement: 0 best accuracy: 0.8413
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 10, Loss: 0.6874952629208565 steps without improvement: 0 best accuracy: 0.8416
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 11, Loss: 0.6765080121159553 steps without improvement: 0 best accuracy: 0.8425
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.68it/s]


Epoch 12, Loss: 0.6698994350433349 steps without improvement: 1 best accuracy: 0.8425
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 13, Loss: 0.6656865426898002 steps without improvement: 2 best accuracy: 0.8425
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 14, Loss: 0.6624071374535561 steps without improvement: 3 best accuracy: 0.8425
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 15, Loss: 0.6603937742114067 steps without improvement: 0 best accuracy: 0.8431
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 16, Loss: 0.6585932931303978 steps without improvement: 0 best accuracy: 0.8451
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.87it/s]


Epoch 17, Loss: 0.6569354692101479 steps without improvement: 1 best accuracy: 0.8451
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.31it/s]


Epoch 18, Loss: 0.6556966480612755 steps without improvement: 2 best accuracy: 0.8451
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 19, Loss: 0.6546567460894585 steps without improvement: 3 best accuracy: 0.8451
[SYST] Epoch 19


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.37it/s]

Test Accuracy: 82.96%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9710.54it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10090.13it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10228.76it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52496.71it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67465.95it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65936.15it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.57it/s]


Epoch 1, Loss: 5.049638658761978 steps without improvement: 0 best accuracy: 0.7764
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 2, Loss: 2.041614419221878 steps without improvement: 0 best accuracy: 0.8093
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 3, Loss: 1.3163312190771104 steps without improvement: 0 best accuracy: 0.8134
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.55it/s]


Epoch 4, Loss: 1.084925179183483 steps without improvement: 0 best accuracy: 0.8246
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.97it/s]


Epoch 5, Loss: 0.9115653029084205 steps without improvement: 0 best accuracy: 0.8323
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 6, Loss: 0.8455358609557152 steps without improvement: 0 best accuracy: 0.8356
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 7, Loss: 0.8172053602337838 steps without improvement: 0 best accuracy: 0.8374
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.29it/s]


Epoch 8, Loss: 0.8008276325464249 steps without improvement: 1 best accuracy: 0.8374
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.33it/s]


Epoch 9, Loss: 0.7909966510534286 steps without improvement: 2 best accuracy: 0.8374
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 10, Loss: 0.7855321022868157 steps without improvement: 3 best accuracy: 0.8374
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]

Test Accuracy: 83.61%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9828.88it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10136.89it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3656.82it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52959.77it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66452.53it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66676.48it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 1, Loss: 5.3310631966590885 steps without improvement: 0 best accuracy: 0.7453
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 2, Loss: 2.5649220567941664 steps without improvement: 0 best accuracy: 0.8053
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 3, Loss: 1.4666401410102845 steps without improvement: 0 best accuracy: 0.8111
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 4, Loss: 1.3863545817136764 steps without improvement: 1 best accuracy: 0.8111
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.96it/s]


Epoch 5, Loss: 1.3798901176452636 steps without improvement: 2 best accuracy: 0.8111
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 6, Loss: 1.3790832650661469 steps without improvement: 3 best accuracy: 0.8111
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Test Accuracy: 80.91%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9794.39it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10123.49it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10214.36it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51687.43it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64305.55it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64392.73it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 1, Loss: 4.5765216457843785 steps without improvement: 0 best accuracy: 0.5577
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 2, Loss: 3.5792667841911316 steps without improvement: 0 best accuracy: 0.5623
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.45it/s]


Epoch 3, Loss: 3.4372833776474 steps without improvement: 0 best accuracy: 0.5785
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 4, Loss: 3.3542753934860228 steps without improvement: 1 best accuracy: 0.5785
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 5, Loss: 3.3140385472774505 steps without improvement: 2 best accuracy: 0.5785
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 6, Loss: 3.2996017110347746 steps without improvement: 0 best accuracy: 0.5881
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 7, Loss: 3.2933775401115417 steps without improvement: 1 best accuracy: 0.5881
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 8, Loss: 3.2898898315429688 steps without improvement: 0 best accuracy: 0.5889
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 9, Loss: 3.2877101790905 steps without improvement: 1 best accuracy: 0.5889
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 10, Loss: 3.285384079217911 steps without improvement: 2 best accuracy: 0.5889
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 11, Loss: 3.2838404512405397 steps without improvement: 3 best accuracy: 0.5889
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.01it/s]


Test Accuracy: 58.57%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9654.64it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10062.87it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10185.53it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 53145.18it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67131.53it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66522.30it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 1, Loss: 4.676810692548752 steps without improvement: 0 best accuracy: 0.5413
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 2, Loss: 3.6880937361717225 steps without improvement: 0 best accuracy: 0.5588
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 3, Loss: 3.521677738428116 steps without improvement: 1 best accuracy: 0.5588
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 4, Loss: 3.48688769698143 steps without improvement: 2 best accuracy: 0.5588
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.00it/s]


Epoch 5, Loss: 3.469045547246933 steps without improvement: 3 best accuracy: 0.5588
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]

Test Accuracy: 55.43%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9673.26it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10153.20it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10282.80it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48875.82it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67243.46it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67620.18it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 1, Loss: 6.344587306976319 steps without improvement: 0 best accuracy: 0.5015
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 2, Loss: 5.146128795146942 steps without improvement: 0 best accuracy: 0.5285
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 3, Loss: 4.633087558746338 steps without improvement: 1 best accuracy: 0.5285
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.32it/s]


Epoch 4, Loss: 4.592738335132599 steps without improvement: 2 best accuracy: 0.5285
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 5, Loss: 4.586292986869812 steps without improvement: 3 best accuracy: 0.5285
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]

Test Accuracy: 51.96%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9845.66it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10113.24it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10263.09it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47292.85it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64440.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63389.47it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 1, Loss: 5.232571918964386 steps without improvement: 0 best accuracy: 0.507
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.46it/s]


Epoch 2, Loss: 5.225677406787872 steps without improvement: 1 best accuracy: 0.507
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.41it/s]


Epoch 3, Loss: 5.224638154506684 steps without improvement: 0 best accuracy: 0.5117
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 11.02it/s]


Epoch 4, Loss: 5.224091806411743 steps without improvement: 1 best accuracy: 0.5117
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 5, Loss: 5.2239374566078185 steps without improvement: 2 best accuracy: 0.5117
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.37it/s]


Epoch 6, Loss: 5.223726494312286 steps without improvement: 3 best accuracy: 0.5117
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.19it/s]

Test Accuracy: 50.96%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9776.13it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10141.16it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10293.47it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52626.63it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65449.89it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65848.78it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.16it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 1, Loss: 5.293032426834106 steps without improvement: 0 best accuracy: 0.4785
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.19it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 2, Loss: 5.249383172988892 steps without improvement: 0 best accuracy: 0.4942
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 3, Loss: 5.242898907661438 steps without improvement: 0 best accuracy: 0.4966
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.13it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 4, Loss: 5.239287803173065 steps without improvement: 0 best accuracy: 0.4996
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 5, Loss: 5.236420984268189 steps without improvement: 0 best accuracy: 0.5016
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 6, Loss: 5.235390219688416 steps without improvement: 0 best accuracy: 0.5059
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 7, Loss: 5.23464569568634 steps without improvement: 1 best accuracy: 0.5059
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.15it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 8, Loss: 5.234212081432343 steps without improvement: 2 best accuracy: 0.5059
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.14it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 9, Loss: 5.233826518058777 steps without improvement: 3 best accuracy: 0.5059
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]

Test Accuracy: 50.23%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9793.75it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10116.10it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10261.99it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 49123.80it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67074.84it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67573.23it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.18it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 1, Loss: 5.386911177635193 steps without improvement: 0 best accuracy: 0.5184
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 11.01it/s]


Epoch 2, Loss: 5.245326850414276 steps without improvement: 1 best accuracy: 0.5184
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.15it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 3, Loss: 5.243732392787933 steps without improvement: 2 best accuracy: 0.5184
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.97it/s]


Epoch 4, Loss: 5.242804598808289 steps without improvement: 3 best accuracy: 0.5184
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.25it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.42it/s]

Test Accuracy: 51.38%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49252.21it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 49175.88it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:04<00:00,  8.24it/s]


Epoch 1, Loss: 0.5060877539945068 steps without improvement: 7 best accuracy: 0.9106


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 2, Loss: 0.13853802621451905 steps without improvement: 5 best accuracy: 0.9786


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 3, Loss: 0.05688007871140144 steps without improvement: 30 best accuracy: 0.9908


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 4, Loss: 0.029895316408328654 steps without improvement: 114 best accuracy: 0.9949


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 5, Loss: 0.019137697459882475 steps without improvement: 46 best accuracy: 0.9968


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 6, Loss: 0.01368152048689808 steps without improvement: 61 best accuracy: 0.9978


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 7, Loss: 0.010464011707426835 steps without improvement: 203 best accuracy: 0.9986


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 8, Loss: 0.008323195765115088 steps without improvement: 233 best accuracy: 0.9989


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.13it/s]


Epoch 9, Loss: 0.006778866462127553 steps without improvement: 325 best accuracy: 0.9991


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 10, Loss: 0.005242845486463921 steps without improvement: 719 best accuracy: 0.9993


 30%|████████████████                                      | 305/1024 [00:37<01:29,  8.07it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48628.09it/s]
100%|████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 102.59it/s]


Test Accuracy: 0.9992
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:14<00:00, 9540.69it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10008.91it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10161.78it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51649.29it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64372.96it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64312.55it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.17it/s]

Epoch 1, Loss: 8.673514251708985 steps without improvement: 0 best accuracy: 0.5506
[SYST] Epoch 1



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 2, Loss: 6.36618173122406 steps without improvement: 0 best accuracy: 0.5726
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 3, Loss: 5.9428584361076355 steps without improvement: 0 best accuracy: 0.6037
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 4, Loss: 5.117424675226212 steps without improvement: 0 best accuracy: 0.6587
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.08it/s]


Epoch 5, Loss: 3.310649973154068 steps without improvement: 0 best accuracy: 0.6746
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 6, Loss: 2.928711669445038 steps without improvement: 0 best accuracy: 0.6799
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 7, Loss: 2.8111715590953827 steps without improvement: 0 best accuracy: 0.688
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 8, Loss: 2.746966073513031 steps without improvement: 1 best accuracy: 0.688
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 9, Loss: 2.6959286546707153 steps without improvement: 0 best accuracy: 0.6935
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.57it/s]


Epoch 10, Loss: 2.6529890584945677 steps without improvement: 0 best accuracy: 0.7005
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 11, Loss: 2.598414648771286 steps without improvement: 0 best accuracy: 0.7107
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 12, Loss: 2.3689344650506974 steps without improvement: 0 best accuracy: 0.7633
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 13, Loss: 1.8685075062513352 steps without improvement: 0 best accuracy: 0.7895
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 14, Loss: 1.8140530931949614 steps without improvement: 1 best accuracy: 0.7895
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.14it/s]

Epoch 15, Loss: 1.7963988876342774 steps without improvement: 0 best accuracy: 0.7906
[SYST] Epoch 15



100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.30it/s]


Epoch 16, Loss: 1.782979862689972 steps without improvement: 0 best accuracy: 0.7933
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 17, Loss: 1.77082559466362 steps without improvement: 1 best accuracy: 0.7933
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 18, Loss: 1.7606956696510314 steps without improvement: 0 best accuracy: 0.7961
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 19, Loss: 1.7519265377521516 steps without improvement: 1 best accuracy: 0.7961
[SYST] Epoch 19


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 20, Loss: 1.7449208885431289 steps without improvement: 2 best accuracy: 0.7961
[SYST] Epoch 20


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 21, Loss: 1.7397617316246032 steps without improvement: 0 best accuracy: 0.799
[SYST] Epoch 21


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 22, Loss: 1.7359230303764344 steps without improvement: 1 best accuracy: 0.799
[SYST] Epoch 22


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 23, Loss: 1.7327915287017823 steps without improvement: 2 best accuracy: 0.799
[SYST] Epoch 23


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.15it/s]

Epoch 24, Loss: 1.7303430324792861 steps without improvement: 3 best accuracy: 0.799
[SYST] Epoch 24



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]

Test Accuracy: 80.28%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9718.75it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10089.54it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10263.34it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 53133.00it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66500.25it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67092.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 1, Loss: 9.629632024765014 steps without improvement: 0 best accuracy: 0.5408
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 2, Loss: 7.521401348114014 steps without improvement: 0 best accuracy: 0.5595
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 3, Loss: 6.478103744983673 steps without improvement: 0 best accuracy: 0.6143
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 4, Loss: 4.990121724605561 steps without improvement: 0 best accuracy: 0.6371
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 5, Loss: 4.096939636468887 steps without improvement: 0 best accuracy: 0.6522
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 6, Loss: 3.805754140615463 steps without improvement: 0 best accuracy: 0.6558
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 7, Loss: 3.7005825746059418 steps without improvement: 0 best accuracy: 0.6576
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 8, Loss: 3.6346367454528807 steps without improvement: 1 best accuracy: 0.6576
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 9, Loss: 3.6071725392341616 steps without improvement: 2 best accuracy: 0.6576
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.61it/s]


Epoch 10, Loss: 3.604030590057373 steps without improvement: 3 best accuracy: 0.6576
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.70it/s]


Test Accuracy: 65.65%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:14<00:00, 9503.19it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9960.40it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10107.64it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 54759.25it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67293.73it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67666.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 1, Loss: 7.575023257732392 steps without improvement: 0 best accuracy: 0.587
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 2, Loss: 6.561447243690491 steps without improvement: 0 best accuracy: 0.6414
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 3, Loss: 5.691814949512482 steps without improvement: 0 best accuracy: 0.6557
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 4, Loss: 5.43463020324707 steps without improvement: 0 best accuracy: 0.6672
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 5, Loss: 5.362482852935791 steps without improvement: 1 best accuracy: 0.6672
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 6, Loss: 5.34188529253006 steps without improvement: 2 best accuracy: 0.6672
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 7, Loss: 5.338404834270477 steps without improvement: 3 best accuracy: 0.6672
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.36it/s]

Test Accuracy: 65.89%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9672.41it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10033.62it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10112.10it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52766.58it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64675.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64509.49it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 1, Loss: 8.961396307945252 steps without improvement: 0 best accuracy: 0.6124
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 2, Loss: 5.281181769371033 steps without improvement: 0 best accuracy: 0.6427
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.16it/s]

Epoch 3, Loss: 5.0171309852600094 steps without improvement: 0 best accuracy: 0.654
[SYST] Epoch 3



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.34it/s]


Epoch 4, Loss: 4.916043782234192 steps without improvement: 0 best accuracy: 0.6632
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.18it/s]

Epoch 5, Loss: 4.774656260013581 steps without improvement: 0 best accuracy: 0.6885
[SYST] Epoch 5



100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 6, Loss: 4.5333950281143185 steps without improvement: 1 best accuracy: 0.6885
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 7, Loss: 4.44699746966362 steps without improvement: 2 best accuracy: 0.6885
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.65it/s]


Epoch 8, Loss: 4.404252328872681 steps without improvement: 0 best accuracy: 0.691
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.08it/s]


Epoch 9, Loss: 4.379927775859833 steps without improvement: 0 best accuracy: 0.6916
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 10, Loss: 4.366565113067627 steps without improvement: 1 best accuracy: 0.6916
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.35it/s]


Epoch 11, Loss: 4.355433163642883 steps without improvement: 0 best accuracy: 0.6929
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 12, Loss: 4.347878475189209 steps without improvement: 1 best accuracy: 0.6929
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 13, Loss: 4.343358938694 steps without improvement: 2 best accuracy: 0.6929
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 14, Loss: 4.339952272176743 steps without improvement: 3 best accuracy: 0.6929
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]

Test Accuracy: 68.81%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9590.53it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10047.72it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10197.68it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 54136.44it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64683.69it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66109.19it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.73it/s]


Epoch 1, Loss: 8.761069555282592 steps without improvement: 0 best accuracy: 0.6016
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 2, Loss: 7.066730115413666 steps without improvement: 0 best accuracy: 0.653
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 3, Loss: 6.679448857307434 steps without improvement: 0 best accuracy: 0.673
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 4, Loss: 6.377182846069336 steps without improvement: 0 best accuracy: 0.6859
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 5, Loss: 6.100056965351104 steps without improvement: 0 best accuracy: 0.6911
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 6, Loss: 5.769276554584503 steps without improvement: 0 best accuracy: 0.6978
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 7, Loss: 5.53819810628891 steps without improvement: 1 best accuracy: 0.6978
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.67it/s]


Epoch 8, Loss: 5.466513032913208 steps without improvement: 0 best accuracy: 0.6979
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 9, Loss: 5.4462856936454775 steps without improvement: 1 best accuracy: 0.6979
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 10, Loss: 5.434052357673645 steps without improvement: 0 best accuracy: 0.6983
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 11, Loss: 5.425255086421966 steps without improvement: 1 best accuracy: 0.6983
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 12, Loss: 5.423298864364624 steps without improvement: 2 best accuracy: 0.6983
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 13, Loss: 5.422003021240235 steps without improvement: 3 best accuracy: 0.6983
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.35it/s]

Test Accuracy: 69.65%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9583.37it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9952.49it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10089.04it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 54100.16it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67107.58it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67405.88it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 1, Loss: 8.622099480628968 steps without improvement: 0 best accuracy: 0.5715
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.91it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.30it/s]


Epoch 2, Loss: 7.476898949146271 steps without improvement: 0 best accuracy: 0.6178
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 3, Loss: 6.8849741649627685 steps without improvement: 0 best accuracy: 0.6828
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 4, Loss: 6.635372321605683 steps without improvement: 0 best accuracy: 0.6846
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.65it/s]


Epoch 5, Loss: 6.551348507404327 steps without improvement: 0 best accuracy: 0.687
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.14it/s]


Epoch 6, Loss: 6.520719888210297 steps without improvement: 1 best accuracy: 0.687
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.61it/s]


Epoch 7, Loss: 6.513079240322113 steps without improvement: 0 best accuracy: 0.6884
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 8, Loss: 6.512624826431274 steps without improvement: 1 best accuracy: 0.6884
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.11it/s]


Epoch 9, Loss: 6.512281022071838 steps without improvement: 2 best accuracy: 0.6884
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 10, Loss: 6.512103478908539 steps without improvement: 3 best accuracy: 0.6884
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]


Epoch 11, Loss: 6.51215224981308 steps without improvement: 0 best accuracy: 0.6887
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.15it/s]

Epoch 12, Loss: 6.512071008682251 steps without improvement: 1 best accuracy: 0.6887
[SYST] Epoch 12



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 13, Loss: 6.51210147857666 steps without improvement: 2 best accuracy: 0.6887
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.44it/s]


Epoch 14, Loss: 6.512310929298401 steps without improvement: 3 best accuracy: 0.6887
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.05it/s]


Epoch 15, Loss: 6.511975681781768 steps without improvement: 0 best accuracy: 0.6889
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.08it/s]


Epoch 16, Loss: 6.512358231544495 steps without improvement: 1 best accuracy: 0.6889
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.70it/s]


Epoch 17, Loss: 6.512652781009674 steps without improvement: 2 best accuracy: 0.6889
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 18, Loss: 6.512091443538666 steps without improvement: 3 best accuracy: 0.6889
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.46it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.31it/s]

Test Accuracy: 68.60%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9605.82it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9999.97it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10138.80it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51984.63it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64476.07it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64627.68it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 1, Loss: 7.708980307579041 steps without improvement: 0 best accuracy: 0.5166
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.12it/s]


Epoch 2, Loss: 7.448921132087707 steps without improvement: 1 best accuracy: 0.5166
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 3, Loss: 7.440909998416901 steps without improvement: 2 best accuracy: 0.5166
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 4, Loss: 7.4395491933822635 steps without improvement: 3 best accuracy: 0.5166
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Test Accuracy: 50.17%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9661.29it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10066.01it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10192.09it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52645.44it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67174.64it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65569.30it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.96it/s]


Epoch 1, Loss: 7.996958115100861 steps without improvement: 0 best accuracy: 0.4915
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.32it/s]


Epoch 2, Loss: 7.464800386428833 steps without improvement: 1 best accuracy: 0.4915
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 3, Loss: 7.459352648258209 steps without improvement: 2 best accuracy: 0.4915
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.32it/s]


Epoch 4, Loss: 7.458200027942658 steps without improvement: 3 best accuracy: 0.4915
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]

Test Accuracy: 50.08%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9645.74it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10004.04it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10148.91it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53783.62it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66653.06it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66187.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 1, Loss: 7.76609171628952 steps without improvement: 0 best accuracy: 0.5161
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 2, Loss: 7.450063333511353 steps without improvement: 1 best accuracy: 0.5161
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 3, Loss: 7.409111065864563 steps without improvement: 2 best accuracy: 0.5161
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 4, Loss: 7.40571031332016 steps without improvement: 0 best accuracy: 0.5162
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 5, Loss: 7.403938443660736 steps without improvement: 1 best accuracy: 0.5162
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 6, Loss: 7.403288331031799 steps without improvement: 0 best accuracy: 0.5168
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 7, Loss: 7.402669579982757 steps without improvement: 1 best accuracy: 0.5168
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 8, Loss: 7.402074563503265 steps without improvement: 2 best accuracy: 0.5168
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 9, Loss: 7.401841878890991 steps without improvement: 3 best accuracy: 0.5168
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]

Test Accuracy: 50.02%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49184.91it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 49157.15it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:07<00:00,  8.06it/s]


Epoch 1, Loss: 0.3829079825345616 steps without improvement: 21 best accuracy: 0.9963


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.07it/s]


Epoch 2, Loss: 0.007270847955396675 steps without improvement: 10 best accuracy: 0.9993


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 3, Loss: 0.00264796435885728 steps without improvement: 145 best accuracy: 0.9997


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 4, Loss: 0.0014702391096932388 steps without improvement: 689 best accuracy: 0.9998


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 5, Loss: 0.0010022707635641837 steps without improvement: 240 best accuracy: 1.0


 77%|█████████████████████████████████████████▎            | 784/1024 [01:36<00:29,  8.09it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 49072.43it/s]
100%|████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 101.76it/s]


Test Accuracy: 0.9997
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9655.51it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10110.24it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10288.30it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51643.31it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63557.76it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64107.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 1, Loss: 4.777696814239025 steps without improvement: 0 best accuracy: 0.9011
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 2, Loss: 0.3672557469457388 steps without improvement: 0 best accuracy: 0.9343
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.06it/s]


Epoch 3, Loss: 0.22805313661694526 steps without improvement: 0 best accuracy: 0.9454
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 4, Loss: 0.19398615702986718 steps without improvement: 0 best accuracy: 0.9514
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 5, Loss: 0.17069947689771653 steps without improvement: 0 best accuracy: 0.9555
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 6, Loss: 0.14914667751640082 steps without improvement: 0 best accuracy: 0.9575
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 7, Loss: 0.12768175899982454 steps without improvement: 0 best accuracy: 0.9608
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 8, Loss: 0.10928185749799013 steps without improvement: 0 best accuracy: 0.9654
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 9, Loss: 0.09697143249213695 steps without improvement: 0 best accuracy: 0.9678
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 10, Loss: 0.09022000845521688 steps without improvement: 0 best accuracy: 0.9696
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 11, Loss: 0.08691117335110903 steps without improvement: 0 best accuracy: 0.9697
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 12, Loss: 0.0852424667775631 steps without improvement: 0 best accuracy: 0.9702
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 13, Loss: 0.08424741879105568 steps without improvement: 0 best accuracy: 0.9703
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.88it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 14, Loss: 0.08353748045861721 steps without improvement: 0 best accuracy: 0.9704
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]


Epoch 15, Loss: 0.08284684479236602 steps without improvement: 0 best accuracy: 0.971
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.52it/s]


Epoch 16, Loss: 0.08235701993107795 steps without improvement: 1 best accuracy: 0.971
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 17, Loss: 0.0817738127335906 steps without improvement: 2 best accuracy: 0.971
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 18, Loss: 0.08122352780774236 steps without improvement: 3 best accuracy: 0.971
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 19, Loss: 0.08078485440462828 steps without improvement: 0 best accuracy: 0.9717
[SYST] Epoch 19


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 20, Loss: 0.08014644764363765 steps without improvement: 0 best accuracy: 0.9718
[SYST] Epoch 20


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.60it/s]


Epoch 21, Loss: 0.07963215000927448 steps without improvement: 1 best accuracy: 0.9718
[SYST] Epoch 21


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 22, Loss: 0.07913661640137434 steps without improvement: 0 best accuracy: 0.9721
[SYST] Epoch 22


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 23, Loss: 0.07861183235421777 steps without improvement: 1 best accuracy: 0.9721
[SYST] Epoch 23


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 24, Loss: 0.07813398744910956 steps without improvement: 2 best accuracy: 0.9721
[SYST] Epoch 24


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.10it/s]


Epoch 25, Loss: 0.07761285556480288 steps without improvement: 0 best accuracy: 0.9723
[SYST] Epoch 25


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 26, Loss: 0.07712175076827407 steps without improvement: 0 best accuracy: 0.9729
[SYST] Epoch 26


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 27, Loss: 0.07674254298210144 steps without improvement: 1 best accuracy: 0.9729
[SYST] Epoch 27


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 28, Loss: 0.0763097818940878 steps without improvement: 0 best accuracy: 0.9735
[SYST] Epoch 28


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.66it/s]


Epoch 29, Loss: 0.07590799462050199 steps without improvement: 1 best accuracy: 0.9735
[SYST] Epoch 29


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.12it/s]


Epoch 30, Loss: 0.0754870504885912 steps without improvement: 0 best accuracy: 0.9737
[SYST] Epoch 30


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 31, Loss: 0.07511318227276206 steps without improvement: 1 best accuracy: 0.9737
[SYST] Epoch 31


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.88it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 32, Loss: 0.07482864994555712 steps without improvement: 2 best accuracy: 0.9737
[SYST] Epoch 32


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.13it/s]


Epoch 33, Loss: 0.07451965291053057 steps without improvement: 3 best accuracy: 0.9737
[SYST] Epoch 33


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]

Test Accuracy: 97.57%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9753.22it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10054.83it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10250.64it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48450.31it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66038.62it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66263.87it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.48it/s]


Epoch 1, Loss: 5.1190258547663685 steps without improvement: 0 best accuracy: 0.87
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 2, Loss: 0.4702176256477833 steps without improvement: 0 best accuracy: 0.9198
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 3, Loss: 0.4229914577305317 steps without improvement: 0 best accuracy: 0.9212
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.67it/s]


Epoch 4, Loss: 0.41361273676156995 steps without improvement: 1 best accuracy: 0.9212
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 5, Loss: 0.40670098513364794 steps without improvement: 2 best accuracy: 0.9212
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 6, Loss: 0.3989629854261875 steps without improvement: 3 best accuracy: 0.9212
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.16it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.35it/s]

Test Accuracy: 92.43%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:09<00:00, 9869.08it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3639.76it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10256.62it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52704.05it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67843.31it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67884.81it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 1, Loss: 6.278339999914169 steps without improvement: 0 best accuracy: 0.789
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 2, Loss: 0.9016794076561928 steps without improvement: 0 best accuracy: 0.9025
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.66it/s]


Epoch 3, Loss: 0.43321806743741037 steps without improvement: 0 best accuracy: 0.9129
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.99it/s]


Epoch 4, Loss: 0.41932626396417616 steps without improvement: 0 best accuracy: 0.9155
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 5, Loss: 0.4164471960067749 steps without improvement: 0 best accuracy: 0.9171
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 6, Loss: 0.41588187143206595 steps without improvement: 1 best accuracy: 0.9171
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.03it/s]


Epoch 7, Loss: 0.4158598445355892 steps without improvement: 2 best accuracy: 0.9171
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 8, Loss: 0.4159961384534836 steps without improvement: 3 best accuracy: 0.9171
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.14it/s]

Epoch 9, Loss: 0.4158894807100296 steps without improvement: 0 best accuracy: 0.9175
[SYST] Epoch 9



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 10, Loss: 0.4158953163027763 steps without improvement: 1 best accuracy: 0.9175
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 11, Loss: 0.4159031054377556 steps without improvement: 2 best accuracy: 0.9175
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.12it/s]

Epoch 12, Loss: 0.41583688437938693 steps without improvement: 3 best accuracy: 0.9175
[SYST] Epoch 12



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]

Test Accuracy: 92.38%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9725.36it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10041.64it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10167.14it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51574.20it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63860.66it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63574.14it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 1, Loss: 5.689821922779084 steps without improvement: 0 best accuracy: 0.692
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 2, Loss: 4.968294570446014 steps without improvement: 0 best accuracy: 0.7335
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.35it/s]


Epoch 3, Loss: 4.818864145278931 steps without improvement: 0 best accuracy: 0.737
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 4, Loss: 4.791916828155518 steps without improvement: 1 best accuracy: 0.737
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 5, Loss: 4.777547426223755 steps without improvement: 2 best accuracy: 0.737
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 6, Loss: 4.7677834033966064 steps without improvement: 3 best accuracy: 0.737
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]

Test Accuracy: 73.58%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9620.14it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10039.38it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10190.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53453.49it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65785.47it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65770.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.65it/s]


Epoch 1, Loss: 6.997897498607635 steps without improvement: 0 best accuracy: 0.7035
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.48it/s]


Epoch 2, Loss: 5.117665119171143 steps without improvement: 0 best accuracy: 0.7128
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.70it/s]


Epoch 3, Loss: 4.912710475921631 steps without improvement: 0 best accuracy: 0.7163
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.70it/s]


Epoch 4, Loss: 4.885422518253327 steps without improvement: 0 best accuracy: 0.7206
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 5, Loss: 4.872368078231812 steps without improvement: 1 best accuracy: 0.7206
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.25it/s]


Epoch 6, Loss: 4.864073674678803 steps without improvement: 2 best accuracy: 0.7206
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 7, Loss: 4.857869775295257 steps without improvement: 3 best accuracy: 0.7206
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.26it/s]

Test Accuracy: 71.80%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:14<00:00, 9541.15it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10022.49it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10201.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53475.24it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67874.93it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67271.72it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.59it/s]


Epoch 1, Loss: 8.289514164924622 steps without improvement: 0 best accuracy: 0.6675
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 2, Loss: 6.019398367404937 steps without improvement: 0 best accuracy: 0.7332
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 3, Loss: 5.311966724395752 steps without improvement: 1 best accuracy: 0.7332
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 4, Loss: 5.241989781856537 steps without improvement: 2 best accuracy: 0.7332
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 5, Loss: 5.239463701248169 steps without improvement: 0 best accuracy: 0.7343
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 6, Loss: 5.239815270900726 steps without improvement: 1 best accuracy: 0.7343
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 7, Loss: 5.239502120018005 steps without improvement: 2 best accuracy: 0.7343
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 8, Loss: 5.239819347858429 steps without improvement: 3 best accuracy: 0.7343
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.63it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]

Test Accuracy: 72.92%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9675.34it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10033.50it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10165.36it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51871.76it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63691.73it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63378.36it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.97it/s]


Epoch 1, Loss: 7.737223799228668 steps without improvement: 0 best accuracy: 0.5066
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.44it/s]


Epoch 2, Loss: 7.695889477729797 steps without improvement: 1 best accuracy: 0.5066
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 11.01it/s]


Epoch 3, Loss: 7.695225336551666 steps without improvement: 0 best accuracy: 0.5137
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 11.00it/s]


Epoch 4, Loss: 7.695472404956818 steps without improvement: 1 best accuracy: 0.5137
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 5, Loss: 7.69523345708847 steps without improvement: 2 best accuracy: 0.5137
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 6, Loss: 7.695162801742554 steps without improvement: 3 best accuracy: 0.5137
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 11.03it/s]


Epoch 7, Loss: 7.69490644454956 steps without improvement: 0 best accuracy: 0.5178
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 8, Loss: 7.695482611656189 steps without improvement: 1 best accuracy: 0.5178
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.98it/s]


Epoch 9, Loss: 7.6945090675354 steps without improvement: 2 best accuracy: 0.5178
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 10, Loss: 7.694834938049317 steps without improvement: 3 best accuracy: 0.5178
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]

Test Accuracy: 51.96%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9615.90it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9998.40it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10113.76it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52556.63it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67327.87it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66097.73it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 1, Loss: 8.038079805374146 steps without improvement: 0 best accuracy: 0.5181
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.57it/s]


Epoch 2, Loss: 7.723173675537109 steps without improvement: 1 best accuracy: 0.5181
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]


Epoch 3, Loss: 7.717358629703522 steps without improvement: 2 best accuracy: 0.5181
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.66it/s]


Epoch 4, Loss: 7.715938918590545 steps without improvement: 3 best accuracy: 0.5181
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]

Test Accuracy: 50.38%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9664.47it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10023.61it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10168.80it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 54029.56it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66764.04it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66237.50it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 1, Loss: 8.013012399673462 steps without improvement: 0 best accuracy: 0.5109
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.04it/s]


Epoch 2, Loss: 7.713549599647522 steps without improvement: 1 best accuracy: 0.5109
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 3, Loss: 7.709605510234833 steps without improvement: 2 best accuracy: 0.5109
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 4, Loss: 7.709106078147888 steps without improvement: 0 best accuracy: 0.5131
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 5, Loss: 7.709064607620239 steps without improvement: 1 best accuracy: 0.5131
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 6, Loss: 7.708734290599823 steps without improvement: 2 best accuracy: 0.5131
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 7, Loss: 7.708456664085388 steps without improvement: 3 best accuracy: 0.5131
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]

Test Accuracy: 51.58%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49032.94it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48400.43it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:07<00:00,  8.03it/s]


Epoch 1, Loss: 0.4622937066233135 steps without improvement: 7 best accuracy: 0.9619


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.07it/s]


Epoch 2, Loss: 0.0500222697010031 steps without improvement: 34 best accuracy: 0.9954


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 3, Loss: 0.012864443381431556 steps without improvement: 147 best accuracy: 0.9982


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 4, Loss: 0.0061901119922822545 steps without improvement: 299 best accuracy: 0.999


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 5, Loss: 0.003945571593533259 steps without improvement: 2 best accuracy: 0.9995


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 6, Loss: 0.0028210336252811885 steps without improvement: 390 best accuracy: 0.9998


 62%|█████████████████████████████████▍                    | 634/1024 [01:18<00:48,  8.08it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48658.61it/s]
100%|████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 101.53it/s]


Test Accuracy: 0.9993
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:14<00:00, 9508.93it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10015.98it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10140.23it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 50776.89it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 61919.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64075.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 1, Loss: 4.600409784317017 steps without improvement: 0 best accuracy: 0.7714
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 2, Loss: 1.0791578382253646 steps without improvement: 0 best accuracy: 0.8346
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 3, Loss: 0.72123097717762 steps without improvement: 0 best accuracy: 0.8681
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.20it/s]


Epoch 4, Loss: 0.43032848939299584 steps without improvement: 0 best accuracy: 0.9118
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 5, Loss: 0.277386384755373 steps without improvement: 0 best accuracy: 0.929
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 6, Loss: 0.20657669365406037 steps without improvement: 0 best accuracy: 0.9412
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.70it/s]


Epoch 7, Loss: 0.17332869544625282 steps without improvement: 0 best accuracy: 0.9447
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.98it/s]


Epoch 8, Loss: 0.1550634092092514 steps without improvement: 0 best accuracy: 0.9502
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]


Epoch 9, Loss: 0.14285751845687628 steps without improvement: 0 best accuracy: 0.9539
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 10, Loss: 0.1343469024822116 steps without improvement: 0 best accuracy: 0.9546
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.64it/s]


Epoch 11, Loss: 0.12826319999992847 steps without improvement: 0 best accuracy: 0.957
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 12, Loss: 0.12367461692541838 steps without improvement: 0 best accuracy: 0.9583
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.98it/s]


Epoch 13, Loss: 0.11891602009534835 steps without improvement: 0 best accuracy: 0.9597
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.73it/s]


Epoch 14, Loss: 0.11416248727589845 steps without improvement: 0 best accuracy: 0.96
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 15, Loss: 0.11130558915436267 steps without improvement: 0 best accuracy: 0.9605
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 16, Loss: 0.109577342197299 steps without improvement: 0 best accuracy: 0.9617
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 17, Loss: 0.10795197401195765 steps without improvement: 0 best accuracy: 0.962
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 18, Loss: 0.10691682629287243 steps without improvement: 0 best accuracy: 0.9623
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.72it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 19, Loss: 0.10550270833075047 steps without improvement: 0 best accuracy: 0.9628
[SYST] Epoch 19


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 20, Loss: 0.10430113084614277 steps without improvement: 0 best accuracy: 0.9638
[SYST] Epoch 20


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 21, Loss: 0.10342151459306478 steps without improvement: 1 best accuracy: 0.9638
[SYST] Epoch 21


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.73it/s]


Epoch 22, Loss: 0.1025334932655096 steps without improvement: 2 best accuracy: 0.9638
[SYST] Epoch 22


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 23, Loss: 0.10162862211465835 steps without improvement: 0 best accuracy: 0.964
[SYST] Epoch 23


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.65it/s]


Epoch 24, Loss: 0.10085945278406143 steps without improvement: 0 best accuracy: 0.9646
[SYST] Epoch 24


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 25, Loss: 0.10012233596295118 steps without improvement: 0 best accuracy: 0.9651
[SYST] Epoch 25


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 26, Loss: 0.09917166702449322 steps without improvement: 1 best accuracy: 0.9651
[SYST] Epoch 26


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 27, Loss: 0.09841023914515973 steps without improvement: 2 best accuracy: 0.9651
[SYST] Epoch 27


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 28, Loss: 0.09800266169011593 steps without improvement: 0 best accuracy: 0.9653
[SYST] Epoch 28


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 29, Loss: 0.09739411283284426 steps without improvement: 0 best accuracy: 0.9661
[SYST] Epoch 29


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.92it/s]


Epoch 30, Loss: 0.09653581447899341 steps without improvement: 0 best accuracy: 0.968
[SYST] Epoch 30


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.07it/s]


Epoch 31, Loss: 0.09612284686416388 steps without improvement: 1 best accuracy: 0.968
[SYST] Epoch 31


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 32, Loss: 0.09543346390128135 steps without improvement: 2 best accuracy: 0.968
[SYST] Epoch 32


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.05it/s]


Epoch 33, Loss: 0.09490275096148253 steps without improvement: 0 best accuracy: 0.9685
[SYST] Epoch 33


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.11it/s]


Epoch 34, Loss: 0.09415028985589742 steps without improvement: 1 best accuracy: 0.9685
[SYST] Epoch 34


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 35, Loss: 0.09374891098588706 steps without improvement: 2 best accuracy: 0.9685
[SYST] Epoch 35


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.05it/s]


Epoch 36, Loss: 0.09333765033632517 steps without improvement: 3 best accuracy: 0.9685
[SYST] Epoch 36


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.12it/s]

Test Accuracy: 96.62%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9734.85it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10028.54it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10154.57it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48505.64it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66249.84it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66855.67it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.51it/s]


Epoch 1, Loss: 6.702022082805634 steps without improvement: 0 best accuracy: 0.7154
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 2, Loss: 1.9430412316322327 steps without improvement: 0 best accuracy: 0.8304
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 3, Loss: 1.2056769627332686 steps without improvement: 0 best accuracy: 0.8375
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 4, Loss: 1.118635711967945 steps without improvement: 0 best accuracy: 0.8445
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 5, Loss: 0.9720147797465324 steps without improvement: 0 best accuracy: 0.8643
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 6, Loss: 0.8142478135228157 steps without improvement: 0 best accuracy: 0.8708
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.15it/s]

Epoch 7, Loss: 0.7820764896273613 steps without improvement: 0 best accuracy: 0.8719
[SYST] Epoch 7



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 8, Loss: 0.77008723706007 steps without improvement: 0 best accuracy: 0.8726
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 9, Loss: 0.764779018163681 steps without improvement: 0 best accuracy: 0.8741
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 10, Loss: 0.7624323973059655 steps without improvement: 1 best accuracy: 0.8741
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.16it/s]

Epoch 11, Loss: 0.7611610069870949 steps without improvement: 2 best accuracy: 0.8741
[SYST] Epoch 11



100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 12, Loss: 0.7607532453536987 steps without improvement: 3 best accuracy: 0.8741
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.65it/s]


Test Accuracy: 87.01%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9695.00it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10040.80it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10193.05it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 53266.05it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66522.30it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66454.63it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 1, Loss: 5.478859246969223 steps without improvement: 0 best accuracy: 0.7636
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 2, Loss: 1.9798621064424515 steps without improvement: 0 best accuracy: 0.825
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.20it/s]

Epoch 3, Loss: 1.5340587443113327 steps without improvement: 0 best accuracy: 0.8309
[SYST] Epoch 3



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 4, Loss: 1.5063412684202193 steps without improvement: 0 best accuracy: 0.8324
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 5, Loss: 1.5050343036651612 steps without improvement: 0 best accuracy: 0.8332
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 6, Loss: 1.5050321912765503 steps without improvement: 1 best accuracy: 0.8332
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 7, Loss: 1.505085511803627 steps without improvement: 2 best accuracy: 0.8332
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 8, Loss: 1.5052570801973344 steps without improvement: 0 best accuracy: 0.8341
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.26it/s]


Epoch 9, Loss: 1.5050054454803468 steps without improvement: 1 best accuracy: 0.8341
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 10, Loss: 1.5050575160980224 steps without improvement: 2 best accuracy: 0.8341
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 11, Loss: 1.505510475039482 steps without improvement: 3 best accuracy: 0.8341
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]

Test Accuracy: 83.02%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9757.76it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10024.07it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10202.17it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47071.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 62981.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63654.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 1, Loss: 6.951513624191284 steps without improvement: 0 best accuracy: 0.4926
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.10it/s]


Epoch 2, Loss: 5.856667931079865 steps without improvement: 0 best accuracy: 0.4942
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.39it/s]


Epoch 3, Loss: 5.512958054542541 steps without improvement: 1 best accuracy: 0.4942
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 4, Loss: 5.428116025924683 steps without improvement: 0 best accuracy: 0.498
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 5, Loss: 5.398738920688629 steps without improvement: 1 best accuracy: 0.498
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 6, Loss: 5.384342927932739 steps without improvement: 2 best accuracy: 0.498
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 7, Loss: 5.374040954113006 steps without improvement: 3 best accuracy: 0.498
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.51it/s]

Test Accuracy: 49.04%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:09<00:00, 9849.12it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10116.74it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10246.89it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48383.35it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66588.30it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67471.59it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.95it/s]


Epoch 1, Loss: 6.675091605186463 steps without improvement: 0 best accuracy: 0.5168
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 2, Loss: 6.004453408718109 steps without improvement: 1 best accuracy: 0.5168
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.38it/s]


Epoch 3, Loss: 5.777356743812561 steps without improvement: 2 best accuracy: 0.5168
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 4, Loss: 5.640445756912231 steps without improvement: 3 best accuracy: 0.5168
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.54it/s]


Test Accuracy: 52.40%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9679.20it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10028.93it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10182.92it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52968.57it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67703.24it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66706.81it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 1, Loss: 7.138830168247223 steps without improvement: 0 best accuracy: 0.495
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 2, Loss: 6.720077192783355 steps without improvement: 0 best accuracy: 0.5065
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 3, Loss: 6.596942777633667 steps without improvement: 0 best accuracy: 0.5075
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 4, Loss: 6.51814712524414 steps without improvement: 1 best accuracy: 0.5075
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.24it/s]


Epoch 5, Loss: 6.471509263515473 steps without improvement: 2 best accuracy: 0.5075
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 6, Loss: 6.449933617115021 steps without improvement: 0 best accuracy: 0.5162
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.73it/s]


Epoch 7, Loss: 6.439114305973053 steps without improvement: 1 best accuracy: 0.5162
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 8, Loss: 6.43523078918457 steps without improvement: 2 best accuracy: 0.5162
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 9, Loss: 6.4325718545913695 steps without improvement: 3 best accuracy: 0.5162
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Test Accuracy: 51.85%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9796.22it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3616.85it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10251.76it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 50604.96it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63645.72it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63344.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 11.05it/s]


Epoch 1, Loss: 5.893180358409881 steps without improvement: 0 best accuracy: 0.5114
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.09it/s]


Epoch 2, Loss: 5.863164350986481 steps without improvement: 1 best accuracy: 0.5114
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.14it/s]


Epoch 3, Loss: 5.861281049251557 steps without improvement: 2 best accuracy: 0.5114
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.57it/s]


Epoch 4, Loss: 5.861097183227539 steps without improvement: 3 best accuracy: 0.5114
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.41it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.98it/s]

Test Accuracy: 51.38%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9761.07it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10121.75it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10273.87it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48415.21it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65905.69it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66726.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 1, Loss: 6.148052966594696 steps without improvement: 0 best accuracy: 0.4854
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 2, Loss: 5.8770284390449525 steps without improvement: 0 best accuracy: 0.4928
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 3, Loss: 5.875715324878692 steps without improvement: 1 best accuracy: 0.4928
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.07it/s]


Epoch 4, Loss: 5.875136494636536 steps without improvement: 0 best accuracy: 0.4947
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 5, Loss: 5.874602797031403 steps without improvement: 0 best accuracy: 0.496
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 6, Loss: 5.874343247413635 steps without improvement: 0 best accuracy: 0.4976
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 7, Loss: 5.87437153339386 steps without improvement: 0 best accuracy: 0.4994
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 8, Loss: 5.874562523365021 steps without improvement: 1 best accuracy: 0.4994
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 9, Loss: 5.87420871257782 steps without improvement: 2 best accuracy: 0.4994
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 10, Loss: 5.8741504359245305 steps without improvement: 3 best accuracy: 0.4994
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.40it/s]


Test Accuracy: 50.42%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9788.17it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10030.41it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10182.34it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48851.15it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 68283.67it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 68337.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.66it/s]


Epoch 1, Loss: 6.598946990966797 steps without improvement: 0 best accuracy: 0.4699
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 2, Loss: 5.89426084280014 steps without improvement: 0 best accuracy: 0.4953
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.13it/s]

Epoch 3, Loss: 5.873116383552551 steps without improvement: 0 best accuracy: 0.5014
[SYST] Epoch 3



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 4, Loss: 5.87036967754364 steps without improvement: 1 best accuracy: 0.5014
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 5, Loss: 5.869609823226929 steps without improvement: 0 best accuracy: 0.5044
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 6, Loss: 5.869307582378387 steps without improvement: 1 best accuracy: 0.5044
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 7, Loss: 5.868976857662201 steps without improvement: 2 best accuracy: 0.5044
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 8, Loss: 5.868787395954132 steps without improvement: 3 best accuracy: 0.5044
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]

Test Accuracy: 50.84%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49258.77it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48979.65it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:04<00:00,  8.25it/s]


Epoch 1, Loss: 0.441668414256128 steps without improvement: 6 best accuracy: 0.9687


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 2, Loss: 0.05055013195669744 steps without improvement: 15 best accuracy: 0.9924


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.07it/s]


Epoch 3, Loss: 0.01977632786247341 steps without improvement: 56 best accuracy: 0.9971


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.07it/s]


Epoch 4, Loss: 0.012137128655922425 steps without improvement: 134 best accuracy: 0.9985


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 5, Loss: 0.008451521570577825 steps without improvement: 221 best accuracy: 0.9993


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 6, Loss: 0.005777720553169274 steps without improvement: 781 best accuracy: 0.9994


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 7, Loss: 0.004404277674780133 steps without improvement: 414 best accuracy: 0.9996


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 8, Loss: 0.0035777266985803635 steps without improvement: 472 best accuracy: 0.9997


 54%|█████████████████████████████                         | 552/1024 [01:08<00:58,  8.08it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48287.71it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 52.33it/s]


Test Accuracy: 0.9995
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9653.51it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10050.67it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3674.83it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 51089.59it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65713.84it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65203.67it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 1, Loss: 8.176563091278076 steps without improvement: 0 best accuracy: 0.6718
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 2, Loss: 2.685341619849205 steps without improvement: 0 best accuracy: 0.7551
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.01it/s]


Epoch 3, Loss: 1.2956780365109444 steps without improvement: 0 best accuracy: 0.8147
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.28it/s]


Epoch 4, Loss: 0.8754726439714432 steps without improvement: 0 best accuracy: 0.8337
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 5, Loss: 0.7432867342233658 steps without improvement: 0 best accuracy: 0.8493
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 6, Loss: 0.6506354349851609 steps without improvement: 0 best accuracy: 0.8597
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 7, Loss: 0.5929221954941749 steps without improvement: 0 best accuracy: 0.8679
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 8, Loss: 0.564752916097641 steps without improvement: 0 best accuracy: 0.8727
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 9, Loss: 0.5510718184709549 steps without improvement: 0 best accuracy: 0.8762
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 10, Loss: 0.5420163787901402 steps without improvement: 0 best accuracy: 0.8767
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.44it/s]


Epoch 11, Loss: 0.5337438294291497 steps without improvement: 1 best accuracy: 0.8767
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.61it/s]


Epoch 12, Loss: 0.5259785738587379 steps without improvement: 0 best accuracy: 0.8826
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 13, Loss: 0.5182053701579571 steps without improvement: 0 best accuracy: 0.8833
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.70it/s]


Epoch 14, Loss: 0.5101883456110954 steps without improvement: 0 best accuracy: 0.8865
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 15, Loss: 0.5023895339667797 steps without improvement: 0 best accuracy: 0.8875
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 16, Loss: 0.4954578784108162 steps without improvement: 0 best accuracy: 0.8894
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 17, Loss: 0.49006834894418716 steps without improvement: 0 best accuracy: 0.8896
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 18, Loss: 0.48556291192770007 steps without improvement: 0 best accuracy: 0.8898
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 19, Loss: 0.48291846096515656 steps without improvement: 0 best accuracy: 0.8916
[SYST] Epoch 19


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 20, Loss: 0.48007155537605284 steps without improvement: 0 best accuracy: 0.8931
[SYST] Epoch 20


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 21, Loss: 0.4788533815741539 steps without improvement: 1 best accuracy: 0.8931
[SYST] Epoch 21


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 22, Loss: 0.47727723732590677 steps without improvement: 0 best accuracy: 0.8941
[SYST] Epoch 22


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 23, Loss: 0.47650671675801276 steps without improvement: 1 best accuracy: 0.8941
[SYST] Epoch 23


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 24, Loss: 0.47515326902270316 steps without improvement: 2 best accuracy: 0.8941
[SYST] Epoch 24


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 25, Loss: 0.4748440332710743 steps without improvement: 3 best accuracy: 0.8941
[SYST] Epoch 25


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]

Test Accuracy: 88.47%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9758.38it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10084.37it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10247.04it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52937.52it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65396.73it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65660.24it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 1, Loss: 7.058742048740387 steps without improvement: 0 best accuracy: 0.7074
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 2, Loss: 2.6795663303136825 steps without improvement: 0 best accuracy: 0.7682
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.49it/s]


Epoch 3, Loss: 1.6554044514894486 steps without improvement: 0 best accuracy: 0.788
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 4, Loss: 1.414773262143135 steps without improvement: 0 best accuracy: 0.8223
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.67it/s]


Epoch 5, Loss: 1.1774677687883377 steps without improvement: 0 best accuracy: 0.8438
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 6, Loss: 1.0455354791879654 steps without improvement: 0 best accuracy: 0.8494
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


Epoch 7, Loss: 1.0155310779809952 steps without improvement: 1 best accuracy: 0.8494
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.52it/s]


Epoch 8, Loss: 1.006831355690956 steps without improvement: 0 best accuracy: 0.85
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 9, Loss: 1.0027295032143593 steps without improvement: 1 best accuracy: 0.85
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.15it/s]


Epoch 10, Loss: 1.0008261740207671 steps without improvement: 2 best accuracy: 0.85
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 11, Loss: 1.00033038854599 steps without improvement: 3 best accuracy: 0.85
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.25it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]

Test Accuracy: 85.16%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9659.86it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10034.56it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10182.14it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 49077.33it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66560.09it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67593.59it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.07it/s]


Epoch 1, Loss: 6.817310352325439 steps without improvement: 0 best accuracy: 0.5364
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 2, Loss: 6.289940807819367 steps without improvement: 0 best accuracy: 0.6068
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 3, Loss: 3.9640855622291564 steps without improvement: 0 best accuracy: 0.7674
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.44it/s]


Epoch 4, Loss: 2.000712037086487 steps without improvement: 0 best accuracy: 0.7834
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.05it/s]


Epoch 5, Loss: 1.832239344716072 steps without improvement: 0 best accuracy: 0.7865
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.91it/s]


Epoch 6, Loss: 1.8163132804632187 steps without improvement: 1 best accuracy: 0.7865
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 7, Loss: 1.8138163989782334 steps without improvement: 2 best accuracy: 0.7865
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 8, Loss: 1.8135655599832534 steps without improvement: 3 best accuracy: 0.7865
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]

Test Accuracy: 78.04%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9758.25it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:01<00:00, 9981.37it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10116.58it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 46955.44it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64298.55it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64817.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 1, Loss: 6.4513495373725895 steps without improvement: 0 best accuracy: 0.5841
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 2, Loss: 4.22260049700737 steps without improvement: 0 best accuracy: 0.5877
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 3, Loss: 3.8147590124607085 steps without improvement: 1 best accuracy: 0.5877
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 4, Loss: 3.69485400557518 steps without improvement: 2 best accuracy: 0.5877
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 5, Loss: 3.6269471192359926 steps without improvement: 3 best accuracy: 0.5877
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.96it/s]


Test Accuracy: 59.40%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9662.60it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10116.51it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10240.18it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52292.57it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66494.46it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65749.27it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 1, Loss: 7.1787837743759155 steps without improvement: 0 best accuracy: 0.5825
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 2, Loss: 4.921751413345337 steps without improvement: 0 best accuracy: 0.5954
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.57it/s]


Epoch 3, Loss: 4.208988980054856 steps without improvement: 0 best accuracy: 0.6049
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.40it/s]


Epoch 4, Loss: 3.9701346611976622 steps without improvement: 0 best accuracy: 0.6152
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.10it/s]


Epoch 5, Loss: 3.884497923851013 steps without improvement: 0 best accuracy: 0.6228
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 6, Loss: 3.845557222366333 steps without improvement: 1 best accuracy: 0.6228
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.96it/s]


Epoch 7, Loss: 3.824657689332962 steps without improvement: 2 best accuracy: 0.6228
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 8, Loss: 3.8151602613925935 steps without improvement: 3 best accuracy: 0.6228
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]

Test Accuracy: 62.11%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9776.21it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10103.09it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10283.48it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48912.83it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67018.79it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67561.58it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 1, Loss: 6.7864892649650574 steps without improvement: 0 best accuracy: 0.5619
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 2, Loss: 6.19614414691925 steps without improvement: 0 best accuracy: 0.5842
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.33it/s]


Epoch 3, Loss: 5.4531951379776 steps without improvement: 0 best accuracy: 0.6087
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 4, Loss: 4.862206339836121 steps without improvement: 0 best accuracy: 0.6123
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 5, Loss: 4.538814568519593 steps without improvement: 0 best accuracy: 0.6136
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 6, Loss: 4.492655096054077 steps without improvement: 1 best accuracy: 0.6136
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 7, Loss: 4.491411395072937 steps without improvement: 2 best accuracy: 0.6136
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 8, Loss: 4.4931269240379335 steps without improvement: 3 best accuracy: 0.6136
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.36it/s]

Test Accuracy: 61.30%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9652.57it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10044.13it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10172.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 50936.01it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64834.37it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64945.80it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 1, Loss: 6.085740032196045 steps without improvement: 0 best accuracy: 0.4978
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 2, Loss: 6.010295407772064 steps without improvement: 1 best accuracy: 0.4978
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 3, Loss: 6.010305290222168 steps without improvement: 0 best accuracy: 0.5016
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.26it/s]


Epoch 4, Loss: 6.009852952957154 steps without improvement: 1 best accuracy: 0.5016
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.22it/s]

Epoch 5, Loss: 6.008767664432526 steps without improvement: 2 best accuracy: 0.5016
[SYST] Epoch 5



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 6, Loss: 6.00873548746109 steps without improvement: 3 best accuracy: 0.5016
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]

Test Accuracy: 50.80%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:12<00:00, 9674.17it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10023.77it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10166.09it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53366.22it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65900.93it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65316.58it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.05it/s]


Epoch 1, Loss: 6.387030005455017 steps without improvement: 0 best accuracy: 0.4859
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.22it/s]

Epoch 2, Loss: 6.0259858417510985 steps without improvement: 0 best accuracy: 0.494
[SYST] Epoch 2



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.63it/s]


Epoch 3, Loss: 6.022251734733581 steps without improvement: 0 best accuracy: 0.4943
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 4, Loss: 6.020793163776398 steps without improvement: 0 best accuracy: 0.4983
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.68it/s]


Epoch 5, Loss: 6.019711706638336 steps without improvement: 1 best accuracy: 0.4983
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 6, Loss: 6.019074804782868 steps without improvement: 0 best accuracy: 0.5005
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 7, Loss: 6.018632128238678 steps without improvement: 0 best accuracy: 0.5032
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 8, Loss: 6.018285291194916 steps without improvement: 1 best accuracy: 0.5032
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 9, Loss: 6.0181868505477905 steps without improvement: 2 best accuracy: 0.5032
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.97it/s]


Epoch 10, Loss: 6.018126397132874 steps without improvement: 3 best accuracy: 0.5032
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.17it/s]


Epoch 11, Loss: 6.018091449737549 steps without improvement: 0 best accuracy: 0.506
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 12, Loss: 6.017300312519073 steps without improvement: 1 best accuracy: 0.506
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 13, Loss: 6.017483859062195 steps without improvement: 2 best accuracy: 0.506
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.24it/s]


Epoch 14, Loss: 6.016976950168609 steps without improvement: 3 best accuracy: 0.506
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.12it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]

Test Accuracy: 50.43%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9608.97it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10037.22it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10176.98it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 49127.38it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 68672.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67250.14it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 1, Loss: 6.487130687236786 steps without improvement: 0 best accuracy: 0.4955
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 2, Loss: 6.012504787445068 steps without improvement: 0 best accuracy: 0.5013
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 3, Loss: 6.005700488090515 steps without improvement: 1 best accuracy: 0.5013
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 4, Loss: 6.0026448273658755 steps without improvement: 2 best accuracy: 0.5013
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 5, Loss: 6.000785958766937 steps without improvement: 0 best accuracy: 0.5018
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 6, Loss: 5.999476940631866 steps without improvement: 0 best accuracy: 0.5045
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 7, Loss: 5.998940045833588 steps without improvement: 1 best accuracy: 0.5045
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 8, Loss: 5.998263616561889 steps without improvement: 2 best accuracy: 0.5045
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.46it/s]


Epoch 9, Loss: 5.9980677890777585 steps without improvement: 3 best accuracy: 0.5045
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]

Test Accuracy: 50.45%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49059.82it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48624.82it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:04<00:00,  8.24it/s]


Epoch 1, Loss: 0.40501944624702446 steps without improvement: 0 best accuracy: 0.9612


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.12it/s]


Epoch 2, Loss: 0.048608677216179785 steps without improvement: 32 best accuracy: 0.995


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.13it/s]


Epoch 3, Loss: 0.011929461360523419 steps without improvement: 80 best accuracy: 0.9981


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.12it/s]


Epoch 4, Loss: 0.006300310479105065 steps without improvement: 48 best accuracy: 0.9987


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 5, Loss: 0.004001176113263227 steps without improvement: 30 best accuracy: 0.9994


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 6, Loss: 0.0029180733889404564 steps without improvement: 463 best accuracy: 0.9996


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 7, Loss: 0.0021761017466985777 steps without improvement: 686 best accuracy: 0.9997


 33%|█████████████████▊                                    | 338/1024 [00:41<01:24,  8.08it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48394.96it/s]
100%|████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 101.91it/s]


Test Accuracy: 0.9993
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9570.96it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10043.82it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10178.66it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 51011.52it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64672.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64646.21it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 1, Loss: 5.635773762464523 steps without improvement: 0 best accuracy: 0.7197
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 2, Loss: 2.51097682595253 steps without improvement: 0 best accuracy: 0.7401
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 3, Loss: 2.1495945471525193 steps without improvement: 0 best accuracy: 0.7409
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.33it/s]


Epoch 4, Loss: 1.9778730475902557 steps without improvement: 0 best accuracy: 0.7489
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.33it/s]


Epoch 5, Loss: 1.890793141722679 steps without improvement: 0 best accuracy: 0.7539
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 6, Loss: 1.8479222577810288 steps without improvement: 0 best accuracy: 0.755
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 7, Loss: 1.819684190750122 steps without improvement: 0 best accuracy: 0.761
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 8, Loss: 1.7910404813289642 steps without improvement: 0 best accuracy: 0.7648
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.30it/s]


Epoch 9, Loss: 1.766491869688034 steps without improvement: 0 best accuracy: 0.7705
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.28it/s]


Epoch 10, Loss: 1.7486327034235 steps without improvement: 0 best accuracy: 0.7713
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.09it/s]


Epoch 11, Loss: 1.73520463347435 steps without improvement: 0 best accuracy: 0.7741
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 12, Loss: 1.7233264219760895 steps without improvement: 1 best accuracy: 0.7741
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 13, Loss: 1.7112742179632188 steps without improvement: 0 best accuracy: 0.7749
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 14, Loss: 1.6999961537122728 steps without improvement: 0 best accuracy: 0.78
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 15, Loss: 1.6902447599172592 steps without improvement: 0 best accuracy: 0.7844
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.13it/s]


Epoch 16, Loss: 1.6797360622882842 steps without improvement: 0 best accuracy: 0.7907
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 17, Loss: 1.6655375111103057 steps without improvement: 0 best accuracy: 0.7952
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.69it/s]


Epoch 18, Loss: 1.6513497644662858 steps without improvement: 0 best accuracy: 0.7968
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.12it/s]

Epoch 19, Loss: 1.6439051067829131 steps without improvement: 0 best accuracy: 0.7973
[SYST] Epoch 19



100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 20, Loss: 1.6395146989822387 steps without improvement: 0 best accuracy: 0.7986
[SYST] Epoch 20


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.07it/s]


Epoch 21, Loss: 1.6368268430233002 steps without improvement: 1 best accuracy: 0.7986
[SYST] Epoch 21


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.57it/s]


Epoch 22, Loss: 1.6359245163202285 steps without improvement: 2 best accuracy: 0.7986
[SYST] Epoch 22


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.51it/s]


Epoch 23, Loss: 1.634920905828476 steps without improvement: 3 best accuracy: 0.7986
[SYST] Epoch 23


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.15it/s]


Epoch 24, Loss: 1.6342291378974914 steps without improvement: 0 best accuracy: 0.7991
[SYST] Epoch 24


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 25, Loss: 1.63418390750885 steps without improvement: 1 best accuracy: 0.7991
[SYST] Epoch 25


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 26, Loss: 1.634032403230667 steps without improvement: 2 best accuracy: 0.7991
[SYST] Epoch 26


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 27, Loss: 1.6341409373283386 steps without improvement: 3 best accuracy: 0.7991
[SYST] Epoch 27


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]

Test Accuracy: 79.64%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:10<00:00, 9783.70it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10149.71it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10270.39it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53477.10it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66300.00it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65660.76it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Epoch 1, Loss: 8.617682375907897 steps without improvement: 0 best accuracy: 0.5505
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 2, Loss: 7.4983288455009465 steps without improvement: 1 best accuracy: 0.5505
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.96it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 3, Loss: 7.155193660259247 steps without improvement: 0 best accuracy: 0.5647
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 4, Loss: 7.041112325191498 steps without improvement: 0 best accuracy: 0.5665
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 5, Loss: 7.007007997035981 steps without improvement: 0 best accuracy: 0.5696
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.30it/s]


Epoch 6, Loss: 6.9985657930374146 steps without improvement: 1 best accuracy: 0.5696
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 7, Loss: 6.99608909368515 steps without improvement: 0 best accuracy: 0.5714
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 8, Loss: 6.9950922799110415 steps without improvement: 1 best accuracy: 0.5714
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.72it/s]


Epoch 9, Loss: 6.993938164710999 steps without improvement: 2 best accuracy: 0.5714
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.71it/s]


Epoch 10, Loss: 6.993113148212433 steps without improvement: 3 best accuracy: 0.5714
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]

Test Accuracy: 56.98%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9596.08it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10113.91it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10272.41it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53432.89it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67825.54it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66439.68it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 1, Loss: 7.828794145584107 steps without improvement: 0 best accuracy: 0.6936
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 2, Loss: 5.526294209957123 steps without improvement: 0 best accuracy: 0.764
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.22it/s]

Epoch 3, Loss: 4.725474183559418 steps without improvement: 0 best accuracy: 0.8048
[SYST] Epoch 3



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.42it/s]


Epoch 4, Loss: 4.559671351909637 steps without improvement: 0 best accuracy: 0.8093
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 5, Loss: 4.546753115653992 steps without improvement: 1 best accuracy: 0.8093
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 6, Loss: 4.5462653040885925 steps without improvement: 2 best accuracy: 0.8093
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 7, Loss: 4.545892617702484 steps without improvement: 3 best accuracy: 0.8093
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.75it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]

Test Accuracy: 81.33%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9705.03it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10076.08it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10239.24it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 51852.67it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63722.21it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63733.73it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 1, Loss: 6.753331470489502 steps without improvement: 0 best accuracy: 0.6112
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 2, Loss: 6.162772388458252 steps without improvement: 0 best accuracy: 0.6353
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 3, Loss: 6.007756178379059 steps without improvement: 0 best accuracy: 0.6501
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 4, Loss: 5.914925405979156 steps without improvement: 0 best accuracy: 0.6604
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 5, Loss: 5.8509727740287785 steps without improvement: 0 best accuracy: 0.6652
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.43it/s]


Epoch 6, Loss: 5.818736288547516 steps without improvement: 0 best accuracy: 0.6686
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 7, Loss: 5.804889800548554 steps without improvement: 0 best accuracy: 0.6767
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.91it/s]


Epoch 8, Loss: 5.797562301158905 steps without improvement: 1 best accuracy: 0.6767
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Epoch 9, Loss: 5.793716220855713 steps without improvement: 2 best accuracy: 0.6767
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 10, Loss: 5.791732499599457 steps without improvement: 3 best accuracy: 0.6767
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.88it/s]


Test Accuracy: 67.59%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9560.86it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10079.77it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10234.98it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52843.03it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67033.79it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65645.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.07it/s]


Epoch 1, Loss: 8.037231304645537 steps without improvement: 0 best accuracy: 0.5434
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.32it/s]


Epoch 2, Loss: 6.535111868381501 steps without improvement: 0 best accuracy: 0.5733
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 3, Loss: 6.280848445892334 steps without improvement: 0 best accuracy: 0.5923
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 4, Loss: 6.0704421377182 steps without improvement: 0 best accuracy: 0.6283
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.23it/s]


Epoch 5, Loss: 5.928380262851715 steps without improvement: 0 best accuracy: 0.6437
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  9.88it/s]


Epoch 6, Loss: 5.892780044078827 steps without improvement: 0 best accuracy: 0.647
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 7, Loss: 5.882401866912842 steps without improvement: 0 best accuracy: 0.6481
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 8, Loss: 5.878114035129547 steps without improvement: 0 best accuracy: 0.6482
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 9, Loss: 5.8762144947052 steps without improvement: 0 best accuracy: 0.6511
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 10, Loss: 5.874559469223023 steps without improvement: 1 best accuracy: 0.6511
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 11, Loss: 5.873416349887848 steps without improvement: 0 best accuracy: 0.6516
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 12, Loss: 5.872622911930084 steps without improvement: 0 best accuracy: 0.6531
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 13, Loss: 5.871208493709564 steps without improvement: 1 best accuracy: 0.6531
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 14, Loss: 5.869815015792847 steps without improvement: 2 best accuracy: 0.6531
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 15, Loss: 5.868329379558563 steps without improvement: 3 best accuracy: 0.6531
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


Test Accuracy: 66.38%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9723.27it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10072.53it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10216.24it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 54062.37it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66662.39it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67099.20it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 1, Loss: 8.319372067451477 steps without improvement: 0 best accuracy: 0.5378
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 2, Loss: 7.767500188350677 steps without improvement: 1 best accuracy: 0.5378
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.90it/s]


Epoch 3, Loss: 7.676426689624787 steps without improvement: 2 best accuracy: 0.5378
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 4, Loss: 7.639644341468811 steps without improvement: 3 best accuracy: 0.5378
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 5, Loss: 7.333453917503357 steps without improvement: 0 best accuracy: 0.573
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.20it/s]

Epoch 6, Loss: 6.757091593742371 steps without improvement: 0 best accuracy: 0.6192
[SYST] Epoch 6



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.77it/s]


Epoch 7, Loss: 6.65088306427002 steps without improvement: 0 best accuracy: 0.6338
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 8, Loss: 6.628922531604767 steps without improvement: 0 best accuracy: 0.6382
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 9, Loss: 6.6219232821464535 steps without improvement: 1 best accuracy: 0.6382
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Epoch 10, Loss: 6.618865494728088 steps without improvement: 0 best accuracy: 0.6391
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 11, Loss: 6.617640626430512 steps without improvement: 0 best accuracy: 0.6392
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.76it/s]


Epoch 12, Loss: 6.616953945159912 steps without improvement: 0 best accuracy: 0.6413
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 13, Loss: 6.617195107936859 steps without improvement: 1 best accuracy: 0.6413
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 14, Loss: 6.61660210609436 steps without improvement: 2 best accuracy: 0.6413
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.56it/s]


Epoch 15, Loss: 6.616600399017334 steps without improvement: 3 best accuracy: 0.6413
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.78it/s]


Test Accuracy: 64.73%
[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9623.78it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10017.99it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10175.72it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 51081.20it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63772.98it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 63140.51it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.74it/s]


Epoch 1, Loss: 7.286855411529541 steps without improvement: 0 best accuracy: 0.5138
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 2, Loss: 7.260309247970581 steps without improvement: 0 best accuracy: 0.5148
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 3, Loss: 7.258497557640076 steps without improvement: 1 best accuracy: 0.5148
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 4, Loss: 7.257552905082703 steps without improvement: 2 best accuracy: 0.5148
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 5, Loss: 7.256805975437164 steps without improvement: 3 best accuracy: 0.5148
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.79it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]

Test Accuracy: 50.79%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9727.87it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10064.06it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10206.84it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53429.63it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66267.85it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 66108.67it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 1, Loss: 7.519979267120362 steps without improvement: 0 best accuracy: 0.4986
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 2, Loss: 7.253009760379792 steps without improvement: 1 best accuracy: 0.4986
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.32it/s]


Epoch 3, Loss: 7.248932888507843 steps without improvement: 2 best accuracy: 0.4986
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 4, Loss: 7.2474951696395875 steps without improvement: 3 best accuracy: 0.4986
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 5, Loss: 7.246856424808502 steps without improvement: 0 best accuracy: 0.4987
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 6, Loss: 7.246392865180969 steps without improvement: 0 best accuracy: 0.5007
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.82it/s]


Epoch 7, Loss: 7.246004476547241 steps without improvement: 1 best accuracy: 0.5007
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 8, Loss: 7.245757486820221 steps without improvement: 0 best accuracy: 0.5033
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.33it/s]


Epoch 9, Loss: 7.246084895133972 steps without improvement: 1 best accuracy: 0.5033
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.08it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 10, Loss: 7.245777227878571 steps without improvement: 2 best accuracy: 0.5033
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.53it/s]


Epoch 11, Loss: 7.245648500919342 steps without improvement: 3 best accuracy: 0.5033
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]

Test Accuracy: 50.21%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9567.22it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10059.24it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10222.66it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:23<00:00, 53355.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 68078.19it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65007.81it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.11it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.28it/s]


Epoch 1, Loss: 7.611264855861664 steps without improvement: 0 best accuracy: 0.5133
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 2, Loss: 7.2585087847709655 steps without improvement: 1 best accuracy: 0.5133
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 3, Loss: 7.245888841152191 steps without improvement: 2 best accuracy: 0.5133
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.38it/s]


Epoch 4, Loss: 7.242098519802093 steps without improvement: 3 best accuracy: 0.5133
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.10it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]

Test Accuracy: 51.21%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|████████████████████████████████████████████| 1048576/1048576 [00:21<00:00, 49027.88it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48639.09it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [02:05<00:00,  8.14it/s]


Epoch 1, Loss: 0.4215891818894306 steps without improvement: 7 best accuracy: 0.959


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 2, Loss: 0.05369217247607594 steps without improvement: 29 best accuracy: 0.9955


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.11it/s]


Epoch 3, Loss: 0.010780396210975596 steps without improvement: 358 best accuracy: 0.9988


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.10it/s]


Epoch 4, Loss: 0.005205097786586066 steps without improvement: 88 best accuracy: 0.9993


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.08it/s]


Epoch 5, Loss: 0.003510901456081683 steps without improvement: 594 best accuracy: 0.9997


100%|█████████████████████████████████████████████████████| 1024/1024 [02:06<00:00,  8.09it/s]


Epoch 6, Loss: 0.0027835169259731174 steps without improvement: 98 best accuracy: 1.0


 90%|████████████████████████████████████████████████▊     | 926/1024 [01:54<00:12,  8.12it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 47465.35it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 98.58it/s]


Test Accuracy: 0.9993
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]


100%|█████████████████████████████████████████████| 1280000/1280000 [02:13<00:00, 9568.65it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10019.71it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10182.69it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 50869.58it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 64602.39it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65111.86it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.87it/s]


Epoch 1, Loss: 9.42350665807724 steps without improvement: 0 best accuracy: 0.6473
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 2, Loss: 5.030616993904114 steps without improvement: 0 best accuracy: 0.7113
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 3, Loss: 4.363760087490082 steps without improvement: 0 best accuracy: 0.7226
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.21it/s]


Epoch 4, Loss: 4.244369430541992 steps without improvement: 0 best accuracy: 0.7255
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.14it/s]

Epoch 5, Loss: 4.174618812799454 steps without improvement: 0 best accuracy: 0.7312
[SYST] Epoch 5



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.33it/s]


Epoch 6, Loss: 4.125869314670563 steps without improvement: 0 best accuracy: 0.7378
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.23it/s]


Epoch 7, Loss: 4.085907294750213 steps without improvement: 0 best accuracy: 0.7497
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 8, Loss: 4.047425280809403 steps without improvement: 1 best accuracy: 0.7497
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.26it/s]

Epoch 9, Loss: 4.0135984313488 steps without improvement: 0 best accuracy: 0.7547
[SYST] Epoch 9



100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.46it/s]


Epoch 10, Loss: 3.9898022317886355 steps without improvement: 1 best accuracy: 0.7547
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 11, Loss: 3.974056204557419 steps without improvement: 0 best accuracy: 0.7559
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.99it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.20it/s]


Epoch 12, Loss: 3.964384835958481 steps without improvement: 0 best accuracy: 0.7562
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.64it/s]


Epoch 13, Loss: 3.9568491971492765 steps without improvement: 0 best accuracy: 0.7583
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.58it/s]


Epoch 14, Loss: 3.951467173099518 steps without improvement: 1 best accuracy: 0.7583
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 15, Loss: 3.9471183013916016 steps without improvement: 2 best accuracy: 0.7583
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.97it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 16, Loss: 3.943442566394806 steps without improvement: 3 best accuracy: 0.7583
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.01it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]

Test Accuracy: 75.73%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9761.43it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10070.29it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10219.62it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 48122.93it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65816.75it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 65366.66it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.94it/s]


Epoch 1, Loss: 7.595102863311768 steps without improvement: 0 best accuracy: 0.6754
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 2, Loss: 5.3021606969833375 steps without improvement: 0 best accuracy: 0.7454
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.93it/s]


Epoch 3, Loss: 4.570993909835815 steps without improvement: 0 best accuracy: 0.757
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 11.00it/s]


Epoch 4, Loss: 4.463752149343491 steps without improvement: 0 best accuracy: 0.7656
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.39it/s]


Epoch 5, Loss: 4.426061686277389 steps without improvement: 0 best accuracy: 0.772
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.22it/s]


Epoch 6, Loss: 4.403694726228714 steps without improvement: 0 best accuracy: 0.7727
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.86it/s]


Epoch 7, Loss: 4.388710627555847 steps without improvement: 0 best accuracy: 0.7735
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.38it/s]


Epoch 8, Loss: 4.378550935983657 steps without improvement: 0 best accuracy: 0.7799
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.81it/s]


Epoch 9, Loss: 4.3700555801391605 steps without improvement: 1 best accuracy: 0.7799
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.80it/s]


Epoch 10, Loss: 4.363729606866837 steps without improvement: 0 best accuracy: 0.7822
[SYST] Epoch 10


100%|███████████████████████████████████████████████████████| 200/200 [00:25<00:00,  7.98it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 11, Loss: 4.358145246505737 steps without improvement: 0 best accuracy: 0.7828
[SYST] Epoch 11


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.02it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.89it/s]


Epoch 12, Loss: 4.353791855573654 steps without improvement: 0 best accuracy: 0.7846
[SYST] Epoch 12


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.52it/s]


Epoch 13, Loss: 4.350571974515915 steps without improvement: 0 best accuracy: 0.7856
[SYST] Epoch 13


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.83it/s]


Epoch 14, Loss: 4.34786706328392 steps without improvement: 1 best accuracy: 0.7856
[SYST] Epoch 14


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]


Epoch 15, Loss: 4.3455853068828585 steps without improvement: 0 best accuracy: 0.7892
[SYST] Epoch 15


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.04it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 16, Loss: 4.343545047044754 steps without improvement: 1 best accuracy: 0.7892
[SYST] Epoch 16


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.91it/s]


Epoch 17, Loss: 4.342869147062301 steps without improvement: 2 best accuracy: 0.7892
[SYST] Epoch 17


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.05it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.92it/s]


Epoch 18, Loss: 4.342132483720779 steps without improvement: 3 best accuracy: 0.7892
[SYST] Epoch 18


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.60it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.84it/s]

Test Accuracy: 79.51%





[{'accuracy': 0.9996, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8345, '[[0, 1], [2, 3]]': 0.8029, '[[0], [1]]': 0.7873}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.4782, '[[0, 1], [2, 3]]': 0.5581, '[[0], [1]]': 0.5785}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5121, '[[0, 1], [2, 3]]': 0.5089, '[[0], [1]]': 0.5176}}, {'accuracy': 0.9995, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.8747, '[[0, 1], [2, 3]]': 0.8645, '[[0], [1]]': 0.8347}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5471, '[[0, 1], [2, 3]]': 0.5242, '[[0], [1]]': 0.5387}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.5028, '[[0, 1], [2, 3]]': 0.5077, '[[0], [1]]': 0.496}}, {'accuracy': 0.9972, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.74, '[[0, 1], [2, 3]]': 0.6878, '[[0], [1]]': 0.697}, 'Layer2': {'[[

100%|█████████████████████████████████████████████| 1280000/1280000 [02:11<00:00, 9754.21it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3569.75it/s]
100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 10151.62it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:24<00:00, 52708.14it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67364.63it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 67682.92it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.09it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.30it/s]


Epoch 1, Loss: 9.000829315185547 steps without improvement: 0 best accuracy: 0.5789
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.85it/s]


Epoch 2, Loss: 7.819079539775848 steps without improvement: 0 best accuracy: 0.6366
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.95it/s]


Epoch 3, Loss: 7.527445855140686 steps without improvement: 0 best accuracy: 0.6422
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.06it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 10.20it/s]


Epoch 4, Loss: 7.447362468242646 steps without improvement: 0 best accuracy: 0.6468
[SYST] Epoch 4


  8%|████▊                                                   | 17/200 [00:02<00:22,  8.01it/s]

In [None]:
results

In [None]:
import json
with open('results.json', 'w') as f:
    json.dump(results, f)
