In [1]:
#check if model stays the same
#reimplement data generation

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
import pickle
from tqdm import tqdm
import random
import numpy as np

DEVICE="cpu"


In [3]:
def set_seed(seed):
    # Set the seed for the random module
    random.seed(seed)
    
    # Set the seed for numpy
    np.random.seed(seed)
    
    # Set the seed for PyTorch (CPU)
    torch.manual_seed(seed)
    
    # Set the seed for PyTorch (GPU) if you are using CUDA
    if torch.cuda.is_available():
        torch.cuda.manual_seed(seed)
        torch.cuda.manual_seed_all(seed)  # For multi-GPU setups
    
    # Ensure deterministic behavior in PyTorch
    torch.backends.cudnn.deterministic = True  # This makes the computations deterministic
    torch.backends.cudnn.benchmark = False  # Disable auto-tuning for performance optimization
    
    # For reproducibility of other libraries like Python's `random`
    torch.random.manual_seed(seed)



In [4]:


class MLPBlock(nn.Module):
    def __init__(self, in_features=16, out_features=16, dropout_prob=0.0):
        super(MLPBlock, self).__init__()
        self.ff1 = nn.Linear(in_features, out_features)
        self.act = nn.ReLU()
        self.dropout = nn.Dropout(p=dropout_prob)

    def forward(self, x):
        x = self.ff1(x)
        x = self.act(x)
        x = self.dropout(x)
        return x

class MLPModel(nn.Module):
    def __init__(self, input_size=16, hidden_size=16, num_blocks=3, dropout_prob=0.0):
        super(MLPModel, self).__init__()
        self.dropout = nn.Dropout(p=dropout_prob)
        self.h = nn.ModuleList([MLPBlock(hidden_size, hidden_size, dropout_prob) for _ in range(num_blocks)])

    def forward(self, x):
        x = self.dropout(x)
        for layer in self.h:
            x = layer(x)
        return x

class MLPForClassification(nn.Module):
    def __init__(self, input_size=16, hidden_size=16, num_classes=2, num_blocks=3, dropout_prob=0.0):
        super(MLPForClassification, self).__init__()
        self.mlp = MLPModel(input_size, hidden_size, num_blocks, dropout_prob)
        self.score = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        x = self.mlp(x)
        x = self.score(x)
        return x



In [5]:
def randvec(n=50, lower=-0.5, upper=0.5):
    """
    Returns a random vector of length `n`. `w` is ignored.

    """
    return np.array([random.uniform(lower, upper) for i in range(n)])

def create_same_pair(embedding_size):
    vec=randvec(embedding_size)
    return vec,vec

def create_diff_pair(embedding_size):
    similar=True
    while similar:
        vec1=randvec(embedding_size)
        vec2=randvec(embedding_size)
        if not (vec1 == vec2).all():
            similar=False
    return vec1,vec2


def make_dataset_sample_model(embedding_size,variable1=False,variable2=False):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
        
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label

def make_model_dataset(size,embedding_size):
    model_inputs=[]
    labels=[]
    for _ in tqdm(range(size)):
        model_input,label=make_dataset_sample_model(embedding_size)
        model_inputs.append(model_input)
        labels.append(label)
    return torch.tensor(model_inputs, dtype=torch.float32).to(DEVICE),torch.tensor(labels, dtype=torch.float32).to(DEVICE)



def make_dataset_sample_variable_intervention(embedding_size,variable1=False,variable2=False):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
    source_first_pair=[(np.zeros(embedding_size),np.zeros(embedding_size)),(np.zeros(embedding_size),np.zeros(embedding_size))]
    if variable1:
        First_pair_same=random.choice([True,False])
        if First_pair_same:
            source_first_pair=create_same_pair(embedding_size)
        else:
            source_first_pair=create_diff_pair(embedding_size)
        if random.choice([True,False]):
            source_first_pair=[source_first_pair,create_same_pair(embedding_size)]
        else:
            source_first_pair=[source_first_pair,create_diff_pair(embedding_size)]
        
    
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)
    source_second_pair=[(np.zeros(embedding_size),np.zeros(embedding_size)),(np.zeros(embedding_size),np.zeros(embedding_size))]
    if variable2:
        Second_pair_same=random.choice([True,False])
        if Second_pair_same:
            source_second_pair=create_same_pair(embedding_size)
        else:
            source_second_pair=create_diff_pair(embedding_size)
        if random.choice([True,False]):
            source_second_pair=[create_same_pair(embedding_size),source_second_pair]
        else:
            source_second_pair=[create_diff_pair(embedding_size),source_second_pair]
    
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    source0=np.concatenate(source_first_pair, axis=None)
    source1=np.concatenate(source_second_pair, axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label,source0,source1

def make_intervention_dataset_variable_intervention_all(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        variable1,variable2=random.choice([(True,False),(False,True),(True,True)])
        base,label,source0,source1=make_dataset_sample_variable_intervention(embedding_size,variable1=variable1,variable2=variable2)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source0,source1], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[variable1,variable2]
        #print(intervention_data[-1])
    return intervention_data

def make_intervention_dataset_variable_intervention_first(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        base,label,source0,source1=make_dataset_sample_variable_intervention(embedding_size,variable1=True,variable2=False)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source0,source1], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[True,False]
        #print(intervention_data[-1])
    return intervention_data




def make_dataset_sample_first_input_intervention(embedding_size):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
    
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)


    source=[]
    First_pair_same=random.choice([True,False])
    if First_pair_same: #equal or not in first variable
        if random.choice([True,False]): #Same source pair
            source.append((First_pair[1],First_pair[1]))
        else: #Different source pair
            new_vec=randvec(embedding_size)
            while (new_vec == First_pair[1]).all():
                new_vec=randvec(embedding_size)
            source.append((First_pair[1],new_vec))
            
    else:
        new_vec1=randvec(embedding_size)
        while (new_vec1 == First_pair[1]).all():
            new_vec1=randvec(embedding_size)
        if random.choice([True,False]): #Same source pair
            source.append((new_vec1,new_vec1))
        else: #Different source pair
            new_vec2=randvec(embedding_size)
            while (new_vec2 == new_vec1).all():
                new_vec2=randvec(embedding_size)
            source.append((new_vec1,new_vec2))

    if random.choice([True,False]):
        source.append(create_same_pair(embedding_size))
    else:
        source.append(create_diff_pair(embedding_size))
    
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    source=np.concatenate(source, axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label,source
    


def make_intervention_dataset_first_input_intervention(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        base,label,source=make_dataset_sample_first_input_intervention(embedding_size)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[True]
    return intervention_data




In [6]:
def train_model(model,batch_size = 1024,epochs=3):
    #Training
    #X_train,y_train=make_model_dataset(1048576,4)
    with open("X_train.pkl", "rb") as f:
        X_train = pickle.load(f)
    X_train=X_train.to(DEVICE)
    
    with open("y_train.pkl", "rb") as f:
        y_train = pickle.load(f)
    y_train=y_train.to(DEVICE)

    # Create DataLoader
    
    
    train_dataset = TensorDataset(X_train, y_train)
    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
    
    # Initialize model, loss function, and optimizer
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    
    # Train
    model.train()
    for epoch in range(epochs):
        total_loss = 0
        for X_batch, y_batch in tqdm(train_loader):
            optimizer.zero_grad()
            outputs = model(X_batch)
            loss = criterion(outputs, y_batch.squeeze().long())
            loss.backward()
            optimizer.step()
            total_loss += loss.item()
        print(f"Epoch {epoch+1}, Loss: {total_loss / len(train_loader)}")
    return model

In [7]:
def test_model(model,batch_size = 1024):
    #Testing:
    with open("X_test.pkl", "rb") as f:
        X_test = pickle.load(f)
    X_test=X_test.to(DEVICE)
    
    with open("y_test.pkl", "rb") as f:
        y_test = pickle.load(f)
    y_test=y_test.to(DEVICE)
    test_dataset = TensorDataset(X_test, y_test)
    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)
    
    
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for X_batch, y_batch in tqdm(test_loader):
            outputs = model(X_batch)
            _, predicted = torch.max(outputs, 1)
            correct += (predicted == y_batch.squeeze()).sum().item()
            total += y_batch.size(0)
    accuracy = correct / total
    print(f"Test Accuracy: {accuracy:.4f}")
    return accuracy

In [8]:
def make_model(epochs=3):
    model = MLPForClassification()
    model.to(DEVICE)
    model=train_model(model,epochs=epochs)
    accuracy=test_model(model)
    return model,accuracy

In [9]:
class RotateLayer(torch.nn.Module):
    """A learnable linear transformation initialized as an orthogonal matrix."""

    def __init__(self, n, init_orth=True):
        """
        Args:
            n (int): Dimension of the square transformation matrix.
            init_orth (bool): If True, initializes the matrix with an orthogonal weight.
        """
        super().__init__()
        weight = torch.empty(n, n)  # Create an empty n x n matrix
        
        # We don't need initialization if loading from a pretrained checkpoint.
        # You can explore different initialization strategies if necessary, but this isn't our focus.
        if init_orth:
            torch.nn.init.orthogonal_(weight)
        
        self.weight = torch.nn.Parameter(weight, requires_grad=True)  # Learnable weight matrix

    def forward(self, x):
        """Applies the rotation matrix to the input tensor."""
        return torch.matmul(x.to(self.weight.dtype), self.weight)
        

class Transformation_Function(nn.Module):
    """Encapsulates the rotation transformation as a PyTorch module."""

    def __init__(self, embed_dim=16):
        """
        Args:
            embed_dim (int): The embedding dimension (size of the transformation matrix).
        """
        super(Transformation_Function, self).__init__()
        
        rotate_layer = RotateLayer(embed_dim)  # Initialize the rotation layer
        # Ensure the transformation remains an orthogonal matrix
        self.rotate_layer = torch.nn.utils.parametrizations.orthogonal(rotate_layer)

    def forward(self, x):
        """Applies the orthogonal transformation to the input tensor."""
        return self.rotate_layer(x)


class InverseTransformation_Function(nn.Module):
    """Computes the inverse of the given transformation function (phi)."""

    def __init__(self, transformation_function: Transformation_Function):
        """
        Args:
            transformation_function (Transformation_Function): The forward transformation function.
        """
        super(InverseTransformation_Function, self).__init__()
        self.transformation_function = transformation_function  # Store reference to the transformation

    def forward(self, x):
        """Applies the inverse transformation by transposing the orthogonal weight matrix."""
        weight_T = self.transformation_function.rotate_layer.weight.T  # Use matrix transpose as inverse
        return torch.matmul(x.to(weight_T.dtype), weight_T)

class phi_class:
    def __init__(self, phi,phi_inv,criterion,optimizer):
        self.phi=phi
        self.phi_inv=phi_inv
        self.criterion=criterion
        self.optimizer=optimizer



In [10]:
class Distributed_Alignment_Search:

    
    def __init__(self, 
                 Model,
                 Model_Layer,
                 Train_Data_Raw,
                 Test_Data_Raw,
                 Hidden_Layer_Size,
                 Variable_Dimensions,
                 Transformation_Class,
                 Device):
        self.Model=Model
        self.Model_Layer=Model_Layer
        self.Hidden_Layer_Size=Hidden_Layer_Size
        self.Variable_Dimensions=Variable_Dimensions
        self.Num_Varibales=len(self.Variable_Dimensions)
        self.Transformation_Class=Transformation_Class
        self.Device=Device

        self.mode_info=None
        self.base_activations=None
        self.source_activations=None

        
        self.Train_Dataset,self.Train_Sample_Number=self.Prepare_Dataset(Train_Data_Raw)
        self.Test_Dataset,self.Test_Samples_Number=self.Prepare_Dataset(Test_Data_Raw)

   
        self.Hook=self.register_intervention_hook(self.Model_Layer)
        

    def Prepare_Dataset(self,Raw_Dataset): 
        Clean_Dataset={}
        Clean_Dataset["base"]=[]
        Clean_Dataset["sources"]=[]
        for _ in range(self.Num_Varibales):
            Clean_Dataset["sources"].append([])
        Clean_Dataset["label"]=[]
        Clean_Dataset["intervention"]=[]

        #Actually adapted to the dataset I am using. Needs to be changed later:
        print("[SYST] Prepare Data")
        for ac_DP_pos in tqdm(range(len(Raw_Dataset))):
            #base input
            ac_DP=Raw_Dataset[ac_DP_pos]
            Clean_Dataset["base"].append(ac_DP["base"])

            #expected label after intervention
            Clean_Dataset["label"].append(ac_DP["label"])

            #source inputs
            for var_dim in range(ac_DP['sources'].shape[0]):
                Clean_Dataset["sources"][var_dim].append(ac_DP['sources'][var_dim])

            #intervention data
            Clean_Dataset["intervention"].append([])
            for Hidden_Dimension in range(self.Hidden_Layer_Size):
                dim_found=False
                for ac_dimensions_pos,ac_dimensions in enumerate(self.Variable_Dimensions):
                    if Hidden_Dimension in ac_dimensions:
                        dim_found=True
                        if ac_DP["intervention"][ac_dimensions_pos]:
                            Clean_Dataset["intervention"][-1].append(True)
                        else:
                            Clean_Dataset["intervention"][-1].append(False)
                        break
                if not dim_found:
                    Clean_Dataset["intervention"][-1].append(False)
            Raw_Dataset[ac_DP_pos]=None

        sample_number=len(Clean_Dataset["label"])
        Clean_Dataset["base"]=torch.stack(Clean_Dataset["base"]).to(self.Device)
        Clean_Dataset["label"]=torch.stack(Clean_Dataset["label"]).to(self.Device)
        for i in range(len(Clean_Dataset["sources"])):
            Clean_Dataset["sources"][i]=torch.stack(Clean_Dataset["sources"][i]).to(self.Device)
        Clean_Dataset["intervention"]=torch.tensor(Clean_Dataset["intervention"]).to(self.Device)
        return Clean_Dataset,sample_number
                        
        
    def register_intervention_hook(self, layer):
        def hook_fn(module, input, output):
            if self.mode_info[0] == "source":
                # Extract row indices (list)
                row_indices = self.mode_info[2]
                #print("SO",output)
                
                # Extract column indices (list)
                col_indices = self.Variable_Dimensions[self.mode_info[1]]
                #print("CI",col_indices)
                #print(self.source_activations.shape)
                #print("SB",self.source_activations)
                #print(output)
                
                # Get values from the transformation tensor
                transformed_values = self.Transformation_Class.phi(output.detach())[:, col_indices]
                #print("TV",transformed_values)
                
                # Assign these values to the corresponding positions in source_activations
                self.source_activations[torch.tensor(row_indices).unsqueeze(1), torch.tensor(col_indices).unsqueeze(0)] = transformed_values
                #print("SA",self.source_activations)
                #print("***")
            elif self.mode_info[0] == "intervene":
                result_tensor = self.Transformation_Class.phi(output.detach())
                #print("II",self.mode_info[1])
                #print("IBO",output)
                #print("IBT",result_tensor)
                #print("IBOR",self.Transformation_Class.phi_inv(result_tensor))
                result_tensor = torch.where(self.mode_info[1], self.source_activations, result_tensor)
                #print("IR",result_tensor)
                return self.Transformation_Class.phi_inv(result_tensor)
        
        return layer.register_forward_hook(hook_fn)

    
    def train_test(self,batch_size,epochs=1,train=True):

        self.Model.eval()
        for param in self.Model.parameters():
            param.requires_grad = False  # This freezes the weights

        if train:
            self.Transformation_Class.phi.train()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = True  # This unfreezes the weights
            data=self.Train_Dataset
            Sample_Indices=list(range(self.Train_Sample_Number))
        else:
            self.Transformation_Class.phi.eval()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = False  # This freezes the weights
            data=self.Test_Dataset
            Sample_Indices=list(range(self.Test_Samples_Number))
        
        for epoch in range(epochs):
            print("[SYST] Epoch",epoch)
            total_correct = 0
            total_samples = 0
            total_loss = 0
        
            #Make Batches
            random.shuffle(Sample_Indices)
            DAS_Train_Batches=self.chunk_list(Sample_Indices, batch_size)
            
            for ac_batch in tqdm(DAS_Train_Batches):

                if train: 
                    self.Transformation_Class.optimizer.zero_grad()
                
                #Prepare Source Activations
                self.source_activations = torch.zeros(len(ac_batch), self.Hidden_Layer_Size).to(self.Device)
                
                for ac_source_pos in range(len(data["sources"])):
                    #add info needed for optimization... no sense in running inputs who are not used:
                    used_source_indices=self.extract_sources_to_run(ac_source_pos,ac_batch,data)
                    if len(used_source_indices)>0:
                        #print("Hey")
                        self.mode_info=["source",ac_source_pos,used_source_indices]
                        ac_source=data["sources"][ac_source_pos][ac_batch][used_source_indices]
                        #print("SI",ac_source)
                        model(ac_source)
        
                #Intervention
                ac_base=data["base"][ac_batch]
                intervention_bools=data["intervention"][ac_batch]
                self.mode_info=["intervene",intervention_bools]
                #print("BI",ac_base)
                outputs=model(ac_base)
                labels=data["label"][ac_batch]
                #print("L",labels)
                if train:
                    loss = self.Transformation_Class.criterion(outputs, labels.squeeze().long())
                    loss.backward()
                    self.Transformation_Class.optimizer.step()
                    #print(self.Transformation_Class.phi.rotate_layer.weight)
                    total_loss += loss.item()

                else:
                    predictions = torch.argmax(outputs, dim=1) 
                    correct = (predictions.squeeze() == labels.squeeze()).sum().item()
                    total_correct += correct
                    total_samples += labels.size(0)
            
            if train:
                print(f"Epoch {epoch+1}, Loss: {total_loss / len(DAS_Train_Batches)}")
            else:     
                accuracy = total_correct / total_samples
                print(f"Test Accuracy: {accuracy * 100:.2f}%")
                return accuracy
                

    def extract_sources_to_run(self,which_variable,batch_indices,data):
        used_source_indices=[]
        for ip, i in enumerate(batch_indices):
            is_used=data["intervention"][i][self.Variable_Dimensions[which_variable][0]]
            if is_used:
                used_source_indices.append(ip)
        return used_source_indices

    
    def chunk_list(self, input_list, batch_size):
        return [input_list[i:i + batch_size] for i in range(0, len(input_list), batch_size)]

    
    def Cleanup(self):
        self.Hook.remove()

In [11]:
def make_das_testtrain(url):
    with open(url, "rb") as f:
        DAS_data = pickle.load(f)
    print("restructuring")
    for i in tqdm(range(len(DAS_data))):
        new_dict={}
        new_dict["base"]=DAS_data[i]["input_ids"]
        new_dict["label"]=DAS_data[i]["labels"]
        if DAS_data[i]['intervention_id'] in [0,2]:
            new_dict["sources"]=DAS_data[i]['source_input_ids']
        elif DAS_data[i]['intervention_id'] in [1]:
            new_dict["sources"]=[None,None]
            new_dict["sources"][0]=DAS_data[i]['source_input_ids'][1]
            new_dict["sources"][1]=DAS_data[i]['source_input_ids'][0]
            new_dict["sources"]=torch.stack(new_dict["sources"])
        else:
            print("[ERROR]")
            exit()
        if DAS_data[i]['intervention_id']==0:
            new_dict["intervention"]=[True,False]
        elif DAS_data[i]['intervention_id']==1:
            new_dict["intervention"]=[False,True]
        elif DAS_data[i]['intervention_id']==2:
            new_dict["intervention"]=[True,True]
        else:
            print("[ERROR]")
            exit()
        DAS_data[i]=new_dict
    return DAS_data

In [12]:
results=[]
for acseed in [4287, 3837, 9097, 2635, 5137, 6442, 5234, 4641, 8039, 2266]:
    results.append({})
    set_seed(acseed)
    model,accuracy=make_model(epochs=3)
    Layers=[]
    Layers.append(("Layer1",model.mlp.h[0]))
    Layers.append(("Layer2",model.mlp.h[1]))
    Layers.append(("Layer3",model.mlp.h[2]))
    inter_dims=[]
    
    inter_dims.append([list(range(0,8)),list(range(8,16))])
    inter_dims.append([list(range(0,2)),list(range(2,4))])
    inter_dims.append([list(range(0,1)),list(range(1,2))])
    """
    inter_dims.append([list(range(0,8))])
    inter_dims.append([list(range(0,2))])
    inter_dims.append([list(range(0,1))])
    """
    results[-1]["accuracy"]=accuracy
    for LayerName,Layer in Layers:
        results[-1][LayerName]={}
        for inter_dim in inter_dims:
            print(LayerName,":",inter_dim)
            DAS_Train=make_das_testtrain("DAS_Train.pkl")
            DAS_Test=make_das_testtrain("DAS_Test.pkl")
    
            #Initialize transformation function
            p=Transformation_Function(16)
            p.to(DEVICE)
            p_inverse=InverseTransformation_Function(p)
            
            criterion = nn.CrossEntropyLoss()
            optimizer = optim.Adam(p.parameters(), lr=0.001)
            
            phi=phi_class(p,p_inverse,criterion,optimizer)
    
            
    
            DAS_Experiment=Distributed_Alignment_Search(Model=model,
                                                        Model_Layer=Layer,
                                                        Train_Data_Raw=DAS_Train,
                                                        Test_Data_Raw=DAS_Test,
                                                        Hidden_Layer_Size=16,
                                                        Variable_Dimensions=inter_dim,
                                                        Transformation_Class=phi,
                                                        Device=DEVICE)
    
            DAS_Experiment.train_test(batch_size=6400,
                                      epochs=10,
                                      train=True)
    
            accuracy=DAS_Experiment.train_test(batch_size=6400,
                                               train=False)
            
            results[-1][LayerName][str(inter_dim)]=accuracy
            DAS_Experiment.Cleanup()
            DAS_Experiment=None
            print(results)

100%|████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 120.83it/s]


Epoch 1, Loss: 0.32574803684929066


100%|████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 127.27it/s]


Epoch 2, Loss: 0.0106724279289665


100%|████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 129.83it/s]


Epoch 3, Loss: 0.0036883714024043


100%|████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 192.62it/s]


Test Accuracy: 0.9989
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45917.94it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34198.26it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60928.19it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 20630.89it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 1, Loss: 4.434580875337124
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 2, Loss: 0.6645819288492203
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 3, Loss: 0.48334152191877366
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 4, Loss: 0.38635324835777285
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 5, Loss: 0.3193294675648212
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 6, Loss: 0.28184337869286535
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 7, Loss: 0.25601815558969976
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.42it/s]


Epoch 8, Loss: 0.23421423755586146
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 9, Loss: 0.21645825028419494
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 10, Loss: 0.2029604686051607
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.28it/s]


Test Accuracy: 96.06%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625}}]
Layer1 : [[0, 1], [2, 3]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47546.91it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34509.93it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 95463.87it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 19118.59it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 1, Loss: 5.825884664058686
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 2, Loss: 1.4491951125860214
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 3, Loss: 1.056653972864151
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 4, Loss: 0.9817582547664643
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 5, Loss: 0.7998111107945443
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 6, Loss: 0.7013656926155091
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 7, Loss: 0.6626556873321533
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 8, Loss: 0.6147943487763405
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.24it/s]


Epoch 9, Loss: 0.5801847973465919
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.12it/s]


Epoch 10, Loss: 0.5641897206008434
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.35it/s]


Test Accuracy: 89.84%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375}}]
Layer1 : [[0], [1]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 46075.14it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33956.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63739.54it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18819.48it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.81it/s]


Epoch 1, Loss: 7.857737450599671
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 2, Loss: 2.784380754232407
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 3, Loss: 1.1392952412366868
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 4, Loss: 1.0740659782290458
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 5, Loss: 1.0717655730247497
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 6, Loss: 1.0718736284971238
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 7, Loss: 1.0718030413985253
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 8, Loss: 1.0719801679253578
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 9, Loss: 1.071898113489151
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 10, Loss: 1.0721559342741966
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.30it/s]


Test Accuracy: 87.73%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45949.66it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33307.29it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 61314.37it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 23774.03it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.02it/s]


Epoch 1, Loss: 7.681929111480713
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 2, Loss: 6.942199194431305
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 3, Loss: 6.8089534330368044
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 4, Loss: 6.776693980693818
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 5, Loss: 6.760751211643219
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 6, Loss: 6.7505499792099
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.15it/s]


Epoch 7, Loss: 6.742656605243683
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 8, Loss: 6.734415247440338
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.82it/s]


Epoch 9, Loss: 6.7255587887763975
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 10, Loss: 6.718304679393769
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.21it/s]


Test Accuracy: 63.30%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875}}]
Layer2 : [[0, 1], [2, 3]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45754.69it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33243.27it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 94754.84it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 23677.79it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 1, Loss: 8.290261952877044
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 2, Loss: 7.417915894985199
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 3, Loss: 7.241181411743164
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 4, Loss: 6.980452477931976
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 5, Loss: 6.6654668402671815
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 6, Loss: 6.489163730144501
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 7, Loss: 6.458026490211487
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.90it/s]


Epoch 8, Loss: 6.445042135715485
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.62it/s]


Epoch 9, Loss: 6.437073495388031
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 10, Loss: 6.431909546852112
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.17it/s]


Test Accuracy: 76.73%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625}}]
Layer2 : [[0], [1]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45735.54it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33616.37it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63604.60it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18722.79it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 1, Loss: 8.260168068408966
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 2, Loss: 7.840636904239655
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 3, Loss: 7.762958207130432
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 4, Loss: 7.7399567699432374
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 5, Loss: 7.731035721302033
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 6, Loss: 7.725821669101715
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 7, Loss: 7.72324764251709
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 8, Loss: 7.720576882362366
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 9, Loss: 7.719006671905517
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 10, Loss: 7.717794477939606
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.30it/s]


Test Accuracy: 62.35%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47443.06it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34430.34it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 61115.23it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18787.83it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 1, Loss: 7.7941187214851375
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.97it/s]


Epoch 2, Loss: 7.766654844284058
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.96it/s]


Epoch 3, Loss: 7.762134342193604
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.97it/s]


Epoch 4, Loss: 7.7607537317276005
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 5, Loss: 7.760367865562439
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.01it/s]


Epoch 6, Loss: 7.759965181350708
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.04it/s]


Epoch 7, Loss: 7.759563899040222
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 8, Loss: 7.759085202217102
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 9, Loss: 7.759114029407502
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.02it/s]


Epoch 10, Loss: 7.7590998983383175
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.42it/s]


Test Accuracy: 56.26%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125}}]
Layer3 : [[0, 1], [2, 3]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47717.12it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34091.07it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 95160.08it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18837.13it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 1, Loss: 7.803490872383118
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 2, Loss: 7.605688471794128
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 3, Loss: 7.5982009100914
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 4, Loss: 7.592731664180755
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 5, Loss: 7.588569738864899
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 6, Loss: 7.586304228305817
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 7, Loss: 7.583875696659089
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.23it/s]


Epoch 8, Loss: 7.582583107948303
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.54it/s]


Epoch 9, Loss: 7.581047742366791
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 10, Loss: 7.580169296264648
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.22it/s]


Test Accuracy: 63.20%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125}}]
Layer3 : [[0], [1]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47414.71it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34199.65it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63976.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18515.23it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.41it/s]


Epoch 1, Loss: 7.668153715133667
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.50it/s]


Epoch 2, Loss: 7.599240412712097
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.30it/s]


Epoch 3, Loss: 7.592815101146698
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.18it/s]


Epoch 4, Loss: 7.588444790840149
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.30it/s]


Epoch 5, Loss: 7.585515048503876
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 6, Loss: 7.583465049266815
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.90it/s]


Epoch 7, Loss: 7.582177987098694
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 8, Loss: 7.58136736869812
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 9, Loss: 7.580451226234436
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.66it/s]


Epoch 10, Loss: 7.580030813217163
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.50it/s]


Test Accuracy: 62.73%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}]


100%|████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 147.81it/s]


Epoch 1, Loss: 0.32189222185297695


100%|████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 153.33it/s]


Epoch 2, Loss: 0.014783088300418967


100%|████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 152.80it/s]


Epoch 3, Loss: 0.006547768712835023


100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 69.61it/s]


Test Accuracy: 0.9980
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47561.34it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34323.60it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60861.07it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18956.23it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.46it/s]


Epoch 1, Loss: 4.9929164290428165
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 2, Loss: 1.191540102660656
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 3, Loss: 0.8745498844981193
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.86it/s]


Epoch 4, Loss: 0.8032585951685906
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.42it/s]


Epoch 5, Loss: 0.758660629093647
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.42it/s]


Epoch 6, Loss: 0.7190635681152344
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 7, Loss: 0.6806049942970276
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 8, Loss: 0.6583482581377029
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.36it/s]


Epoch 9, Loss: 0.6452144944667816
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 10, Loss: 0.6357056817412376
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.20it/s]


Test Accuracy: 88.54%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625}}]
Layer1 : [[0, 1], [2, 3]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47120.05it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34240.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63050.88it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18988.50it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 1, Loss: 5.396818361282349
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.42it/s]


Epoch 2, Loss: 3.0588608330488203
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 3, Loss: 1.5434413093328476
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 4, Loss: 1.4736508935689927
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.58it/s]


Epoch 5, Loss: 1.436345826983452
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 6, Loss: 1.4047861206531524
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.39it/s]


Epoch 7, Loss: 1.3898817193508148
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.43it/s]


Epoch 8, Loss: 1.3806949293613433
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 9, Loss: 1.3731314897537232
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.80it/s]


Epoch 10, Loss: 1.366858594417572
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 15.87it/s]


Test Accuracy: 80.85%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625}}]
Layer1 : [[0], [1]]
restructuring


100%|████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 46080.46it/s]


restructuring


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33298.59it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 97130.44it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24153.07it/s]


[SYST] Epoch 0


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 1, Loss: 5.189264044761658
[SYST] Epoch 1


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.98it/s]


Epoch 2, Loss: 3.8895639979839327
[SYST] Epoch 2


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 3, Loss: 1.7903890585899354
[SYST] Epoch 3


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 4, Loss: 1.5186569571495057
[SYST] Epoch 4


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 5, Loss: 1.4907157003879548
[SYST] Epoch 5


100%|███████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.30it/s]


Epoch 6, Loss: 1.4728423196077347
[SYST] Epoch 6


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.65it/s]


Epoch 7, Loss: 1.4631366485357284
[SYST] Epoch 7


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 8, Loss: 1.4591562467813493
[SYST] Epoch 8


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 9, Loss: 1.4581907731294632
[SYST] Epoch 9


100%|███████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 10, Loss: 1.457834239602089
[SYST] Epoch 0


100%|███████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.34it/s]


Test Accuracy: 80.68%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47538.47it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34214.36it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 62589.62it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18368.82it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 1, Loss: 5.596611475944519
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.43it/s]


Epoch 2, Loss: 4.873004877567292
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 3, Loss: 4.621324620246887
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 4, Loss: 4.467289793491363
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 5, Loss: 4.3698950338363645
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 6, Loss: 4.3285036110877995
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 7, Loss: 4.310290036201477
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 8, Loss: 4.30361870765686
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 9, Loss: 4.300121939182281
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.30it/s]


Epoch 10, Loss: 4.299086000919342
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.22it/s]


Test Accuracy: 55.84%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375}}]
Layer2 : [[0, 1], [2, 3]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47819.70it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34343.30it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 94600.96it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 19089.38it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.28it/s]


Epoch 1, Loss: 5.469072048664093
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 2, Loss: 4.9312089872360225
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 3, Loss: 4.762370088100433
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.50it/s]


Epoch 4, Loss: 4.641023621559143
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.25it/s]


Epoch 5, Loss: 4.557084801197052
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.28it/s]


Epoch 6, Loss: 4.480884895324707
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.52it/s]


Epoch 7, Loss: 4.4164976882934575
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.49it/s]


Epoch 8, Loss: 4.389613049030304
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.92it/s]


Epoch 9, Loss: 4.381500179767609
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.51it/s]


Epoch 10, Loss: 4.378114287853241
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.22it/s]


Test Accuracy: 54.71%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375}}]
Layer2 : [[0], [1]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47603.95it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34144.71it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 64776.50it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18792.95it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.40it/s]


Epoch 1, Loss: 5.662243835926056
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.33it/s]


Epoch 2, Loss: 5.143418641090393
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.31it/s]


Epoch 3, Loss: 4.989042954444885
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.31it/s]


Epoch 4, Loss: 4.950976407527923
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.79it/s]


Epoch 5, Loss: 4.939950835704804
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 6, Loss: 4.93582859992981
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.90it/s]


Epoch 7, Loss: 4.934024186134338
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.68it/s]


Epoch 8, Loss: 4.932850248813629
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.27it/s]


Epoch 9, Loss: 4.932220029830932
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 10, Loss: 4.931894450187683
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.16it/s]


Test Accuracy: 47.50%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45603.01it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34338.22it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 61073.60it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18742.20it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.92it/s]


Epoch 1, Loss: 4.757727544307709
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.33it/s]


Epoch 2, Loss: 4.721855156421661
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 3, Loss: 4.71362271308899
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 4, Loss: 4.710465426445007
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 5, Loss: 4.7088468599319455
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 6, Loss: 4.70781033039093
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 7, Loss: 4.707462000846863
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.60it/s]


Epoch 8, Loss: 4.707115442752838
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.39it/s]


Epoch 9, Loss: 4.7069628810882564
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 10, Loss: 4.706957705020905
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.15it/s]


Test Accuracy: 61.30%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875}}]
Layer3 : [[0, 1], [2, 3]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47517.74it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33836.59it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 94661.14it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18756.83it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.51it/s]


Epoch 1, Loss: 4.647366526126862
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.06it/s]


Epoch 2, Loss: 4.595273461341858
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 3, Loss: 4.58640620470047
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 4, Loss: 4.581278569698334
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.76it/s]


Epoch 5, Loss: 4.578138990402222
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.98it/s]


Epoch 6, Loss: 4.576358587741852
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.44it/s]


Epoch 7, Loss: 4.575090250968933
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.28it/s]


Epoch 8, Loss: 4.574535524845123
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.99it/s]


Epoch 9, Loss: 4.57399249792099
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.25it/s]


Epoch 10, Loss: 4.573726694583893
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.36it/s]


Test Accuracy: 64.42%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875}}]
Layer3 : [[0], [1]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45318.70it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 32948.67it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63417.15it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 23336.80it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.50it/s]


Epoch 1, Loss: 5.006825175285339
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.87it/s]


Epoch 2, Loss: 4.603008329868317
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 3, Loss: 4.596046900749206
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 4, Loss: 4.59301029920578
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 5, Loss: 4.590880115032196
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.92it/s]


Epoch 6, Loss: 4.589071719646454
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.21it/s]


Epoch 7, Loss: 4.587596690654754
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.34it/s]


Epoch 8, Loss: 4.5858469414711
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.97it/s]


Epoch 9, Loss: 4.584332954883576
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.92it/s]


Epoch 10, Loss: 4.582930593490601
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.16it/s]


Test Accuracy: 63.78%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}]


100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 152.14it/s]


Epoch 1, Loss: 0.4197258357053215


100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 152.56it/s]


Epoch 2, Loss: 0.023009023089798575


100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 153.31it/s]


Epoch 3, Loss: 0.007887338624414042


100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 190.55it/s]


Test Accuracy: 0.9988
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45817.26it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33720.51it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60345.61it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24193.95it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 1, Loss: 4.788917263746262
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 2, Loss: 1.4003767731785774
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.53it/s]


Epoch 3, Loss: 0.7162284696102142
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 4, Loss: 0.4569363543391228
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.21it/s]


Epoch 5, Loss: 0.31838424146175387
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.85it/s]


Epoch 6, Loss: 0.27755711108446124
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.49it/s]


Epoch 7, Loss: 0.2618943878263235
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 8, Loss: 0.25268035896122454
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.33it/s]


Epoch 9, Loss: 0.24639391876757144
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 10, Loss: 0.24124171376228332
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.35it/s]


Test Accuracy: 94.52%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47116.40it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33853.46it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 94444.00it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18708.14it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.21it/s]


Epoch 1, Loss: 5.235003333091736
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.65it/s]


Epoch 2, Loss: 2.897854472398758
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.73it/s]


Epoch 3, Loss: 1.3745485520362855
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 4, Loss: 1.0154301086068154
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.94it/s]


Epoch 5, Loss: 0.9256123512983322
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 6, Loss: 0.8847579735517502
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 7, Loss: 0.8488406839966774
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 8, Loss: 0.7508380779623985
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.44it/s]


Epoch 9, Loss: 0.6266992872953415
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.46it/s]


Epoch 10, Loss: 0.5886951941251755
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.09it/s]


Test Accuracy: 87.83%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47706.64it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34102.07it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 66024.14it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18664.52it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.10it/s]


Epoch 1, Loss: 5.552440049648285
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.96it/s]


Epoch 2, Loss: 5.121277313232422
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 3, Loss: 5.0186372590065
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 4, Loss: 4.724090104103088
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 5, Loss: 2.904320513010025
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 6, Loss: 1.5899320167303086
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.80it/s]


Epoch 7, Loss: 1.580320034623146
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.27it/s]


Epoch 8, Loss: 1.5799446600675582
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.26it/s]


Epoch 9, Loss: 1.5800482934713365
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.25it/s]


Epoch 10, Loss: 1.5798997950553895
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.38it/s]


Test Accuracy: 84.71%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47458.35it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34362.88it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60636.74it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18678.17it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.08it/s]


Epoch 1, Loss: 4.368807915449143
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.69it/s]


Epoch 2, Loss: 1.0464555716514587
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.29it/s]


Epoch 3, Loss: 0.6939534345269203
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.05it/s]


Epoch 4, Loss: 0.6008902233839035
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.14it/s]


Epoch 5, Loss: 0.5461492200195789
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.86it/s]


Epoch 6, Loss: 0.5146894948184491
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.65it/s]


Epoch 7, Loss: 0.4954104210436344
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.39it/s]


Epoch 8, Loss: 0.4844504114985466
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 9, Loss: 0.4787171083688736
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 10, Loss: 0.4755052907764912
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.36it/s]


Test Accuracy: 91.12%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47353.03it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34271.65it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63140.08it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18756.33it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.50it/s]


Epoch 1, Loss: 4.916311715841293
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.62it/s]


Epoch 2, Loss: 2.2485717159509657
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 3, Loss: 0.9447394001483918
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.64it/s]


Epoch 4, Loss: 0.8696400952339173
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.42it/s]


Epoch 5, Loss: 0.8453558284044266
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 6, Loss: 0.823153528869152
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.38it/s]


Epoch 7, Loss: 0.7955349919199943
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 8, Loss: 0.7708982428908349
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 9, Loss: 0.7405618166923523
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.46it/s]


Epoch 10, Loss: 0.7316312569379807
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.13it/s]


Test Accuracy: 86.89%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47168.37it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34275.77it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 96461.15it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18653.13it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.42it/s]


Epoch 1, Loss: 4.911273561716079
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.27it/s]


Epoch 2, Loss: 1.9809011560678482
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.12it/s]


Epoch 3, Loss: 1.5502307224273681
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.24it/s]


Epoch 4, Loss: 1.5158250081539153
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.97it/s]


Epoch 5, Loss: 1.5083298712968827
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 6, Loss: 1.50615458548069
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 7, Loss: 1.5058079469203949
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.19it/s]


Epoch 8, Loss: 1.505527482032776
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.42it/s]


Epoch 9, Loss: 1.5055988180637359
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.25it/s]


Epoch 10, Loss: 1.5055894458293915
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.36it/s]


Test Accuracy: 82.40%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45757.37it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34050.96it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60483.54it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18877.53it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.14it/s]


Epoch 1, Loss: 4.817665903568268
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.57it/s]


Epoch 2, Loss: 4.683509438037873
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 3, Loss: 4.680020372867585
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 4, Loss: 4.67814154624939
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 5, Loss: 4.676562004089355
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 6, Loss: 4.675973346233368
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.48it/s]


Epoch 7, Loss: 4.675526373386383
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.46it/s]


Epoch 8, Loss: 4.675179917812347
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 9, Loss: 4.6747451019287105
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 10, Loss: 4.674432365894318
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.19it/s]


Test Accuracy: 60.47%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45999.57it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33533.26it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 94782.89it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24508.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.24it/s]


Epoch 1, Loss: 4.733534679412842
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 2, Loss: 4.546719493865967
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 3, Loss: 4.534369173049927
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 4, Loss: 4.528017399311065
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.37it/s]


Epoch 5, Loss: 4.52465722322464
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.71it/s]


Epoch 6, Loss: 4.523067252635956
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.25it/s]


Epoch 7, Loss: 4.5218084025383
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 8, Loss: 4.521456594467163
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.57it/s]


Epoch 9, Loss: 4.520649085044861
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.29it/s]


Epoch 10, Loss: 4.520461349487305
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.18it/s]


Test Accuracy: 63.55%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47512.60it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33891.08it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 65682.21it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 19064.42it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.20it/s]


Epoch 1, Loss: 5.089748113155365
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.19it/s]


Epoch 2, Loss: 4.550630655288696
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 3, Loss: 4.533924593925476
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 4, Loss: 4.528602218627929
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.46it/s]


Epoch 5, Loss: 4.525769910812378
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.65it/s]


Epoch 6, Loss: 4.524241259098053
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.34it/s]


Epoch 7, Loss: 4.523014531135559
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 8, Loss: 4.52241516828537
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 9, Loss: 4.521975824832916
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 10, Loss: 4.521552686691284
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.31it/s]


Test Accuracy: 62.54%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 136.26it/s]


Epoch 1, Loss: 0.37394602018684964


100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 127.82it/s]


Epoch 2, Loss: 0.024782897817658522


100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 125.57it/s]


Epoch 3, Loss: 0.006823100639508084


100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 176.59it/s]


Test Accuracy: 0.9989
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47525.03it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33716.59it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:14<00:00, 89920.11it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18285.95it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.57it/s]


Epoch 1, Loss: 6.6115845668315885
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.04it/s]


Epoch 2, Loss: 2.3790087413787844
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.72it/s]


Epoch 3, Loss: 1.086277961730957
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.25it/s]


Epoch 4, Loss: 0.8507262772321701
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 5, Loss: 0.7794978266954422
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 6, Loss: 0.7361741521954537
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.07it/s]


Epoch 7, Loss: 0.7012571924924851
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.20it/s]


Epoch 8, Loss: 0.6738351312279701
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.58it/s]


Epoch 9, Loss: 0.6528042110800744
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.02it/s]


Epoch 10, Loss: 0.6320796176791191
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.20it/s]


Test Accuracy: 89.27%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47484.96it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34197.71it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63539.42it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18940.20it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.19it/s]


Epoch 1, Loss: 5.399296894073486
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 2, Loss: 2.9145998573303222
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 3, Loss: 2.1235012185573576
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.31it/s]


Epoch 4, Loss: 1.8690727353096008
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.64it/s]


Epoch 5, Loss: 1.6704526090621947
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.48it/s]


Epoch 6, Loss: 1.6116276878118514
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.21it/s]


Epoch 7, Loss: 1.5976207327842713
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.29it/s]


Epoch 8, Loss: 1.5917951142787934
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.87it/s]


Epoch 9, Loss: 1.5886713236570358
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 10, Loss: 1.5867445015907287
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.30it/s]


Test Accuracy: 85.78%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47828.87it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34197.65it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:25<00:00, 49856.24it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18964.46it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.21it/s]


Epoch 1, Loss: 5.618867163658142
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 2, Loss: 4.770541496276856
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.87it/s]


Epoch 3, Loss: 3.182687819004059
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.35it/s]


Epoch 4, Loss: 2.390585069656372
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.28it/s]


Epoch 5, Loss: 2.285021367073059
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.30it/s]


Epoch 6, Loss: 2.255044605731964
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.00it/s]


Epoch 7, Loss: 2.253246372938156
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 8, Loss: 2.252977519035339
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 9, Loss: 2.2531605017185212
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 10, Loss: 2.2532524251937867
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.25it/s]


Test Accuracy: 83.51%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47143.52it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33978.12it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:14<00:00, 90218.90it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18908.49it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.59it/s]


Epoch 1, Loss: 5.314532580375672
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.51it/s]


Epoch 2, Loss: 4.558294456005097
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.38it/s]


Epoch 3, Loss: 4.291253180503845
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.66it/s]


Epoch 4, Loss: 4.203712097406387
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.39it/s]


Epoch 5, Loss: 4.176865199804306
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.54it/s]


Epoch 6, Loss: 4.161231596469879
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.83it/s]


Epoch 7, Loss: 4.149257873296738
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.22it/s]


Epoch 8, Loss: 4.138680050373077
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.20it/s]


Epoch 9, Loss: 4.128203266859055
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.22it/s]


Epoch 10, Loss: 4.1205064332485195
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 15.97it/s]


Test Accuracy: 65.08%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45393.81it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33157.84it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 62775.46it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 30609.23it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.38it/s]


Epoch 1, Loss: 5.910371677875519
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.84it/s]


Epoch 2, Loss: 5.038502345085144
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 3, Loss: 4.8803568363189695
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.96it/s]


Epoch 4, Loss: 4.782522323131562
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.08it/s]


Epoch 5, Loss: 4.724379274845123
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.15it/s]


Epoch 6, Loss: 4.686460175514221
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 7, Loss: 4.659385180473327
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 8, Loss: 4.641137938499451
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.11it/s]


Epoch 9, Loss: 4.629799642562866
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.46it/s]


Epoch 10, Loss: 4.621877217292786
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.46it/s]


Test Accuracy: 61.99%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45539.21it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34069.43it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63688.59it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 25172.32it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.95it/s]


Epoch 1, Loss: 5.960937895774841
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 2, Loss: 5.2826410579681395
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 3, Loss: 5.06332266330719
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.69it/s]


Epoch 4, Loss: 4.995819492340088
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 5, Loss: 4.945791685581208
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.92it/s]


Epoch 6, Loss: 4.911941390037537
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 7, Loss: 4.8925932502746585
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 8, Loss: 4.882484617233277
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.38it/s]


Epoch 9, Loss: 4.875937993526459
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.40it/s]


Epoch 10, Loss: 4.872554879188538
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.40it/s]


Test Accuracy: 60.83%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45240.43it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33276.57it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:14<00:00, 90379.29it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 22418.09it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.94it/s]


Epoch 1, Loss: 5.142143259048462
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.94it/s]


Epoch 2, Loss: 5.055905506610871
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.13it/s]


Epoch 3, Loss: 5.048458807468414
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 4, Loss: 5.043350262641907
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.03it/s]


Epoch 5, Loss: 5.039865260124206
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.19it/s]


Epoch 6, Loss: 5.03769853591919
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.17it/s]


Epoch 7, Loss: 5.036101970672608
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.18it/s]


Epoch 8, Loss: 5.035076191425324
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 9, Loss: 5.034267315864563
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.23it/s]


Epoch 10, Loss: 5.033403799533844
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.26it/s]


Test Accuracy: 63.12%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47186.33it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34324.99it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 65081.40it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18847.38it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.48it/s]


Epoch 1, Loss: 5.039049956798554
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.37it/s]


Epoch 2, Loss: 4.922648725509643
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.36it/s]


Epoch 3, Loss: 4.905893232822418
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.49it/s]


Epoch 4, Loss: 4.897276263237
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.84it/s]


Epoch 5, Loss: 4.892461841106415
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.51it/s]


Epoch 6, Loss: 4.889489667415619
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 7, Loss: 4.888260188102723
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.14it/s]


Epoch 8, Loss: 4.887367243766785
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.25it/s]


Epoch 9, Loss: 4.88675571680069
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.22it/s]


Epoch 10, Loss: 4.886323730945588
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.10it/s]


Test Accuracy: 66.46%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47776.50it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34445.01it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 64040.37it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 19029.93it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 1, Loss: 5.458766822814941
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.24it/s]


Epoch 2, Loss: 4.917831797599792
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.97it/s]


Epoch 3, Loss: 4.9091235089302065
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 4, Loss: 4.903597388267517
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 5, Loss: 4.899427809715271
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.80it/s]


Epoch 6, Loss: 4.896126298904419
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.13it/s]


Epoch 7, Loss: 4.89393700838089
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.96it/s]


Epoch 8, Loss: 4.891962344646454
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.25it/s]


Epoch 9, Loss: 4.890767638683319
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.35it/s]


Epoch 10, Loss: 4.889737026691437
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.38it/s]


Test Accuracy: 66.45%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 142.99it/s]


Epoch 1, Loss: 0.3857630563506973


100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 143.03it/s]


Epoch 2, Loss: 0.039890277173526556


100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 142.44it/s]


Epoch 3, Loss: 0.013168029736789322


100%|██████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 67.01it/s]


Test Accuracy: 0.9974
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47489.43it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34039.67it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60366.93it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18604.83it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.23it/s]


Epoch 1, Loss: 5.00598147392273
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.15it/s]


Epoch 2, Loss: 1.076872937977314
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.18it/s]


Epoch 3, Loss: 0.5677515749633312
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 4, Loss: 0.3948661644756794
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 5, Loss: 0.32154242172837255
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.14it/s]


Epoch 6, Loss: 0.2865560656785965
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 7, Loss: 0.26593992076814177
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.89it/s]


Epoch 8, Loss: 0.2509841763973236
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.10it/s]


Epoch 9, Loss: 0.23915222823619842
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.13it/s]


Epoch 10, Loss: 0.22952707089483737
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.12it/s]


Test Accuracy: 94.69%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47420.85it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34272.22it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 95389.68it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18687.93it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.83it/s]


Epoch 1, Loss: 5.156277453899383
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 2, Loss: 3.6492382061481474
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 3, Loss: 1.452484789788723
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 4, Loss: 0.8574174854159355
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 5, Loss: 0.801373153924942
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.94it/s]


Epoch 6, Loss: 0.7926535812020302
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.92it/s]


Epoch 7, Loss: 0.7922663927078247
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.94it/s]


Epoch 8, Loss: 0.7920204314589501
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 9, Loss: 0.7920019546151161
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 10, Loss: 0.7921586227416992
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 15.72it/s]


Test Accuracy: 88.22%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47406.98it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34105.40it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 65298.44it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18551.63it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.44it/s]


Epoch 1, Loss: 5.273021335601807
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.41it/s]


Epoch 2, Loss: 4.48890408039093
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.70it/s]


Epoch 3, Loss: 4.009258215427399
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.42it/s]


Epoch 4, Loss: 3.929028353691101
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 5, Loss: 3.918257668018341
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 6, Loss: 3.903422110080719
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.65it/s]


Epoch 7, Loss: 3.8878015899658203
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.12it/s]


Epoch 8, Loss: 3.879633182287216
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.55it/s]


Epoch 9, Loss: 3.8764418184757234
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.57it/s]


Epoch 10, Loss: 3.875311954021454
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.44it/s]


Test Accuracy: 55.38%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47668.75it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34043.21it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60361.96it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18635.61it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 1, Loss: 5.0932107615470885
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 2, Loss: 3.7820382583141328
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 3, Loss: 3.2497825062274934
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.31it/s]


Epoch 4, Loss: 3.05197412610054
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.24it/s]


Epoch 5, Loss: 3.0001117992401123
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 6, Loss: 2.9823541820049284
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 7, Loss: 2.9724824941158294
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.13it/s]


Epoch 8, Loss: 2.965681841373444
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.58it/s]


Epoch 9, Loss: 2.9599413442611695
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.28it/s]


Epoch 10, Loss: 2.955307968854904
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.16it/s]


Test Accuracy: 68.89%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47475.86it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34029.57it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 94099.27it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18785.50it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.97it/s]


Epoch 1, Loss: 5.291518416404724
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 2, Loss: 4.059922307729721
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 3, Loss: 3.720995314121246
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 4, Loss: 3.5795836555957794
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 5, Loss: 3.474389697313309
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 6, Loss: 3.41475900053978
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 7, Loss: 3.3886093270778654
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 8, Loss: 3.378091118335724
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 9, Loss: 3.374398726224899
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.24it/s]


Epoch 10, Loss: 3.3729921329021453
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.36it/s]


Test Accuracy: 56.16%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47440.92it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33497.51it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63699.43it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18491.86it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.51it/s]


Epoch 1, Loss: 5.395411469936371
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.52it/s]


Epoch 2, Loss: 4.734945764541626
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.29it/s]


Epoch 3, Loss: 4.4614333486557
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 4, Loss: 4.37701753616333
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 5, Loss: 4.320792692899704
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 6, Loss: 4.267142832279205
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 7, Loss: 4.225881907939911
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 8, Loss: 4.203054232597351
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.37it/s]


Epoch 9, Loss: 4.190039057731628
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.28it/s]


Epoch 10, Loss: 4.181640858650208
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.45it/s]


Test Accuracy: 52.09%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47380.53it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34037.64it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60517.07it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18570.35it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.26it/s]


Epoch 1, Loss: 4.6518704175949095
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 2, Loss: 4.612866518497467
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.36it/s]


Epoch 3, Loss: 4.610768604278564
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 4, Loss: 4.610209901332855
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 5, Loss: 4.609473674297333
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.39it/s]


Epoch 6, Loss: 4.609026753902436
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 7, Loss: 4.608404409885407
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.36it/s]


Epoch 8, Loss: 4.608029277324676
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 9, Loss: 4.607597680091858
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.32it/s]


Epoch 10, Loss: 4.607489140033722
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.26it/s]


Test Accuracy: 61.40%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45209.89it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34299.50it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 93792.64it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24384.05it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.98it/s]


Epoch 1, Loss: 4.807189562320709
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 2, Loss: 4.494284315109253
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.21it/s]


Epoch 3, Loss: 4.486496045589447
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 4, Loss: 4.482961525917053
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 5, Loss: 4.480600430965423
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 6, Loss: 4.4787612986564636
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 7, Loss: 4.477616717815399
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 8, Loss: 4.476616928577423
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 9, Loss: 4.475702021121979
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 10, Loss: 4.475084216594696
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.18it/s]


Test Accuracy: 62.52%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47578.27it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33989.63it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63382.91it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18838.59it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 1, Loss: 4.805431883335114
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.95it/s]


Epoch 2, Loss: 4.48916482925415
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.37it/s]


Epoch 3, Loss: 4.476779425144196
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.33it/s]


Epoch 4, Loss: 4.474441587924957
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.32it/s]


Epoch 5, Loss: 4.473159177303314
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 6, Loss: 4.47235641002655
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.81it/s]


Epoch 7, Loss: 4.47195672750473
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.37it/s]


Epoch 8, Loss: 4.471696012020111
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.92it/s]


Epoch 9, Loss: 4.471516463756561
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 10, Loss: 4.471292266845703
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.31it/s]


Test Accuracy: 63.25%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 143.96it/s]


Epoch 1, Loss: 0.3097679736538339


100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 143.00it/s]


Epoch 2, Loss: 0.007628567830806787


100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 149.11it/s]


Epoch 3, Loss: 0.0027952379446105624


100%|██████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 69.03it/s]


Test Accuracy: 0.9999
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47805.54it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34033.15it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60496.29it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18819.18it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.74it/s]


Epoch 1, Loss: 4.338707173764706
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.36it/s]


Epoch 2, Loss: 0.6279814231395722
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 3, Loss: 0.3935586531460285
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.53it/s]


Epoch 4, Loss: 0.29931221544742587
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 5, Loss: 0.2589162576943636
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 6, Loss: 0.23350911118090154
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.53it/s]


Epoch 7, Loss: 0.2126034453511238
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.58it/s]


Epoch 8, Loss: 0.19517571344971657
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 9, Loss: 0.1814660021662712
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.95it/s]


Epoch 10, Loss: 0.1708234740048647
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.38it/s]


Test Accuracy: 95.11%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45533.79it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 32972.35it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 62617.90it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 23755.18it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.65it/s]


Epoch 1, Loss: 5.4828021109104155
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.23it/s]


Epoch 2, Loss: 1.2335283967852593
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.99it/s]


Epoch 3, Loss: 0.5724857702851296
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.92it/s]


Epoch 4, Loss: 0.5134413510560989
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.19it/s]


Epoch 5, Loss: 0.4745755606889725
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.51it/s]


Epoch 6, Loss: 0.43711347118020055
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 7, Loss: 0.3926315069198608
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.46it/s]


Epoch 8, Loss: 0.3499263766407967
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.06it/s]


Epoch 9, Loss: 0.31437762290239335
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.34it/s]


Epoch 10, Loss: 0.28860890127718447
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.18it/s]


Test Accuracy: 93.56%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47524.51it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34066.84it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 96659.52it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18706.24it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.90it/s]


Epoch 1, Loss: 6.161028978824615
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 2, Loss: 2.276881358921528
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 3, Loss: 0.6870517125725746
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 4, Loss: 0.6641345179080963
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 5, Loss: 0.6625363802909852
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 6, Loss: 0.6622779887914657
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 7, Loss: 0.6623009890317917
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 8, Loss: 0.662226727604866
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 9, Loss: 0.6623452112078667
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 10, Loss: 0.6624749660491943
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.15it/s]


Test Accuracy: 91.09%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47236.10it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34290.52it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 61874.85it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18594.04it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 1, Loss: 4.407641079425812
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.21it/s]


Epoch 2, Loss: 3.634679369926453
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 3, Loss: 3.585112886428833
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 4, Loss: 3.561346887350082
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.20it/s]


Epoch 5, Loss: 3.545518306493759
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.89it/s]


Epoch 6, Loss: 3.534777770042419
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.14it/s]


Epoch 7, Loss: 3.5273517847061155
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.48it/s]


Epoch 8, Loss: 3.522198920249939
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 9, Loss: 3.5189402055740358
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.36it/s]


Epoch 10, Loss: 3.516502110958099
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.18it/s]


Test Accuracy: 73.11%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47202.73it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34029.03it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 62210.59it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18686.56it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.96it/s]


Epoch 1, Loss: 6.289004874229431
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 2, Loss: 5.355812799930573
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 3, Loss: 4.567386856079102
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 4, Loss: 4.18386761546135
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.36it/s]


Epoch 5, Loss: 4.145770304203033
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.51it/s]


Epoch 6, Loss: 4.108358289003372
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.22it/s]


Epoch 7, Loss: 4.025052486658097
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.26it/s]


Epoch 8, Loss: 3.940395601987839
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.45it/s]


Epoch 9, Loss: 3.900577119588852
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.32it/s]


Epoch 10, Loss: 3.8851891028881074
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.35it/s]


Test Accuracy: 69.34%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47839.45it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34199.89it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 66008.80it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18989.16it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.04it/s]


Epoch 1, Loss: 6.301885395050049
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.82it/s]


Epoch 2, Loss: 5.563034105300903
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 3, Loss: 5.444034261703491
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 4, Loss: 5.418616719245911
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.12it/s]


Epoch 5, Loss: 5.408533489704132
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 6, Loss: 5.404738402366638
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.75it/s]


Epoch 7, Loss: 5.40308744430542
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.69it/s]


Epoch 8, Loss: 5.40210782289505
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.33it/s]


Epoch 9, Loss: 5.401541976928711
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 10, Loss: 5.400623769760132
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.25it/s]


Test Accuracy: 52.30%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45931.55it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33549.90it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:14<00:00, 90071.12it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 23340.20it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 1, Loss: 5.453876285552979
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.09it/s]


Epoch 2, Loss: 5.4401545596122745
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.09it/s]


Epoch 3, Loss: 5.434700133800507
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.26it/s]


Epoch 4, Loss: 5.43130544424057
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.84it/s]


Epoch 5, Loss: 5.429638295173645
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.43it/s]


Epoch 6, Loss: 5.428073036670685
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 7, Loss: 5.426930129528046
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 8, Loss: 5.426288137435913
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 9, Loss: 5.425967667102814
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.94it/s]


Epoch 10, Loss: 5.425514430999756
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.26it/s]


Test Accuracy: 62.31%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45877.08it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34242.12it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63424.81it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24414.22it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 1, Loss: 5.537850587368012
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 2, Loss: 5.304735486507416
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.69it/s]


Epoch 3, Loss: 5.288455002307892
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 4, Loss: 5.283562390804291
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.45it/s]


Epoch 5, Loss: 5.280865566730499
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 6, Loss: 5.278693764209748
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 7, Loss: 5.2774259781837465
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.95it/s]


Epoch 8, Loss: 5.276331412792206
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 9, Loss: 5.275709247589111
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 10, Loss: 5.275371532440186
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.33it/s]


Test Accuracy: 66.81%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47538.69it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33947.24it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 64029.72it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18903.33it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.16it/s]


Epoch 1, Loss: 5.923500638008118
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.61it/s]


Epoch 2, Loss: 5.318772358894348
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.66it/s]


Epoch 3, Loss: 5.290295991897583
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.36it/s]


Epoch 4, Loss: 5.283697745800018
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.38it/s]


Epoch 5, Loss: 5.280702459812164
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 6, Loss: 5.279348032474518
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 7, Loss: 5.277790794372558
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.39it/s]


Epoch 8, Loss: 5.276369249820709
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.44it/s]


Epoch 9, Loss: 5.275530693531036
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.31it/s]


Epoch 10, Loss: 5.275212223529816
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.50it/s]


Test Accuracy: 66.97%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 142.18it/s]


Epoch 1, Loss: 0.3574014954665472


100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 143.04it/s]


Epoch 2, Loss: 0.015140544351197605


100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 142.20it/s]


Epoch 3, Loss: 0.005817382145664851


100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 175.55it/s]


Test Accuracy: 0.9990
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45912.36it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33349.00it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 61232.37it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 23862.40it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 1, Loss: 4.60792829990387
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.43it/s]


Epoch 2, Loss: 0.9925034564733505
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 3, Loss: 0.763763377070427
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 4, Loss: 0.5984263670444488
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 5, Loss: 0.48036968261003493
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.52it/s]


Epoch 6, Loss: 0.3968458794057369
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.19it/s]


Epoch 7, Loss: 0.3386587481200695
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 8, Loss: 0.293731522411108
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.52it/s]


Epoch 9, Loss: 0.25912154503166673
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.31it/s]


Epoch 10, Loss: 0.24041942797601223
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 15.60it/s]


Test Accuracy: 94.12%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47552.38it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34092.99it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 62661.58it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18790.80it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.49it/s]


Epoch 1, Loss: 7.107580652236939
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 2, Loss: 2.811825217008591
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 3, Loss: 1.2871299982070923
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.51it/s]


Epoch 4, Loss: 1.20901016831398
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 5, Loss: 1.1370824432373048
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 6, Loss: 1.0899299070239068
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 7, Loss: 1.05627207249403
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 8, Loss: 1.0254557687044143
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.24it/s]


Epoch 9, Loss: 0.9885383200645447
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 10, Loss: 0.9141130557656288
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.12it/s]


Test Accuracy: 90.40%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47407.90it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33817.32it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 96124.40it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18842.25it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 1, Loss: 7.55439849615097
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 2, Loss: 6.389109008312225
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 3, Loss: 2.42109541118145
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 4, Loss: 1.0036169627308846
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 5, Loss: 0.9978131061792374
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 6, Loss: 0.9979006853699685
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 7, Loss: 0.9978981184959411
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 8, Loss: 0.9978543588519097
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.08it/s]


Epoch 9, Loss: 0.9980839660763741
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 10, Loss: 0.9977417793869973
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 15.76it/s]


Test Accuracy: 87.95%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 46028.90it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34136.52it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60938.09it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24346.36it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.45it/s]


Epoch 1, Loss: 7.6501254463195805
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.50it/s]


Epoch 2, Loss: 5.288992402553558
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 3, Loss: 4.847164967060089
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 4, Loss: 4.754047837257385
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 5, Loss: 4.701425454616547
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 6, Loss: 4.665859093666077
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.57it/s]


Epoch 7, Loss: 4.645229277610778
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.09it/s]


Epoch 8, Loss: 4.634672853946686
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 9, Loss: 4.630899794101715
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.52it/s]


Epoch 10, Loss: 4.628254745006561
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.11it/s]


Test Accuracy: 68.98%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47014.85it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33730.21it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 95180.12it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18871.15it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 1, Loss: 7.76260213136673
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 2, Loss: 5.75796885728836
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 3, Loss: 5.2556688952445985
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 4, Loss: 5.178461465835571
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.45it/s]


Epoch 5, Loss: 5.157031004428863
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 6, Loss: 5.144310569763183
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 7, Loss: 5.136011893749237
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.90it/s]


Epoch 8, Loss: 5.130547804832458
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.64it/s]


Epoch 9, Loss: 5.126735467910766
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 10, Loss: 5.123499464988709
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.27it/s]


Test Accuracy: 68.65%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47423.34it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34155.37it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 65597.53it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18951.89it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 1, Loss: 7.149807832241058
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.14it/s]


Epoch 2, Loss: 5.786202659606934
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.54it/s]


Epoch 3, Loss: 5.433159935474396
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 4, Loss: 5.394662477970123
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.57it/s]


Epoch 5, Loss: 5.391294462680817
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.54it/s]


Epoch 6, Loss: 5.390890369415283
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.94it/s]


Epoch 7, Loss: 5.390902283191681
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.73it/s]


Epoch 8, Loss: 5.390821402072906
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.64it/s]


Epoch 9, Loss: 5.391180772781372
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 10, Loss: 5.391182148456574
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.21it/s]


Test Accuracy: 62.83%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47221.58it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33940.42it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60910.66it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18630.97it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 1, Loss: 6.710756337642669
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 2, Loss: 6.68599592924118
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.17it/s]


Epoch 3, Loss: 6.6622402024269105
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.84it/s]


Epoch 4, Loss: 6.644556918144226
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 5, Loss: 6.635106754302979
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.60it/s]


Epoch 6, Loss: 6.631284463405609
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 7, Loss: 6.628736727237701
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 8, Loss: 6.627909004688263
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 9, Loss: 6.627453789710999
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 10, Loss: 6.627383952140808
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.02it/s]


Test Accuracy: 59.51%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47812.66it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34102.94it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 62987.40it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18983.74it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 1, Loss: 6.887090501785278
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 2, Loss: 6.500418775081634
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 3, Loss: 6.488236765861512
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 4, Loss: 6.481735022068023
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.29it/s]


Epoch 5, Loss: 6.4768563580513
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 6, Loss: 6.471982450485229
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.65it/s]


Epoch 7, Loss: 6.467510888576507
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.39it/s]


Epoch 8, Loss: 6.463770823478699
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.50it/s]


Epoch 9, Loss: 6.460305438041687
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.49it/s]


Epoch 10, Loss: 6.45782767534256
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.20it/s]


Test Accuracy: 63.20%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47362.99it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34037.06it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 96610.97it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18751.63it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 1, Loss: 6.972024862766266
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 2, Loss: 6.512802243232727
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.48it/s]


Epoch 3, Loss: 6.48529176235199
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 4, Loss: 6.473561553955078
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 5, Loss: 6.465754265785217
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.51it/s]


Epoch 6, Loss: 6.460922133922577
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 7, Loss: 6.45749685049057
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.15it/s]


Epoch 8, Loss: 6.455653264522552
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.49it/s]


Epoch 9, Loss: 6.453908174037934
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.30it/s]


Epoch 10, Loss: 6.452592771053315
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.22it/s]


Test Accuracy: 62.62%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 148.54it/s]


Epoch 1, Loss: 0.38355926010990515


100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 128.16it/s]


Epoch 2, Loss: 0.03378432711087953


100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 128.36it/s]


Epoch 3, Loss: 0.012388689063300262


100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 188.99it/s]


Test Accuracy: 0.9968
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47734.79it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34066.00it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47777.69it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18505.76it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.46it/s]


Epoch 1, Loss: 5.265699886083603
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 2, Loss: 1.4227986246347428
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 3, Loss: 0.9850717172026634
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 4, Loss: 0.7341395348310471
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 5, Loss: 0.5866585925221444
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.60it/s]


Epoch 6, Loss: 0.5289156547188759
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 7, Loss: 0.4948231337964535
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.52it/s]


Epoch 8, Loss: 0.46789141789078714
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.49it/s]


Epoch 9, Loss: 0.4457655702531338
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 10, Loss: 0.428102303892374
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.12it/s]


Test Accuracy: 92.78%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47237.55it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33819.39it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63278.76it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18623.98it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.48it/s]


Epoch 1, Loss: 4.945327632427215
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 2, Loss: 2.2771092557907107
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 3, Loss: 1.8933386313915253
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 4, Loss: 1.483151348233223
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 5, Loss: 1.1625540149211884
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 6, Loss: 1.0230046293139459
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.54it/s]


Epoch 7, Loss: 0.9945848938822747
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 8, Loss: 0.987373956143856
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.21it/s]


Epoch 9, Loss: 0.9846354085206985
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 10, Loss: 0.9826371175050735
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.24it/s]


Test Accuracy: 85.38%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47463.73it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34095.33it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 65336.87it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18878.91it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.48it/s]


Epoch 1, Loss: 5.92548394203186
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.88it/s]


Epoch 2, Loss: 4.767933900356293
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 3, Loss: 4.035566431283951
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 4, Loss: 3.8212420630455015
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.53it/s]


Epoch 5, Loss: 3.583903065919876
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 6, Loss: 3.4966472327709197
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 7, Loss: 3.489279593229294
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 8, Loss: 3.485862989425659
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 9, Loss: 3.480082814693451
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.31it/s]


Epoch 10, Loss: 3.474494044780731
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.44it/s]


Test Accuracy: 63.35%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47475.24it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34398.04it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:14<00:00, 90810.79it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18736.33it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.90it/s]


Epoch 1, Loss: 4.139603565931321
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 2, Loss: 3.047731181383133
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 3, Loss: 2.8003233814239503
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.60it/s]


Epoch 4, Loss: 2.720344524383545
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.08it/s]


Epoch 5, Loss: 2.681499592065811
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.06it/s]


Epoch 6, Loss: 2.660893894433975
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.86it/s]


Epoch 7, Loss: 2.6495705687999727
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 8, Loss: 2.6433046007156373
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.65it/s]


Epoch 9, Loss: 2.640033149719238
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 10, Loss: 2.6371451807022095
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.07it/s]


Test Accuracy: 73.45%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45838.34it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 32940.42it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63446.63it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 27792.08it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.66it/s]


Epoch 1, Loss: 6.343462631702423
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 2, Loss: 5.075106072425842
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 3, Loss: 4.409189831018448
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.39it/s]


Epoch 4, Loss: 4.227816791534424
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.64it/s]


Epoch 5, Loss: 4.180743638277054
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 6, Loss: 4.148730617761612
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.42it/s]


Epoch 7, Loss: 4.119430367946625
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.39it/s]


Epoch 8, Loss: 4.092947010993957
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.62it/s]


Epoch 9, Loss: 4.068333315849304
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.32it/s]


Epoch 10, Loss: 4.044765263795853
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 15.63it/s]


Test Accuracy: 62.74%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47579.22it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33961.98it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 96557.34it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18965.26it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.44it/s]


Epoch 1, Loss: 5.854203581809998
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.30it/s]


Epoch 2, Loss: 4.919173617362976
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.58it/s]


Epoch 3, Loss: 4.332908269166946
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 4, Loss: 4.114103291034699
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 5, Loss: 4.047385710477829
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 6, Loss: 4.00480947971344
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 7, Loss: 4.001468849182129
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 8, Loss: 4.001130664348603
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 9, Loss: 4.001660816669464
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 10, Loss: 4.001156843900681
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.33it/s]


Test Accuracy: 67.30%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47772.46it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34149.64it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 61845.59it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18608.57it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 1, Loss: 5.336633315086365
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.32it/s]


Epoch 2, Loss: 5.029579589366913
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 3, Loss: 5.025690817832947
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 4, Loss: 5.024405403137207
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 5, Loss: 5.023756284713745
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.67it/s]


Epoch 6, Loss: 5.023209640979767
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 7, Loss: 5.022439732551574
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.24it/s]


Epoch 8, Loss: 5.021967904567719
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.27it/s]


Epoch 9, Loss: 5.021444425582886
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.25it/s]


Epoch 10, Loss: 5.021072852611542
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.36it/s]


Test Accuracy: 56.92%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47684.21it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34318.51it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63287.04it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 19116.81it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 1, Loss: 5.1720750975608825
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 2, Loss: 4.907039875984192
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 3, Loss: 4.877675805091858
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.05it/s]


Epoch 4, Loss: 4.870528588294983
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.95it/s]


Epoch 5, Loss: 4.868554034233093
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.98it/s]


Epoch 6, Loss: 4.867866189479828
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 7, Loss: 4.867214434146881
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 8, Loss: 4.866785042285919
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 9, Loss: 4.866571025848389
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 10, Loss: 4.866290190219879
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.22it/s]


Test Accuracy: 61.67%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45706.64it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34021.68it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63849.53it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24411.47it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 1, Loss: 5.528446841239929
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.02it/s]


Epoch 2, Loss: 4.900845346450805
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 3, Loss: 4.886379585266114
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 4, Loss: 4.881956298351287
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.65it/s]


Epoch 5, Loss: 4.87835058927536
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 6, Loss: 4.875438702106476
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 7, Loss: 4.872789325714112
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.53it/s]


Epoch 8, Loss: 4.870699009895325
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.57it/s]


Epoch 9, Loss: 4.869474527835846
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 10, Loss: 4.867906537055969
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.32it/s]


Test Accuracy: 62.27%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 151.61it/s]


Epoch 1, Loss: 0.35149138433189364


100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 149.92it/s]


Epoch 2, Loss: 0.03739497198512254


100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 140.50it/s]


Epoch 3, Loss: 0.009781862644103967


100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 175.51it/s]


Test Accuracy: 0.9991
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47564.97it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34151.01it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60148.39it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18487.91it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.29it/s]


Epoch 1, Loss: 3.4223238730430605
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.25it/s]


Epoch 2, Loss: 1.3240315932035447
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.52it/s]


Epoch 3, Loss: 0.9760488203167915
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 4, Loss: 0.9114072331786156
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.86it/s]


Epoch 5, Loss: 0.8860694295167924
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 6, Loss: 0.8642080122232437
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 7, Loss: 0.8440814605355262
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.26it/s]


Epoch 8, Loss: 0.8283451509475708
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 9, Loss: 0.8199205657839775
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 10, Loss: 0.8158518329262734
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.23it/s]


Test Accuracy: 86.53%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47549.48it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34456.79it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63259.35it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18935.18it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.55it/s]


Epoch 1, Loss: 4.884028657674789
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 2, Loss: 3.248573114871979
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 3, Loss: 2.3022200870513916
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 4, Loss: 2.0127602940797806
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.34it/s]


Epoch 5, Loss: 1.8572109162807464
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.23it/s]


Epoch 6, Loss: 1.744920662045479
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.24it/s]


Epoch 7, Loss: 1.721743076443672
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.98it/s]


Epoch 8, Loss: 1.717961602807045
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.25it/s]


Epoch 9, Loss: 1.7166235083341599
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 10, Loss: 1.715611182451248
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.24it/s]


Test Accuracy: 79.10%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47582.31it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33962.92it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63972.11it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18779.07it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 1, Loss: 5.438808326721191
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 2, Loss: 4.04993192434311
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.05it/s]


Epoch 3, Loss: 3.04163959980011
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.37it/s]


Epoch 4, Loss: 2.6951693332195283
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.34it/s]


Epoch 5, Loss: 2.571192628145218
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.36it/s]


Epoch 6, Loss: 2.5554720795154573
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.26it/s]


Epoch 7, Loss: 2.55269403219223
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 8, Loss: 2.5515993082523347
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.33it/s]


Epoch 9, Loss: 2.5515690338611603
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.30it/s]


Epoch 10, Loss: 2.551728985309601
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.36it/s]


Test Accuracy: 78.64%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 46030.69it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34261.13it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 61100.95it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24418.55it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.06it/s]


Epoch 1, Loss: 4.368678362369537
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 2, Loss: 3.474849764108658
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.38it/s]


Epoch 3, Loss: 2.98104287981987
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 4, Loss: 2.89804771900177
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.36it/s]


Epoch 5, Loss: 2.87066202044487
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 6, Loss: 2.859658204317093
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.40it/s]


Epoch 7, Loss: 2.853176509141922
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.57it/s]


Epoch 8, Loss: 2.84848757982254
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 9, Loss: 2.844595032930374
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 10, Loss: 2.841085053682327
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.22it/s]


Test Accuracy: 72.23%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45925.40it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34305.11it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63378.21it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24818.76it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.03it/s]


Epoch 1, Loss: 5.452678310871124
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 2, Loss: 4.284823387861252
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.95it/s]


Epoch 3, Loss: 3.923637036085129
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 4, Loss: 3.557220004796982
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.95it/s]


Epoch 5, Loss: 3.2812996327877046
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.94it/s]


Epoch 6, Loss: 3.1810943973064423
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 7, Loss: 3.129916272163391
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.40it/s]


Epoch 8, Loss: 3.1007952916622163
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 9, Loss: 3.0839278733730318
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.64it/s]


Epoch 10, Loss: 3.074138342142105
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.25it/s]


Test Accuracy: 68.60%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47624.91it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34286.95it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63947.58it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18855.62it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 1, Loss: 5.6031137824058534
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.94it/s]


Epoch 2, Loss: 4.4404878842830655
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 3, Loss: 4.112223385572434
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.46it/s]


Epoch 4, Loss: 3.9627435994148255
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 5, Loss: 3.8623994755744935
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 6, Loss: 3.8131585478782655
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 7, Loss: 3.7949933981895447
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 8, Loss: 3.7861552059650423
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 9, Loss: 3.781027797460556
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 10, Loss: 3.777937977313995
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.33it/s]


Test Accuracy: 60.14%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47341.35it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33723.85it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:14<00:00, 89737.32it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18332.24it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 1, Loss: 4.303684914112091
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.98it/s]


Epoch 2, Loss: 4.271114649772644
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.60it/s]


Epoch 3, Loss: 4.266950540542602
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.25it/s]


Epoch 4, Loss: 4.2655190348625185
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 5, Loss: 4.264351789951324
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 6, Loss: 4.264053878784179
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 7, Loss: 4.263958642482757
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 8, Loss: 4.2634930682182315
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.77it/s]


Epoch 9, Loss: 4.26324247598648
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 10, Loss: 4.263095247745514
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.15it/s]


Test Accuracy: 63.18%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47313.05it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33615.59it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63973.74it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18560.41it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.19it/s]


Epoch 1, Loss: 4.48150497674942
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 2, Loss: 4.163201667070389
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.58it/s]


Epoch 3, Loss: 4.150744303464889
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 4, Loss: 4.144394428730011
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.99it/s]


Epoch 5, Loss: 4.141000913381577
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 6, Loss: 4.13951166510582
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 7, Loss: 4.138392908573151
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 8, Loss: 4.137834266424179
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.75it/s]


Epoch 9, Loss: 4.137444988489151
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 10, Loss: 4.137505552768707
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.29it/s]


Test Accuracy: 67.02%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47570.22it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33910.41it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63329.87it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18930.11it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 1, Loss: 4.59417240858078
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.45it/s]


Epoch 2, Loss: 4.158325095176696
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.79it/s]


Epoch 3, Loss: 4.145305968523026
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 4, Loss: 4.141949756145477
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.48it/s]


Epoch 5, Loss: 4.140351451635361
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.46it/s]


Epoch 6, Loss: 4.139519844055176
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 7, Loss: 4.138868572711945
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 8, Loss: 4.138428897857666
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.52it/s]


Epoch 9, Loss: 4.138164592981338
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 10, Loss: 4.1378262269496915
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.34it/s]


Test Accuracy: 67.08%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 151.96it/s]


Epoch 1, Loss: 0.33006568885866727


100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 152.20it/s]


Epoch 2, Loss: 0.01373165008021715


100%|█████████████████████████████████████████████████████| 1024/1024 [00:06<00:00, 151.78it/s]


Epoch 3, Loss: 0.004321000683262355


100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 189.17it/s]


Test Accuracy: 0.9992
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]
restructuring


100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47696.88it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33742.21it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:21<00:00, 60505.02it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18321.21it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.45it/s]


Epoch 1, Loss: 4.528321552276611
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 2, Loss: 1.2331856513023376
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.60it/s]


Epoch 3, Loss: 0.967158876657486
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.47it/s]


Epoch 4, Loss: 0.8682502692937851
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.38it/s]


Epoch 5, Loss: 0.8243702468276024
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.49it/s]


Epoch 6, Loss: 0.7958635371923447
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 7, Loss: 0.7750602966547012
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 8, Loss: 0.7579787701368332
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.73it/s]


Epoch 9, Loss: 0.743040380179882
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 10, Loss: 0.729813702404499
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.07it/s]


Test Accuracy: 88.80%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:26<00:00, 47772.62it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34374.90it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:19<00:00, 64060.20it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18846.20it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.56it/s]


Epoch 1, Loss: 6.218520629405975
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 2, Loss: 4.4594103264808655
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]


Epoch 3, Loss: 3.784733278751373
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.50it/s]


Epoch 4, Loss: 1.935358951687813
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.93it/s]


Epoch 5, Loss: 1.5879225844144822
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.87it/s]


Epoch 6, Loss: 1.5379814577102662
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.61it/s]


Epoch 7, Loss: 1.4897220629453658
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.14it/s]


Epoch 8, Loss: 1.422682158946991
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.22it/s]


Epoch 9, Loss: 1.3547633135318755
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.19it/s]


Epoch 10, Loss: 1.3167310923337936
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.35it/s]


Test Accuracy: 83.95%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47332.67it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34246.45it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63351.44it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18961.81it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.78it/s]


Epoch 1, Loss: 5.411241462230683
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 2, Loss: 4.281434134244919
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 3, Loss: 2.567825238108635
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 4, Loss: 1.782081544995308
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 5, Loss: 1.770063472390175
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.82it/s]


Epoch 6, Loss: 1.769287400841713
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.49it/s]


Epoch 7, Loss: 1.7692774403095246
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.78it/s]


Epoch 8, Loss: 1.7691815769672394
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.27it/s]


Epoch 9, Loss: 1.7692141133546828
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.23it/s]


Epoch 10, Loss: 1.7694737243652343
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.17it/s]


Test Accuracy: 82.42%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47406.54it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34022.47it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:14<00:00, 89388.83it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18273.01it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.98it/s]


Epoch 1, Loss: 6.5369578957557675
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 2, Loss: 5.2056688928604125
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.37it/s]


Epoch 3, Loss: 4.89292466878891
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.89it/s]


Epoch 4, Loss: 4.651816439628601
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 12.99it/s]


Epoch 5, Loss: 4.570720753669739
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.71it/s]


Epoch 6, Loss: 4.550772154331208
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.55it/s]


Epoch 7, Loss: 4.5408968305587765
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 8, Loss: 4.535681786537171
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:15<00:00, 13.29it/s]


Epoch 9, Loss: 4.532713873386383
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 10, Loss: 4.530408778190613
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.25it/s]


Test Accuracy: 62.01%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45574.38it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34225.18it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63359.33it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 24767.44it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.76it/s]


Epoch 1, Loss: 6.1857818245887755
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.68it/s]


Epoch 2, Loss: 5.493902404308319
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 3, Loss: 5.2632960510253906
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 4, Loss: 5.176024408340454
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.69it/s]


Epoch 5, Loss: 5.145215849876404
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.59it/s]


Epoch 6, Loss: 5.1182461810112
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.96it/s]


Epoch 7, Loss: 5.079547238349915
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 8, Loss: 5.040708031654358
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.63it/s]


Epoch 9, Loss: 5.016758744716644
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 10, Loss: 5.00539888381958
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.09it/s]


Test Accuracy: 57.95%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 45822.40it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34246.49it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:13<00:00, 96948.53it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18685.94it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 1, Loss: 6.7409180688858035
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 2, Loss: 5.974151885509491
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.72it/s]


Epoch 3, Loss: 5.629923543930054
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.08it/s]


Epoch 4, Loss: 5.51907728433609
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.83it/s]


Epoch 5, Loss: 5.4659554123878475
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.29it/s]


Epoch 6, Loss: 5.440338454246521
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]


Epoch 7, Loss: 5.42967809677124
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 8, Loss: 5.426621499061585
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 9, Loss: 5.425121054649353
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.71it/s]


Epoch 10, Loss: 5.424142351150513
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.34it/s]


Test Accuracy: 60.70%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45653.34it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33447.23it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 62742.34it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 23229.36it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.65it/s]


Epoch 1, Loss: 5.333640396595001
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.84it/s]


Epoch 2, Loss: 5.255073597431183
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 3, Loss: 5.247119028568267
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 4, Loss: 5.244977533817291
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.80it/s]


Epoch 5, Loss: 5.243776252269745
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 6, Loss: 5.243333485126495
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.70it/s]


Epoch 7, Loss: 5.243042166233063
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.64it/s]


Epoch 8, Loss: 5.242718026638031
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.29it/s]


Epoch 9, Loss: 5.242936899662018
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.64it/s]


Epoch 10, Loss: 5.242719027996063
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 14.37it/s]


Test Accuracy: 62.74%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:28<00:00, 45443.04it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 33065.99it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 62728.93it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 23733.36it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.88it/s]


Epoch 1, Loss: 5.3775793647766115
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.65it/s]


Epoch 2, Loss: 5.1277966833114625
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 3, Loss: 5.113118257522583
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.78it/s]


Epoch 4, Loss: 5.105919318199158
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.95it/s]


Epoch 5, Loss: 5.1023690176010135
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.67it/s]


Epoch 6, Loss: 5.100281853675842
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.93it/s]


Epoch 7, Loss: 5.099055881500244
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.90it/s]


Epoch 8, Loss: 5.098101298809052
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.81it/s]


Epoch 9, Loss: 5.097330389022827
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.85it/s]


Epoch 10, Loss: 5.096643097400666
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.01it/s]


Test Accuracy: 67.15%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1

100%|█████████████████████████████████████████████| 1280000/1280000 [00:27<00:00, 47387.91it/s]


restructuring


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 34217.37it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████| 1280000/1280000 [00:20<00:00, 63758.40it/s]


[SYST] Prepare Data


100%|█████████████████████████████████████████████████| 12800/12800 [00:00<00:00, 18500.99it/s]


[SYST] Epoch 0


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 15.02it/s]


Epoch 1, Loss: 5.287934048175812
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.98it/s]


Epoch 2, Loss: 5.149281828403473
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.63it/s]


Epoch 3, Loss: 5.133123803138733
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.98it/s]


Epoch 4, Loss: 5.120945656299591
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.91it/s]


Epoch 5, Loss: 5.112061865329743
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.95it/s]


Epoch 6, Loss: 5.106543481349945
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.74it/s]


Epoch 7, Loss: 5.103068704605103
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.89it/s]


Epoch 8, Loss: 5.101144137382508
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 13.66it/s]


Epoch 9, Loss: 5.099848411083221
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.62it/s]


Epoch 10, Loss: 5.098964474201202
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 16.16it/s]

Test Accuracy: 67.11%
[{'accuracy': 0.9989, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625, '[[0, 1], [2, 3]]': 0.8984375, '[[0], [1]]': 0.87734375}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875, '[[0, 1], [2, 3]]': 0.767265625, '[[0], [1]]': 0.623515625}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125, '[[0, 1], [2, 3]]': 0.631953125, '[[0], [1]]': 0.627265625}}, {'accuracy': 0.998, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625, '[[0, 1], [2, 3]]': 0.808515625, '[[0], [1]]': 0.806796875}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375, '[[0, 1], [2, 3]]': 0.547109375, '[[0], [1]]': 0.475}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875, '[[0, 1], [2, 3]]': 0.64421875, '[[0], [1]]': 0.6378125}}, {'accuracy': 0.9988, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 1




In [13]:
results

[{'accuracy': 0.9989,
  'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.960625,
   '[[0, 1], [2, 3]]': 0.8984375,
   '[[0], [1]]': 0.87734375},
  'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.633046875,
   '[[0, 1], [2, 3]]': 0.767265625,
   '[[0], [1]]': 0.623515625},
  'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.562578125,
   '[[0, 1], [2, 3]]': 0.631953125,
   '[[0], [1]]': 0.627265625}},
 {'accuracy': 0.998,
  'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.885390625,
   '[[0, 1], [2, 3]]': 0.808515625,
   '[[0], [1]]': 0.806796875},
  'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.558359375,
   '[[0, 1], [2, 3]]': 0.547109375,
   '[[0], [1]]': 0.475},
  'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14, 15]]': 0.61296875,
   '[[0, 1], [2, 3]]': 0.64421875,
   '[[0], [1]]': 0.6378125}},
 {'accuracy': 0.9988,
  'Layer1': {'[[0, 

In [14]:
import json
with open('results.json', 'w') as f:
    json.dump(results, f)
