In [1]:
#check if model stays the same
#reimplement data generation

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
import pickle
from tqdm import tqdm
import random
import numpy as np

DEVICE="cuda"


In [3]:
def set_seed(seed):
    # Set the seed for the random module
    random.seed(seed)
    
    # Set the seed for numpy
    np.random.seed(seed)
    
    # Set the seed for PyTorch (CPU)
    torch.manual_seed(seed)
    
    # Set the seed for PyTorch (GPU) if you are using CUDA
    if torch.cuda.is_available():
        torch.cuda.manual_seed(seed)
        torch.cuda.manual_seed_all(seed)  # For multi-GPU setups
    
    # Ensure deterministic behavior in PyTorch
    torch.backends.cudnn.deterministic = True  # This makes the computations deterministic
    torch.backends.cudnn.benchmark = False  # Disable auto-tuning for performance optimization
    
    # For reproducibility of other libraries like Python's `random`
    torch.random.manual_seed(seed)



In [4]:


class MLPBlock(nn.Module):
    def __init__(self, in_features=16, out_features=16, dropout_prob=0.0):
        super(MLPBlock, self).__init__()
        self.ff1 = nn.Linear(in_features, out_features)
        self.act = nn.ReLU()
        self.dropout = nn.Dropout(p=dropout_prob)

    def forward(self, x):
        x = self.ff1(x)
        x = self.act(x)
        x = self.dropout(x)
        return x

class MLPModel(nn.Module):
    def __init__(self, input_size=16, hidden_size=16, num_blocks=3, dropout_prob=0.0):
        super(MLPModel, self).__init__()
        self.dropout = nn.Dropout(p=dropout_prob)
        self.h = nn.ModuleList([MLPBlock(hidden_size, hidden_size, dropout_prob) for _ in range(num_blocks)])

    def forward(self, x):
        x = self.dropout(x)
        for layer in self.h:
            x = layer(x)
        return x

class MLPForClassification(nn.Module):
    def __init__(self, input_size=16, hidden_size=16, num_classes=2, num_blocks=3, dropout_prob=0.0):
        super(MLPForClassification, self).__init__()
        self.mlp = MLPModel(input_size, hidden_size, num_blocks, dropout_prob)
        self.score = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        x = self.mlp(x)
        x = self.score(x)
        return x



In [5]:
def randvec(n=50, lower=-0.5, upper=0.5):
    """
    Returns a random vector of length `n`. `w` is ignored.

    """
    return np.array([random.uniform(lower, upper) for i in range(n)])

def create_same_pair(embedding_size):
    vec=randvec(embedding_size)
    return vec,vec

def create_diff_pair(embedding_size):
    similar=True
    while similar:
        vec1=randvec(embedding_size)
        vec2=randvec(embedding_size)
        if not (vec1 == vec2).all():
            similar=False
    return vec1,vec2


def make_dataset_sample_model(embedding_size,variable1=False,variable2=False):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
        
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label

def make_model_dataset(size,embedding_size):
    model_inputs=[]
    labels=[]
    for _ in tqdm(range(size)):
        model_input,label=make_dataset_sample_model(embedding_size)
        model_inputs.append(model_input)
        labels.append(label)
    return torch.tensor(model_inputs, dtype=torch.float32).to(DEVICE),torch.tensor(labels, dtype=torch.float32).to(DEVICE)



def make_dataset_sample_variable_intervention(embedding_size,variable1=False,variable2=False):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
    source_first_pair=[(np.zeros(embedding_size),np.zeros(embedding_size)),(np.zeros(embedding_size),np.zeros(embedding_size))]
    if variable1:
        First_pair_same=random.choice([True,False])
        if First_pair_same:
            source_first_pair=create_same_pair(embedding_size)
        else:
            source_first_pair=create_diff_pair(embedding_size)
        if random.choice([True,False]):
            source_first_pair=[source_first_pair,create_same_pair(embedding_size)]
        else:
            source_first_pair=[source_first_pair,create_diff_pair(embedding_size)]
        
    
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)
    source_second_pair=[(np.zeros(embedding_size),np.zeros(embedding_size)),(np.zeros(embedding_size),np.zeros(embedding_size))]
    if variable2:
        Second_pair_same=random.choice([True,False])
        if Second_pair_same:
            source_second_pair=create_same_pair(embedding_size)
        else:
            source_second_pair=create_diff_pair(embedding_size)
        if random.choice([True,False]):
            source_second_pair=[create_same_pair(embedding_size),source_second_pair]
        else:
            source_second_pair=[create_diff_pair(embedding_size),source_second_pair]
    
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    source0=np.concatenate(source_first_pair, axis=None)
    source1=np.concatenate(source_second_pair, axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label,source0,source1

def make_intervention_dataset_variable_intervention_all(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        variable1,variable2=random.choice([(True,False),(False,True),(True,True)])
        base,label,source0,source1=make_dataset_sample_variable_intervention(embedding_size,variable1=variable1,variable2=variable2)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source0,source1], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[variable1,variable2]
        #print(intervention_data[-1])
    return intervention_data

def make_intervention_dataset_variable_intervention_first(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        base,label,source0,source1=make_dataset_sample_variable_intervention(embedding_size,variable1=True,variable2=False)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source0,source1], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[True,False]
        #print(intervention_data[-1])
    return intervention_data




def make_dataset_sample_first_input_intervention(embedding_size):
    First_pair_same=random.choice([True,False])
    if First_pair_same:
        First_pair=create_same_pair(embedding_size)
    else:
        First_pair=create_diff_pair(embedding_size)
    
    Second_pair_same=random.choice([True,False])
    if Second_pair_same:
        Second_pair=create_same_pair(embedding_size)
    else:
        Second_pair=create_diff_pair(embedding_size)


    source=[]
    First_pair_same=random.choice([True,False])
    if First_pair_same: #equal or not in first variable
        if random.choice([True,False]): #Same source pair
            source.append((First_pair[1],First_pair[1]))
        else: #Different source pair
            new_vec=randvec(embedding_size)
            while (new_vec == First_pair[1]).all():
                new_vec=randvec(embedding_size)
            source.append((First_pair[1],new_vec))
            
    else:
        new_vec1=randvec(embedding_size)
        while (new_vec1 == First_pair[1]).all():
            new_vec1=randvec(embedding_size)
        if random.choice([True,False]): #Same source pair
            source.append((new_vec1,new_vec1))
        else: #Different source pair
            new_vec2=randvec(embedding_size)
            while (new_vec2 == new_vec1).all():
                new_vec2=randvec(embedding_size)
            source.append((new_vec1,new_vec2))

    if random.choice([True,False]):
        source.append(create_same_pair(embedding_size))
    else:
        source.append(create_diff_pair(embedding_size))
    
    
    modelinput=np.concatenate((First_pair, Second_pair), axis=None)
    source=np.concatenate(source, axis=None)
    if First_pair_same==Second_pair_same:
        label=1.0
    else:
        label=0.0
    return modelinput,label,source
    


def make_intervention_dataset_first_input_intervention(size,embedding_size):
    intervention_data=[]
    for _ in tqdm(range(size)):
        base,label,source=make_dataset_sample_first_input_intervention(embedding_size)
        intervention_data.append({})
        intervention_data[-1]["base"]=torch.tensor(base, dtype=torch.float32)
        intervention_data[-1]["label"]=torch.tensor(label, dtype=torch.float32)
        intervention_data[-1]["sources"]=torch.tensor([source], dtype=torch.float32)
        intervention_data[-1]["intervention"]=[True]
    return intervention_data




In [6]:
def train_model(model,batch_size = 1024,epochs=3):
    #Training
    X_train,y_train=make_model_dataset(1048576,4)
    # Create DataLoader
    
    
    train_dataset = TensorDataset(X_train, y_train)
    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
    
    # Initialize model, loss function, and optimizer
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    
    # Train
    model.train()
    for epoch in range(epochs):
        total_loss = 0
        for X_batch, y_batch in tqdm(train_loader):
            optimizer.zero_grad()
            outputs = model(X_batch)
            loss = criterion(outputs, y_batch.squeeze().long())
            loss.backward()
            optimizer.step()
            total_loss += loss.item()
        print(f"Epoch {epoch+1}, Loss: {total_loss / len(train_loader)}")
    return model

In [7]:
def test_model(model,batch_size = 1024):
    #Testing:
    X_test,y_test=make_model_dataset(10000,4)
    test_dataset = TensorDataset(X_test, y_test)
    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)
    
    
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for X_batch, y_batch in tqdm(test_loader):
            outputs = model(X_batch)
            _, predicted = torch.max(outputs, 1)
            correct += (predicted == y_batch.squeeze()).sum().item()
            total += y_batch.size(0)
    accuracy = correct / total
    print(f"Test Accuracy: {accuracy:.4f}")
    return accuracy

In [8]:
def make_model(epochs=3):
    model = MLPForClassification()
    model.to(DEVICE)
    model=train_model(model,epochs=epochs)
    accuracy=test_model(model)
    return model,accuracy

In [9]:
class RotateLayer(torch.nn.Module):
    """A learnable linear transformation initialized as an orthogonal matrix."""

    def __init__(self, n, init_orth=True):
        """
        Args:
            n (int): Dimension of the square transformation matrix.
            init_orth (bool): If True, initializes the matrix with an orthogonal weight.
        """
        super().__init__()
        weight = torch.empty(n, n)  # Create an empty n x n matrix
        
        # We don't need initialization if loading from a pretrained checkpoint.
        # You can explore different initialization strategies if necessary, but this isn't our focus.
        if init_orth:
            torch.nn.init.orthogonal_(weight)
        
        self.weight = torch.nn.Parameter(weight, requires_grad=True)  # Learnable weight matrix

    def forward(self, x):
        """Applies the rotation matrix to the input tensor."""
        return torch.matmul(x.to(self.weight.dtype), self.weight)
        

class Transformation_Function(nn.Module):
    """Encapsulates the rotation transformation as a PyTorch module."""

    def __init__(self, embed_dim=16):
        """
        Args:
            embed_dim (int): The embedding dimension (size of the transformation matrix).
        """
        super(Transformation_Function, self).__init__()
        
        rotate_layer = RotateLayer(embed_dim)  # Initialize the rotation layer
        # Ensure the transformation remains an orthogonal matrix
        self.rotate_layer = torch.nn.utils.parametrizations.orthogonal(rotate_layer)

    def forward(self, x):
        """Applies the orthogonal transformation to the input tensor."""
        return self.rotate_layer(x)


class InverseTransformation_Function(nn.Module):
    """Computes the inverse of the given transformation function (phi)."""

    def __init__(self, transformation_function: Transformation_Function):
        """
        Args:
            transformation_function (Transformation_Function): The forward transformation function.
        """
        super(InverseTransformation_Function, self).__init__()
        self.transformation_function = transformation_function  # Store reference to the transformation

    def forward(self, x):
        """Applies the inverse transformation by transposing the orthogonal weight matrix."""
        weight_T = self.transformation_function.rotate_layer.weight.T  # Use matrix transpose as inverse
        return torch.matmul(x.to(weight_T.dtype), weight_T)

class phi_class:
    def __init__(self, phi,phi_inv,criterion,optimizer):
        self.phi=phi
        self.phi_inv=phi_inv
        self.criterion=criterion
        self.optimizer=optimizer



In [10]:
class Distributed_Alignment_Search:

    
    def __init__(self, 
                 Model,
                 Model_Layer,
                 Train_Data_Raw,
                 Test_Data_Raw,
                 Hidden_Layer_Size,
                 Variable_Dimensions,
                 Transformation_Class,
                 Device):
        self.Model=Model
        self.Model_Layer=Model_Layer
        self.Hidden_Layer_Size=Hidden_Layer_Size
        self.Variable_Dimensions=Variable_Dimensions
        self.Num_Varibales=len(self.Variable_Dimensions)
        self.Transformation_Class=Transformation_Class
        self.Device=Device

        self.mode_info=None
        self.base_activations=None
        self.source_activations=None

        
        self.Train_Dataset,self.Train_Sample_Number=self.Prepare_Dataset(Train_Data_Raw)
        self.Test_Dataset,self.Test_Samples_Number=self.Prepare_Dataset(Test_Data_Raw)

   
        self.Hook=self.register_intervention_hook(self.Model_Layer)
        

    def Prepare_Dataset(self,Raw_Dataset): 
        Clean_Dataset={}
        Clean_Dataset["base"]=[]
        Clean_Dataset["sources"]=[]
        for _ in range(self.Num_Varibales):
            Clean_Dataset["sources"].append([])
        Clean_Dataset["label"]=[]
        Clean_Dataset["intervention"]=[]

        #Actually adapted to the dataset I am using. Needs to be changed later:
        print("[SYST] Prepare Data")
        for ac_DP_pos in tqdm(range(len(Raw_Dataset))):
            #base input
            ac_DP=Raw_Dataset[ac_DP_pos]
            Clean_Dataset["base"].append(ac_DP["base"])

            #expected label after intervention
            Clean_Dataset["label"].append(ac_DP["label"])

            #source inputs
            for var_dim in range(ac_DP['sources'].shape[0]):
                Clean_Dataset["sources"][var_dim].append(ac_DP['sources'][var_dim])

            #intervention data
            Clean_Dataset["intervention"].append([])
            for Hidden_Dimension in range(self.Hidden_Layer_Size):
                dim_found=False
                for ac_dimensions_pos,ac_dimensions in enumerate(self.Variable_Dimensions):
                    if Hidden_Dimension in ac_dimensions:
                        dim_found=True
                        if ac_DP["intervention"][ac_dimensions_pos]:
                            Clean_Dataset["intervention"][-1].append(True)
                        else:
                            Clean_Dataset["intervention"][-1].append(False)
                        break
                if not dim_found:
                    Clean_Dataset["intervention"][-1].append(False)
            Raw_Dataset[ac_DP_pos]=None

        sample_number=len(Clean_Dataset["label"])
        Clean_Dataset["base"]=torch.stack(Clean_Dataset["base"]).to(self.Device)
        Clean_Dataset["label"]=torch.stack(Clean_Dataset["label"]).to(self.Device)
        for i in range(len(Clean_Dataset["sources"])):
            Clean_Dataset["sources"][i]=torch.stack(Clean_Dataset["sources"][i]).to(self.Device)
        Clean_Dataset["intervention"]=torch.tensor(Clean_Dataset["intervention"]).to(self.Device)
        return Clean_Dataset,sample_number
                        
        
    def register_intervention_hook(self, layer):
        def hook_fn(module, input, output):
            if self.mode_info[0] == "source":
                # Extract row indices (list)
                row_indices = self.mode_info[2]
                #print("SO",output)
                
                # Extract column indices (list)
                col_indices = self.Variable_Dimensions[self.mode_info[1]]
                #print("CI",col_indices)
                #print(self.source_activations.shape)
                #print("SB",self.source_activations)
                #print(output)
                
                # Get values from the transformation tensor
                transformed_values = self.Transformation_Class.phi(output.detach())[:, col_indices]
                #print("TV",transformed_values)
                
                # Assign these values to the corresponding positions in source_activations
                self.source_activations[torch.tensor(row_indices).unsqueeze(1), torch.tensor(col_indices).unsqueeze(0)] = transformed_values
                #print("SA",self.source_activations)
                #print("***")
            elif self.mode_info[0] == "intervene":
                result_tensor = self.Transformation_Class.phi(output.detach())
                #print("II",self.mode_info[1])
                #print("IBO",output)
                #print("IBT",result_tensor)
                #print("IBOR",self.Transformation_Class.phi_inv(result_tensor))
                result_tensor = torch.where(self.mode_info[1], self.source_activations, result_tensor)
                #print("IR",result_tensor)
                return self.Transformation_Class.phi_inv(result_tensor)
        
        return layer.register_forward_hook(hook_fn)

    
    def train_test(self,batch_size,epochs=1,train=True):

        self.Model.eval()
        for param in self.Model.parameters():
            param.requires_grad = False  # This freezes the weights

        if train:
            self.Transformation_Class.phi.train()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = True  # This unfreezes the weights
            data=self.Train_Dataset
            Sample_Indices=list(range(self.Train_Sample_Number))
        else:
            self.Transformation_Class.phi.eval()
            for param in self.Transformation_Class.phi.parameters():
                param.requires_grad = False  # This freezes the weights
            data=self.Test_Dataset
            Sample_Indices=list(range(self.Test_Samples_Number))
        
        for epoch in range(epochs):
            print("[SYST] Epoch",epoch)
            total_correct = 0
            total_samples = 0
            total_loss = 0
        
            #Make Batches
            random.shuffle(Sample_Indices)
            DAS_Train_Batches=self.chunk_list(Sample_Indices, batch_size)
            
            for ac_batch in tqdm(DAS_Train_Batches):

                if train: 
                    self.Transformation_Class.optimizer.zero_grad()
                
                #Prepare Source Activations
                self.source_activations = torch.zeros(len(ac_batch), self.Hidden_Layer_Size).to(self.Device)
                
                for ac_source_pos in range(len(data["sources"])):
                    #add info needed for optimization... no sense in running inputs who are not used:
                    used_source_indices=self.extract_sources_to_run(ac_source_pos,ac_batch,data)
                    if len(used_source_indices)>0:
                        #print("Hey")
                        self.mode_info=["source",ac_source_pos,used_source_indices]
                        ac_source=data["sources"][ac_source_pos][ac_batch][used_source_indices]
                        #print("SI",ac_source)
                        model(ac_source)
        
                #Intervention
                ac_base=data["base"][ac_batch]
                intervention_bools=data["intervention"][ac_batch]
                self.mode_info=["intervene",intervention_bools]
                #print("BI",ac_base)
                outputs=model(ac_base)
                labels=data["label"][ac_batch]
                #print("L",labels)
                if train:
                    loss = self.Transformation_Class.criterion(outputs, labels.squeeze().long())
                    loss.backward()
                    self.Transformation_Class.optimizer.step()
                    #print(self.Transformation_Class.phi.rotate_layer.weight)
                    total_loss += loss.item()

                else:
                    predictions = torch.argmax(outputs, dim=1) 
                    correct = (predictions.squeeze() == labels.squeeze()).sum().item()
                    total_correct += correct
                    total_samples += labels.size(0)
            
            if train:
                print(f"Epoch {epoch+1}, Loss: {total_loss / len(DAS_Train_Batches)}")
            else:     
                accuracy = total_correct / total_samples
                print(f"Test Accuracy: {accuracy * 100:.2f}%")
                return accuracy
                

    def extract_sources_to_run(self,which_variable,batch_indices,data):
        used_source_indices=[]
        for ip, i in enumerate(batch_indices):
            is_used=data["intervention"][i][self.Variable_Dimensions[which_variable][0]]
            if is_used:
                used_source_indices.append(ip)
        return used_source_indices

    
    def chunk_list(self, input_list, batch_size):
        return [input_list[i:i + batch_size] for i in range(0, len(input_list), batch_size)]

    
    def Cleanup(self):
        self.Hook.remove()

In [11]:
results=[]
for acseed in [4287, 3837, 9097, 2635, 5137, 6442, 5234, 4641, 8039, 2266]:
    results.append({})
    set_seed(acseed)
    model,accuracy=make_model(epochs=3)
    Layers=[]
    Layers.append(("Layer1",model.mlp.h[0]))
    Layers.append(("Layer2",model.mlp.h[1]))
    Layers.append(("Layer3",model.mlp.h[2]))
    inter_dims=[]
    
    """
    inter_dims.append([list(range(0,8)),list(range(8,16))])
    inter_dims.append([list(range(0,2)),list(range(2,4))])
    inter_dims.append([list(range(0,1)),list(range(1,2))])
    """
    inter_dims.append([list(range(0,8))])
    inter_dims.append([list(range(0,2))])
    inter_dims.append([list(range(0,1))])
    
    results[-1]["accuracy"]=accuracy
    for LayerName,Layer in Layers:
        results[-1][LayerName]={}
        for inter_dim in inter_dims:
            print(LayerName,":",inter_dim)
            #DAS_Train=make_intervention_dataset_variable_intervention_all(1280000,4)
            #DAS_Test=make_intervention_dataset_variable_intervention_all(10000,4)
            #DAS_Train=make_intervention_dataset_variable_intervention_first(1280000,4)
            #DAS_Test=make_intervention_dataset_variable_intervention_first(10000,4)
            DAS_Train=make_intervention_dataset_first_input_intervention(1280000,4)
            DAS_Test=make_intervention_dataset_first_input_intervention(10000,4)
    
            #Initialize transformation function
            p=Transformation_Function(16)
            p.to(DEVICE)
            p_inverse=InverseTransformation_Function(p)
            
            criterion = nn.CrossEntropyLoss()
            optimizer = optim.Adam(p.parameters(), lr=0.001)
            
            phi=phi_class(p,p_inverse,criterion,optimizer)
    
            
    
            DAS_Experiment=Distributed_Alignment_Search(Model=model,
                                                        Model_Layer=Layer,
                                                        Train_Data_Raw=DAS_Train,
                                                        Test_Data_Raw=DAS_Test,
                                                        Hidden_Layer_Size=16,
                                                        Variable_Dimensions=inter_dim,
                                                        Transformation_Class=phi,
                                                        Device=DEVICE)
    
            DAS_Experiment.train_test(batch_size=6400,
                                      epochs=10,
                                      train=True)
    
            accuracy=DAS_Experiment.train_test(batch_size=6400,
                                               train=False)
            
            results[-1][LayerName][str(inter_dim)]=accuracy
            DAS_Experiment.Cleanup()
            DAS_Experiment=None
            print(results)

100%|█████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 97764.23it/s]
  return torch.tensor(model_inputs, dtype=torch.float32).to(DEVICE),torch.tensor(labels, dtype=torch.float32).to(DEVICE)
100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 110.35it/s]


Epoch 1, Loss: 0.3913447721170087


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 113.47it/s]


Epoch 2, Loss: 0.02623706526355818


100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 113.83it/s]


Epoch 3, Loss: 0.008349891868192572


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 100468.15it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 103.37it/s]


Test Accuracy: 0.9983
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:25<00:00, 15000.00it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16208.77it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 144872.12it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 148155.75it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.80it/s]


Epoch 1, Loss: 7.545942659378052
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 2, Loss: 6.2551185131073
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.79it/s]


Epoch 3, Loss: 5.968905663490295
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 4, Loss: 5.867888278961182
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 5, Loss: 5.74390887260437
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 6, Loss: 5.5114836859703065
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 7, Loss: 5.459375472068786
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 8, Loss: 5.427405686378479
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 9, Loss: 5.402710309028626
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 10, Loss: 5.386545240879059
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 12.99it/s]


Test Accuracy: 50.13%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013}}]
Layer1 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15670.76it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16912.52it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158892.57it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160688.37it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 7.113471517562866
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 6.55044538974762
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 3, Loss: 6.484211835861206
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 4, Loss: 6.44816618680954
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 5, Loss: 6.418965570926666
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 6, Loss: 6.379366767406464
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 7, Loss: 6.34290209531784
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 8, Loss: 6.32363737821579
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 9, Loss: 6.301329581737519
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 10, Loss: 6.265947794914245
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.53it/s]


Test Accuracy: 50.39%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039}}]
Layer1 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15565.87it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16905.13it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162292.93it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 165259.55it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.15it/s]


Epoch 1, Loss: 7.17069194316864
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 2, Loss: 6.757828626632691
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 3, Loss: 6.706588728427887
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 4, Loss: 6.679471297264099
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 5, Loss: 6.664516849517822
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 6, Loss: 6.655950264930725
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 7, Loss: 6.651135528087616
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 8, Loss: 6.649006435871124
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 9, Loss: 6.647671813964844
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 10, Loss: 6.6475844264030455
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.45it/s]


Test Accuracy: 50.82%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15588.23it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16878.88it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 146733.57it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147475.93it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.16it/s]


Epoch 1, Loss: 6.549510557651519
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 2, Loss: 5.932758560180664
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 3, Loss: 5.846905319690705
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 4, Loss: 5.748675734996795
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 5, Loss: 5.645635070800782
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 6, Loss: 5.598932693004608
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 7, Loss: 5.580601408481598
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 8, Loss: 5.569434316158294
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 9, Loss: 5.561856241226196
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 10, Loss: 5.555230829715729
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.36it/s]


Test Accuracy: 50.37%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037}}]
Layer2 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15397.19it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16638.19it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158205.24it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160787.55it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.13it/s]


Epoch 1, Loss: 7.177222435474396
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 2, Loss: 6.160035471916199
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 3, Loss: 5.949186449050903
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 4, Loss: 5.8224818110466
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 5, Loss: 5.7375062298774715
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 6, Loss: 5.684942154884339
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 7, Loss: 5.6556600880622865
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 8, Loss: 5.640899760723114
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 9, Loss: 5.633914551734924
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 10, Loss: 5.629886083602905
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.31it/s]


Test Accuracy: 50.32%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032}}]
Layer2 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15478.72it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16600.43it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162378.30it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163455.62it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.11it/s]


Epoch 1, Loss: 7.551473379135132
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 2, Loss: 6.989027652740479
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 3, Loss: 6.7760221385955814
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 4, Loss: 6.680179221630096
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 5, Loss: 6.627597851753235
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 6, Loss: 6.608200421333313
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 7, Loss: 6.603021080493927
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 8, Loss: 6.602841994762421
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 9, Loss: 6.602249443531036
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 10, Loss: 6.602315182685852
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.25it/s]


Test Accuracy: 50.75%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15509.41it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16654.04it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 144875.02it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147611.92it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 6.256849522590637
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 2, Loss: 6.211160519123077
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.14it/s]


Epoch 3, Loss: 6.210475363731384
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.11it/s]


Epoch 4, Loss: 6.210773320198059
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 5, Loss: 6.210327227115631
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 6, Loss: 6.210132718086243
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 7, Loss: 6.21029771566391
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 8, Loss: 6.210171656608582
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 9, Loss: 6.2099993348121645
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 10, Loss: 6.210089528560639
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.30it/s]


Test Accuracy: 49.25%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925}}]
Layer3 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15416.32it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16669.42it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158095.33it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 161660.11it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 6.299656269550323
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 2, Loss: 6.2013770413398746
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 3, Loss: 6.199202806949615
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 4, Loss: 6.197729740142822
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 5, Loss: 6.19657958984375
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 6, Loss: 6.195745904445648
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 7, Loss: 6.195322291851044
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 8, Loss: 6.195131185054779
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 9, Loss: 6.194800956249237
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 10, Loss: 6.194367153644562
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.38it/s]


Test Accuracy: 50.37%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037}}]
Layer3 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15268.89it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16728.32it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162952.23it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 165514.54it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 6.518694984912872
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 2, Loss: 6.227435958385468
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 3, Loss: 6.2129948568344116
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 4, Loss: 6.21173196554184
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 5, Loss: 6.21134458065033
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 6, Loss: 6.211066443920135
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 7, Loss: 6.21099104642868
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 8, Loss: 6.2106733226776125
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 9, Loss: 6.210589106082916
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 10, Loss: 6.210347034931183
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.39it/s]


Test Accuracy: 50.81%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}]


100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100444.51it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 131.73it/s]


Epoch 1, Loss: 0.44120322678645607


100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 118.45it/s]


Epoch 2, Loss: 0.045150645065405115


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 113.48it/s]


Epoch 3, Loss: 0.007971242731173334


100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 99291.80it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 161.46it/s]


Test Accuracy: 0.9983
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15339.82it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16560.04it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145497.32it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 146919.06it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 4.413501694202423
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 2, Loss: 3.749865720272064
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 3, Loss: 3.590966945886612
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 4, Loss: 3.518788310289383
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 5, Loss: 3.486696605682373
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 6, Loss: 3.4618290102481843
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 7, Loss: 3.4382630133628846
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 8, Loss: 3.418784210681915
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 9, Loss: 3.4018015098571777
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 10, Loss: 3.3886952710151674
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.22it/s]


Test Accuracy: 50.12%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012}}]
Layer1 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15434.24it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16756.83it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158386.68it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160487.32it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 4.7156080675125125
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 2, Loss: 3.9538852155208586
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 3, Loss: 3.796816120147705
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 4, Loss: 3.7172361278533934
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 5, Loss: 3.6593791949748993
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 6, Loss: 3.6242407786846162
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 7, Loss: 3.6019143307209016
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 8, Loss: 3.588476201295853
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 9, Loss: 3.5810606300830843
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 10, Loss: 3.5770353364944456
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.31it/s]


Test Accuracy: 50.59%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059}}]
Layer1 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15365.37it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16463.60it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162518.60it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163700.60it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 1, Loss: 4.554225413799286
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 2, Loss: 4.1018637645244596
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 3, Loss: 3.9511950504779816
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 4, Loss: 3.8378448712825777
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 5, Loss: 3.797052935361862
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 6, Loss: 3.7905222189426424
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 7, Loss: 3.788216290473938
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 8, Loss: 3.7874967205524444
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 9, Loss: 3.787381955385208
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 10, Loss: 3.7872900426387788
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.22it/s]


Test Accuracy: 49.56%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15779.45it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16805.97it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145035.08it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 144105.93it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 1, Loss: 3.5545743787288666
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.11it/s]


Epoch 2, Loss: 3.4468763267993925
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 3, Loss: 3.429309287071228
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 4, Loss: 3.4185992681980135
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 5, Loss: 3.4120244657993317
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 6, Loss: 3.407811630964279
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 7, Loss: 3.4048908305168153
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 8, Loss: 3.40227481007576
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 9, Loss: 3.40007045507431
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 10, Loss: 3.398097529411316
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.28it/s]


Test Accuracy: 50.27%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027}}]
Layer2 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15268.74it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16673.56it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 159166.86it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 154170.61it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.18it/s]


Epoch 1, Loss: 3.9825620901584626
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 2, Loss: 3.753136703968048
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 3, Loss: 3.6169670569896697
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 4, Loss: 3.4906271755695344
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 5, Loss: 3.4275918436050414
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 6, Loss: 3.4086683940887452
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 7, Loss: 3.4020205760002136
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 8, Loss: 3.3996088171005248
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 9, Loss: 3.3986618971824645
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 10, Loss: 3.3983953368663786
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.41it/s]


Test Accuracy: 49.57%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957}}]
Layer2 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15794.20it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16916.07it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 163730.27it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163673.77it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 4.250967849493026
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 3.7799533236026766
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 3, Loss: 3.706168763637543
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 4, Loss: 3.664284039735794
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 5, Loss: 3.641918627023697
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 6, Loss: 3.630475069284439
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 7, Loss: 3.624811661243439
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.08it/s]


Epoch 8, Loss: 3.6223083508014677
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 9, Loss: 3.621180645227432
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 10, Loss: 3.6202881610393525
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.40it/s]


Test Accuracy: 49.30%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15329.30it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16791.00it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145893.72it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 143881.01it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 3.262437002658844
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.13it/s]


Epoch 2, Loss: 3.2555829215049745
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.14it/s]


Epoch 3, Loss: 3.254786641597748
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 4, Loss: 3.2543687379360198
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 5, Loss: 3.2543340063095094
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 6, Loss: 3.254207397699356
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 7, Loss: 3.2541469311714173
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 8, Loss: 3.2540465128421783
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 9, Loss: 3.2540804064273834
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 10, Loss: 3.2539931857585906
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.36it/s]


Test Accuracy: 49.66%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966}}]
Layer3 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15590.59it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16864.39it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 159239.22it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159469.54it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 3.465451409816742
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 3.2523386812210084
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 3, Loss: 3.2517142915725707
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 4, Loss: 3.251408277750015
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 5, Loss: 3.2511907744407655
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 6, Loss: 3.2510957145690917
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 7, Loss: 3.250835210084915
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 8, Loss: 3.2507269418239595
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 9, Loss: 3.2505646681785585
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 10, Loss: 3.2505212664604186
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.31it/s]


Test Accuracy: 49.96%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996}}]
Layer3 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15510.71it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16761.68it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162671.76it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163320.06it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 1, Loss: 3.733473689556122
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 2, Loss: 3.2501206386089323
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 3, Loss: 3.2484856379032134
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 4, Loss: 3.2478164887428282
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 5, Loss: 3.247455266714096
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 6, Loss: 3.2471544587612153
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 7, Loss: 3.246956490278244
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 8, Loss: 3.2468475461006165
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 9, Loss: 3.2467001605033876
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 10, Loss: 3.246608476638794
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.44it/s]


Test Accuracy: 50.71%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}]


100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100554.52it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 120.95it/s]


Epoch 1, Loss: 0.5134716425818624


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 112.01it/s]


Epoch 2, Loss: 0.0980857001413824


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 113.16it/s]


Epoch 3, Loss: 0.04118209016814944


100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 97506.81it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 159.56it/s]


Test Accuracy: 0.9906
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15409.94it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16842.07it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 146230.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147046.28it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 1, Loss: 6.094249386787414
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 2, Loss: 3.8964432537555695
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 3, Loss: 3.5578413116931915
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 4, Loss: 3.468547292947769
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 5, Loss: 3.420759828090668
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 6, Loss: 3.3893262827396393
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.78it/s]


Epoch 7, Loss: 3.36797092795372
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 8, Loss: 3.349929938316345
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 9, Loss: 3.3306968247890474
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.80it/s]


Epoch 10, Loss: 3.3098789834976197
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.27it/s]


Test Accuracy: 49.64%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964}}]
Layer1 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15450.36it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16709.95it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158970.67it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 158858.90it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 1, Loss: 4.820753661394119
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 2, Loss: 4.097304352521896
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 3, Loss: 3.978588697910309
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 4, Loss: 3.8868618381023405
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 5, Loss: 3.7982636058330534
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 6, Loss: 3.7296156907081603
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 7, Loss: 3.672019838094711
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 8, Loss: 3.634775005578995
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 9, Loss: 3.6165918147563936
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 10, Loss: 3.6047945582866667
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.14it/s]


Test Accuracy: 51.18%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118}}]
Layer1 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15533.03it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16751.02it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 163060.92it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163246.32it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 4.5574940025806425
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 2, Loss: 3.919458326101303
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 3, Loss: 3.8647655701637267
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 4, Loss: 3.833538100719452
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 5, Loss: 3.810515295267105
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 6, Loss: 3.7943568170070647
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 7, Loss: 3.7823099517822265
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 8, Loss: 3.7744953989982606
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 9, Loss: 3.76858149766922
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 10, Loss: 3.7651710414886477
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.27it/s]


Test Accuracy: 50.24%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}}]
Layer2 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15781.13it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16770.37it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 146032.33it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147396.64it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.14it/s]


Epoch 1, Loss: 5.119762016534805
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 2, Loss: 3.9578353965282442
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 3, Loss: 3.773165755271912
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 4, Loss: 3.6837775719165804
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 5, Loss: 3.6354214715957642
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 6, Loss: 3.6072143685817717
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 7, Loss: 3.5905280935764314
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 8, Loss: 3.5804910695552827
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 9, Loss: 3.5746244168281556
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 10, Loss: 3.5713615572452544
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.22it/s]


Test Accuracy: 49.93%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993}}]
Layer2 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15516.62it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16936.36it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 159593.24it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 157592.33it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 4.869289033412933
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 4.400525999069214
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 3, Loss: 4.174236503839492
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 4, Loss: 4.0884889888763425
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 5, Loss: 4.064751380681992
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 6, Loss: 4.0551487529277805
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 7, Loss: 4.0488792932033535
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 8, Loss: 4.04242968916893
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 9, Loss: 4.035298881530761
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 10, Loss: 4.027516434192657
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.32it/s]


Test Accuracy: 49.58%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958}}]
Layer2 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15610.23it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16865.40it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162288.27it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 162084.92it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.11it/s]


Epoch 1, Loss: 4.938157374858856
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 4.433221490383148
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 3, Loss: 4.393177802562714
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 4, Loss: 4.3524732542037965
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 5, Loss: 4.307112507820129
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 6, Loss: 4.27055938243866
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 7, Loss: 4.253051180839538
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 8, Loss: 4.243886015415192
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 9, Loss: 4.2381867814064025
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 10, Loss: 4.234414969682693
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.43it/s]


Test Accuracy: 50.61%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}}]
Layer3 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:20<00:00, 15946.24it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16850.77it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145616.29it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147839.28it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 1, Loss: 3.816695547103882
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 2, Loss: 3.7944423532485962
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 3, Loss: 3.7927664482593535
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 4, Loss: 3.792064048051834
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 5, Loss: 3.791320413351059
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 6, Loss: 3.791029980182648
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 7, Loss: 3.7907859802246096
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 8, Loss: 3.7903492212295533
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 9, Loss: 3.790140382051468
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 10, Loss: 3.7898546087741853
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.28it/s]


Test Accuracy: 49.49%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949}}]
Layer3 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15437.67it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16821.08it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 159253.65it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159349.58it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.08it/s]


Epoch 1, Loss: 4.036118614673614
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 2, Loss: 3.8059428000450133
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 3, Loss: 3.7972964417934416
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 4, Loss: 3.795708144903183
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 5, Loss: 3.7952459383010866
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 6, Loss: 3.7947009229660034
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 7, Loss: 3.7947074294090273
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 8, Loss: 3.7943775844573975
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 9, Loss: 3.7942693424224854
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 10, Loss: 3.7945663285255433
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.42it/s]


Test Accuracy: 50.15%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015}}]
Layer3 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15564.88it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16795.80it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 163850.01it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 164080.99it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.14it/s]


Epoch 1, Loss: 4.129160922765732
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 2, Loss: 3.8011577248573305
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 3, Loss: 3.7891587054729463
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 4, Loss: 3.78487641453743
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 5, Loss: 3.782679715156555
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 6, Loss: 3.781204491853714
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 7, Loss: 3.7804945802688597
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 8, Loss: 3.77989070892334
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.08it/s]


Epoch 9, Loss: 3.779714868068695
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 10, Loss: 3.779572832584381
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.31it/s]


Test Accuracy: 49.77%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}]


100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100308.49it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 121.03it/s]


Epoch 1, Loss: 0.44966094999108464


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 111.85it/s]


Epoch 2, Loss: 0.08144174698281859


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 112.39it/s]


Epoch 3, Loss: 0.023478864025037183


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 100433.99it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 161.91it/s]


Test Accuracy: 0.9955
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15300.51it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16836.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 146021.71it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 148006.22it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 1, Loss: 5.224042608737945
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 2, Loss: 3.7603924083709717
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 3, Loss: 3.4460925948619843
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 4, Loss: 3.286556074619293
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 5, Loss: 3.1952398478984834
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 6, Loss: 3.133715867996216
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 7, Loss: 3.095544195175171
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 8, Loss: 3.07182222366333
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 9, Loss: 3.057246981859207
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 10, Loss: 3.0468629109859466
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.33it/s]


Test Accuracy: 50.24%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024}}]
Layer1 : [[0, 1]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15403.06it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16856.69it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158521.39it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160107.49it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 4.48506854891777
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 2, Loss: 3.916705093383789
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 3, Loss: 3.7872287583351136
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 4, Loss: 3.733581312894821
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 5, Loss: 3.697382309436798
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 6, Loss: 3.67708198428154
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 7, Loss: 3.6689218378067014
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 8, Loss: 3.664694985151291
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 9, Loss: 3.6622139763832093
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 10, Loss: 3.6592510759830477
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.36it/s]


Test Accuracy: 50.25%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025}}]
Layer1 : [[0]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15483.86it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16894.82it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162043.92it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160368.89it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 1, Loss: 4.57106281042099
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 4.007787389755249
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 3, Loss: 3.959127863645554
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 4, Loss: 3.947329794168472
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 5, Loss: 3.934836158752441
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 6, Loss: 3.927377089262009
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 7, Loss: 3.926369230747223
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 8, Loss: 3.925600211620331
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 9, Loss: 3.9255086076259613
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 10, Loss: 3.9254897201061247
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.24it/s]


Test Accuracy: 49.74%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}}]
Layer2 : [[0, 1, 2, 

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15772.32it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16854.71it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145346.48it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147879.94it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.11it/s]


Epoch 1, Loss: 3.355834492444992
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 2, Loss: 3.21225296497345
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 3, Loss: 3.159201375246048
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 4, Loss: 3.134313464164734
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 5, Loss: 3.123048264980316
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 6, Loss: 3.116973181962967
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 7, Loss: 3.1128158175945284
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 8, Loss: 3.109233466386795
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 9, Loss: 3.10571600317955
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 10, Loss: 3.1031209123134613
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.34it/s]


Test Accuracy: 50.68%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15335.53it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16858.27it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 159154.88it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 157633.19it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 1, Loss: 5.303115952014923
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 2, Loss: 3.914515540599823
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 3, Loss: 3.5671865510940552
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 4, Loss: 3.5060797572135924
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 5, Loss: 3.4859769892692567
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 6, Loss: 3.4793537819385527
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 7, Loss: 3.4765698099136353
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 8, Loss: 3.4741334223747256
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 9, Loss: 3.471312667131424
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 10, Loss: 3.4690284085273744
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.41it/s]


Test Accuracy: 50.74%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15739.52it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16694.05it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162285.94it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 164367.13it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 4.336030309200287
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 2, Loss: 3.659235031604767
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 3, Loss: 3.508292155265808
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 4, Loss: 3.491425632238388
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 5, Loss: 3.4866342997550963
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 6, Loss: 3.485404886007309
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 7, Loss: 3.4852996456623075
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 8, Loss: 3.485474715232849
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 9, Loss: 3.485521422624588
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 10, Loss: 3.485306348800659
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.25it/s]


Test Accuracy: 50.21%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15313.38it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16698.32it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145293.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 146589.92it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 3.4753569161891935
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 2, Loss: 3.417765920162201
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 3, Loss: 3.416185609102249
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 4, Loss: 3.415691967010498
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 5, Loss: 3.4154259872436525
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 6, Loss: 3.415297867059708
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 7, Loss: 3.415131449699402
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 8, Loss: 3.4149184942245485
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 9, Loss: 3.414681966304779
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 10, Loss: 3.4147120094299317
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.34it/s]


Test Accuracy: 50.36%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15456.09it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16727.78it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158371.52it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159440.44it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 3.6774644565582277
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 2, Loss: 3.4265242516994476
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 3, Loss: 3.4254510521888735
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 4, Loss: 3.4252237212657928
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 5, Loss: 3.4251630079746245
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 6, Loss: 3.4250081634521483
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 7, Loss: 3.425005124807358
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 8, Loss: 3.4248398411273957
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 9, Loss: 3.42494886636734
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 10, Loss: 3.4248996579647066
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.43it/s]


Test Accuracy: 50.27%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15496.20it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16866.66it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162836.64it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160455.39it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.15it/s]


Epoch 1, Loss: 3.6050986003875733
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 2, Loss: 3.426396977901459
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 3, Loss: 3.41943461060524
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 4, Loss: 3.417539356946945
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.08it/s]


Epoch 5, Loss: 3.416682925224304
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 6, Loss: 3.4163128185272216
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 7, Loss: 3.416041889190674
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 8, Loss: 3.4158900594711303
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 9, Loss: 3.415802139043808
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 10, Loss: 3.4157165491580965
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.13it/s]


Test Accuracy: 49.86%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100276.66it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 118.79it/s]


Epoch 1, Loss: 0.5079662432690384


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 112.58it/s]


Epoch 2, Loss: 0.1480320068731089


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 110.97it/s]


Epoch 3, Loss: 0.06439171461533988


100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 99983.41it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 159.68it/s]


Test Accuracy: 0.9864
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15296.82it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16893.22it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 146027.30it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147136.55it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 1, Loss: 4.375042287111282
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 2, Loss: 3.4149719214439394
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 3, Loss: 3.256880795955658
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 4, Loss: 3.2125596630573274
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 5, Loss: 3.185706125497818
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 6, Loss: 3.166613032817841
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 7, Loss: 3.152911766767502
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 8, Loss: 3.1414767134189607
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 9, Loss: 3.1312709724903107
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 10, Loss: 3.1222592532634734
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.38it/s]


Test Accuracy: 50.07%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15667.61it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16780.78it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158635.78it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 158831.83it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.08it/s]


Epoch 1, Loss: 3.936365007162094
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 2, Loss: 3.6085888886451722
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 3, Loss: 3.482626149654388
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 4, Loss: 3.3765725696086886
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 5, Loss: 3.3262908518314362
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 6, Loss: 3.3086074554920195
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 7, Loss: 3.3029970860481264
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 8, Loss: 3.3008870375156403
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 9, Loss: 3.3002823328971864
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 10, Loss: 3.3002764976024626
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.36it/s]


Test Accuracy: 49.70%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15454.03it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16840.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 163129.94it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 164590.30it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.14it/s]


Epoch 1, Loss: 4.670027039051056
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 2, Loss: 4.173153009414673
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 3, Loss: 4.108385632038116
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 4, Loss: 4.0847603690624235
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 5, Loss: 4.040097217559815
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 6, Loss: 3.974535367488861
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 7, Loss: 3.8111379146575928
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 8, Loss: 3.7125082647800447
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 9, Loss: 3.7091632294654846
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 10, Loss: 3.7074177730083466
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.27it/s]


Test Accuracy: 50.85%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15551.36it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16696.93it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145001.85it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 146333.69it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 1, Loss: 3.731761441230774
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 2, Loss: 3.2973392629623413
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 3, Loss: 3.1659381556510926
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 4, Loss: 3.120120108127594
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 5, Loss: 3.0982663404941557
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 6, Loss: 3.0856054496765135
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 7, Loss: 3.0771201932430268
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 8, Loss: 3.0716254138946533
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 9, Loss: 3.0663978803157805
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 10, Loss: 3.062606738805771
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.18it/s]


Test Accuracy: 49.65%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15613.06it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16794.13it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158448.90it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160825.16it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 4.4916211640834804
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 2, Loss: 3.9838952839374544
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 3, Loss: 3.7490133941173553
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 4, Loss: 3.628292601108551
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 5, Loss: 3.5501730632781983
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 6, Loss: 3.5221167075634003
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 7, Loss: 3.5153794181346893
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 8, Loss: 3.513034552335739
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 9, Loss: 3.5115048718452453
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 10, Loss: 3.5110759794712068
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.45it/s]


Test Accuracy: 50.08%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15323.63it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16782.32it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162602.48it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163262.84it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 4.609501179456711
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 4.138464576005935
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 3, Loss: 4.093760340213776
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 4, Loss: 4.043409699201584
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 5, Loss: 3.810849972963333
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 6, Loss: 3.7074039673805235
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 7, Loss: 3.6951728773117067
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 8, Loss: 3.687262053489685
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 9, Loss: 3.681283334493637
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 10, Loss: 3.6777704834938048
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.34it/s]


Test Accuracy: 50.03%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15563.32it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16845.44it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 144693.00it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147479.56it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 1, Loss: 3.684705834388733
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 2, Loss: 3.6390181088447573
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 3, Loss: 3.6377963995933533
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 4, Loss: 3.6375399899482725
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 5, Loss: 3.637312799692154
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 6, Loss: 3.637169771194458
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 7, Loss: 3.6371030938625335
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 8, Loss: 3.636676733493805
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 9, Loss: 3.636774806976318
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.81it/s]


Epoch 10, Loss: 3.636773555278778
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.19it/s]


Test Accuracy: 49.93%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15472.24it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16732.10it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158572.18it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159022.13it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 1, Loss: 3.7551917684078218
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 2, Loss: 3.6423707461357115
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 3, Loss: 3.639487211704254
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 4, Loss: 3.6377491617202757
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 5, Loss: 3.636429775953293
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 6, Loss: 3.635473722219467
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 7, Loss: 3.6348740541934967
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 8, Loss: 3.6345687925815584
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 9, Loss: 3.6342274260520937
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 10, Loss: 3.6338541507720947
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.38it/s]


Test Accuracy: 49.52%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15416.03it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16554.36it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162190.56it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163583.12it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 3.7907266652584077
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 2, Loss: 3.6454555904865265
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 3, Loss: 3.6415652406215666
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 4, Loss: 3.6403688621520995
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 5, Loss: 3.6393526816368102
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 6, Loss: 3.638545495271683
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 7, Loss: 3.638308265209198
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 8, Loss: 3.637829098701477
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 9, Loss: 3.637440164089203
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 10, Loss: 3.6370459401607516
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.44it/s]


Test Accuracy: 50.48%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100642.83it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 121.13it/s]


Epoch 1, Loss: 0.3828051673090158


100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 116.09it/s]


Epoch 2, Loss: 0.007288649767360766


100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 116.55it/s]


Epoch 3, Loss: 0.002652238387838679


100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 98622.21it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 159.59it/s]


Test Accuracy: 0.9995
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15400.49it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16797.00it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145136.42it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 147538.18it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 1, Loss: 6.896913003921509
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 2, Loss: 6.313498935699463
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 3, Loss: 6.254650001525879
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 4, Loss: 6.2196236729621885
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 5, Loss: 6.2024924540519715
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 6, Loss: 6.192328960895538
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 7, Loss: 6.185092396736145
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 8, Loss: 6.179775686264038
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 9, Loss: 6.172931816577911
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 10, Loss: 6.167773993015289
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 12.96it/s]


Test Accuracy: 50.43%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15451.07it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16838.23it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158585.07it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160436.98it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.14it/s]


Epoch 1, Loss: 7.158401970863342
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 6.720755379199982
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 3, Loss: 6.55238181591034
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 4, Loss: 6.496230988502503
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 5, Loss: 6.458508303165436
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 6, Loss: 6.409685785770416
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 7, Loss: 6.335550727844239
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 8, Loss: 6.290106010437012
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 9, Loss: 6.280734922885895
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 10, Loss: 6.2764830708503725
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.40it/s]


Test Accuracy: 50.61%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:20<00:00, 15932.75it/s]
100%|██████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4449.01it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 161721.02it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 164272.50it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 7.117765121459961
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 2, Loss: 6.722183375358582
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 3, Loss: 6.615443511009216
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 4, Loss: 6.570306360721588
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 5, Loss: 6.546283011436462
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 6, Loss: 6.532836875915527
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 7, Loss: 6.525142416954041
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 8, Loss: 6.520128514766693
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 9, Loss: 6.516800501346588
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 10, Loss: 6.514610843658447
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.30it/s]


Test Accuracy: 50.06%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15681.66it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16898.52it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145672.93it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 145499.15it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 6.053765344619751
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 2, Loss: 5.405572140216828
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 3, Loss: 5.365514447689057
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 4, Loss: 5.338366730213165
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 5, Loss: 5.316681175231934
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 6, Loss: 5.301026177406311
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 7, Loss: 5.289569523334503
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 8, Loss: 5.280311453342438
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 9, Loss: 5.2728914189338685
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 10, Loss: 5.26698958158493
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.30it/s]


Test Accuracy: 49.27%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15506.99it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16801.75it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158010.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 158864.92it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.21it/s]


Epoch 1, Loss: 5.91187911272049
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 2, Loss: 5.563061954975129
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 3, Loss: 5.440545358657837
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 4, Loss: 5.414837186336517
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 5, Loss: 5.406025149822235
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 6, Loss: 5.400432443618774
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 7, Loss: 5.395601191520691
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 8, Loss: 5.392176487445831
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 9, Loss: 5.3891158556938175
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 10, Loss: 5.386666238307953
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.55it/s]


Test Accuracy: 49.21%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15483.46it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16781.81it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162183.32it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 166891.64it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 7.447106394767761
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 6.165967075824738
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 3, Loss: 5.6794731593132015
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 4, Loss: 5.538811860084533
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 5, Loss: 5.5196640682220455
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 6, Loss: 5.515384609699249
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 7, Loss: 5.513652703762054
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 8, Loss: 5.513242318630218
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 9, Loss: 5.512635645866394
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 10, Loss: 5.512663445472717
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.54it/s]


Test Accuracy: 50.33%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15547.12it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16880.24it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145167.08it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 143127.84it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 1, Loss: 5.822388441562652
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 2, Loss: 5.802169752120972
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 3, Loss: 5.8017833399772645
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 4, Loss: 5.80163134098053
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 5, Loss: 5.801244866847992
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 6, Loss: 5.801202957630157
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 7, Loss: 5.801169760227204
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.11it/s]


Epoch 8, Loss: 5.800857560634613
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 9, Loss: 5.800855422019959
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.08it/s]


Epoch 10, Loss: 5.800797860622406
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.60it/s]


Test Accuracy: 49.67%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15407.15it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16712.25it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158526.11it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 156899.06it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 6.096258437633514
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 2, Loss: 5.812735998630524
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 3, Loss: 5.810654797554016
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 4, Loss: 5.81046902179718
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 5, Loss: 5.810225143432617
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 6, Loss: 5.810076122283935
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 7, Loss: 5.810152034759522
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 8, Loss: 5.810250751972198
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 9, Loss: 5.810197520256042
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 10, Loss: 5.810063943862915
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.20it/s]


Test Accuracy: 50.04%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15538.13it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16725.81it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 161576.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 164601.28it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.18it/s]


Epoch 1, Loss: 6.430804586410522
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 2, Loss: 5.824436824321747
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 3, Loss: 5.807062745094299
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 4, Loss: 5.8059313464164735
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 5, Loss: 5.805645112991333
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 6, Loss: 5.805559997558594
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 7, Loss: 5.805746133327484
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 8, Loss: 5.805511524677277
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 9, Loss: 5.805590949058533
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 10, Loss: 5.805854241847992
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.44it/s]


Test Accuracy: 50.10%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100185.66it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 120.38it/s]


Epoch 1, Loss: 0.4616644837005879


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 111.66it/s]


Epoch 2, Loss: 0.04929344684933312


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 112.76it/s]


Epoch 3, Loss: 0.012568892849685653


100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 97934.37it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 161.33it/s]


Test Accuracy: 0.9979
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15405.69it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16866.16it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 144767.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 148659.33it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 1, Loss: 5.943852434158325
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 2, Loss: 4.715328323841095
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 3, Loss: 4.489723534584045
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 4, Loss: 4.425258665084839
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 5, Loss: 4.387846767902374
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 6, Loss: 4.362091732025147
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 7, Loss: 4.344843506813049
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 8, Loss: 4.332733108997345
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 9, Loss: 4.324302790164947
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 10, Loss: 4.318057250976563
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.31it/s]


Test Accuracy: 51.76%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15693.98it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16840.64it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158220.00it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159617.62it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 1, Loss: 5.836029214859009
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 2, Loss: 4.965916998386383
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 3, Loss: 4.856643815040588
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 4, Loss: 4.823942954540253
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 5, Loss: 4.810288319587707
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 6, Loss: 4.804206674098968
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 7, Loss: 4.801164808273316
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 8, Loss: 4.799287452697754
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 9, Loss: 4.798701131343842
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 10, Loss: 4.798413317203522
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.52it/s]


Test Accuracy: 49.83%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15360.83it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16597.96it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 161107.42it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163147.26it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.21it/s]


Epoch 1, Loss: 4.970242896080017
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 2, Loss: 4.824188601970673
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 3, Loss: 4.787470660209656
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 4, Loss: 4.757234010696411
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 5, Loss: 4.736710526943207
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 6, Loss: 4.724004945755005
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 7, Loss: 4.719309582710266
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 8, Loss: 4.716777231693268
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 9, Loss: 4.71608687877655
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 10, Loss: 4.715927639007568
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.30it/s]


Test Accuracy: 49.84%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15434.38it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16616.05it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145348.16it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 142173.53it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 1, Loss: 5.304869213104248
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.78it/s]


Epoch 2, Loss: 4.2804358303546906
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.79it/s]


Epoch 3, Loss: 4.175782552957535
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 4, Loss: 4.122726879119873
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 5, Loss: 4.085141711235046
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 6, Loss: 4.052447873353958
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 7, Loss: 4.025466120243072
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 8, Loss: 4.010259032249451
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 9, Loss: 4.0035456097126
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 10, Loss: 3.9989431607723236
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.16it/s]


Test Accuracy: 48.92%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15544.83it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16790.74it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158258.39it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159969.49it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 5.965148179531098
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 5.068410658836365
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 3, Loss: 4.958048391342163
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 4, Loss: 4.8695112061500545
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 5, Loss: 4.767648251056671
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 6, Loss: 4.675162308216095
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 7, Loss: 4.634141492843628
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 8, Loss: 4.595680408477783
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 9, Loss: 4.455545644760132
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 10, Loss: 4.186701643466949
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.33it/s]


Test Accuracy: 49.58%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15539.46it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16790.72it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 161182.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159709.39it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.14it/s]


Epoch 1, Loss: 5.2176807761192325
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 4.885989639759064
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 3, Loss: 4.700081377029419
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 4, Loss: 4.6530944132804875
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 5, Loss: 4.645145661830902
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 6, Loss: 4.643848075866699
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 7, Loss: 4.643646082878113
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 8, Loss: 4.643861196041107
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 9, Loss: 4.643595349788666
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 10, Loss: 4.643643660545349
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.33it/s]


Test Accuracy: 49.90%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15541.50it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16736.56it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 144520.10it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 145062.86it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 1, Loss: 4.145534092187882
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 2, Loss: 4.130285903215408
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 3, Loss: 4.127004153728485
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 4, Loss: 4.126349968910217
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 5, Loss: 4.125781316757202
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.81it/s]


Epoch 6, Loss: 4.125765608549118
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 7, Loss: 4.125875188112259
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 8, Loss: 4.125649887323379
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 9, Loss: 4.12553729891777
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 10, Loss: 4.125750780105591
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.18it/s]


Test Accuracy: 49.96%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15355.34it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16766.61it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158449.68it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 161531.24it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 1, Loss: 4.382944226264954
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 2, Loss: 4.128731790781021
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 3, Loss: 4.126916235685348
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 4, Loss: 4.125973325967789
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 5, Loss: 4.12555370926857
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 6, Loss: 4.125158159732819
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 7, Loss: 4.1249921512603756
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 8, Loss: 4.12481518983841
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 9, Loss: 4.125045121908188
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 10, Loss: 4.124931719303131
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.31it/s]


Test Accuracy: 49.96%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15345.87it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16630.50it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 160861.80it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159405.29it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 1, Loss: 4.623067324161529
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 2, Loss: 4.137329949140549
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 3, Loss: 4.132377480268478
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 4, Loss: 4.1317290699481966
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 5, Loss: 4.1314298748970035
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 6, Loss: 4.1313658201694485
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 7, Loss: 4.131150362491607
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 8, Loss: 4.13108612537384
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 9, Loss: 4.13095901966095
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 10, Loss: 4.1308845365047455
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.42it/s]


Test Accuracy: 49.93%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100025.15it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:07<00:00, 131.21it/s]


Epoch 1, Loss: 0.44007362991396803


100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 118.48it/s]


Epoch 2, Loss: 0.04766877310703421


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 113.57it/s]


Epoch 3, Loss: 0.019700713493421063


100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 98486.28it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 162.45it/s]


Test Accuracy: 0.9960
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15387.08it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16891.89it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 144261.03it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 145814.79it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 1, Loss: 5.34721043586731
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 2, Loss: 3.9520887053012848
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 3, Loss: 3.5560462570190428
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 4, Loss: 3.4176172685623167
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 5, Loss: 3.3674055659770965
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 6, Loss: 3.334736545085907
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 7, Loss: 3.308701218366623
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 8, Loss: 3.288691520690918
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.76it/s]


Epoch 9, Loss: 3.2749970984458923
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 10, Loss: 3.2668965423107146
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.40it/s]


Test Accuracy: 50.62%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15769.21it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16798.95it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 157632.79it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159071.58it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 1, Loss: 4.307002104520798
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 2, Loss: 3.8739689350128175
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 3, Loss: 3.756998112201691
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 4, Loss: 3.680698090791702
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 5, Loss: 3.623646845817566
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 6, Loss: 3.5746828746795654
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 7, Loss: 3.5359411799907683
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 8, Loss: 3.515364603996277
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 9, Loss: 3.507248548269272
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 10, Loss: 3.5037264692783356
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.30it/s]


Test Accuracy: 51.32%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15332.25it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16723.70it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 161661.56it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 161506.98it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 4.494753451347351
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 2, Loss: 4.266847567558289
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 3, Loss: 4.074728296995163
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 4, Loss: 3.9967123818397523
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 5, Loss: 3.961234698295593
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 6, Loss: 3.947155997753143
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 7, Loss: 3.9416272342205048
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 8, Loss: 3.93961639046669
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 9, Loss: 3.938794890642166
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 10, Loss: 3.938206424713135
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.42it/s]


Test Accuracy: 49.55%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15591.34it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16886.73it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 144423.55it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 146835.73it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.15it/s]


Epoch 1, Loss: 4.340236523151398
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 2, Loss: 3.4569677472114564
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 3, Loss: 3.3012601923942566
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 4, Loss: 3.2413146245479583
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 5, Loss: 3.205340340137482
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 6, Loss: 3.180101436376572
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 7, Loss: 3.1600737500190736
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 8, Loss: 3.1430668127536774
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 9, Loss: 3.1259731674194335
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 10, Loss: 3.1106507241725923
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.39it/s]


Test Accuracy: 49.95%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15506.01it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16844.66it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 157445.69it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 158175.94it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 1, Loss: 4.550403071641922
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 2, Loss: 3.8907737874984742
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 3, Loss: 3.6570996975898744
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 4, Loss: 3.52064355969429
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 5, Loss: 3.4496390295028685
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 6, Loss: 3.417749522924423
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 7, Loss: 3.4011785984039307
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 8, Loss: 3.3904889214038847
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 9, Loss: 3.381591466665268
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 10, Loss: 3.372371693849564
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 12.93it/s]


Test Accuracy: 50.61%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15573.96it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16837.33it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162147.85it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 161111.18it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 4.931737220287323
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 4.276641848087311
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 3, Loss: 4.108942672014236
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 4, Loss: 3.993821659088135
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 5, Loss: 3.946281566619873
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 6, Loss: 3.932744804620743
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 7, Loss: 3.9298500442504882
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 8, Loss: 3.929109081029892
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 9, Loss: 3.928876042366028
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 10, Loss: 3.929053335189819
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.49it/s]


Test Accuracy: 49.57%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15511.12it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16809.65it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145141.77it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 144765.45it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 1, Loss: 3.6503448390960695
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 2, Loss: 3.598488475084305
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 3, Loss: 3.594409946203232
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 4, Loss: 3.59281974196434
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 5, Loss: 3.5915152168273927
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 6, Loss: 3.5911522734165193
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 7, Loss: 3.590645513534546
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 8, Loss: 3.59028742313385
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 9, Loss: 3.5900429701805114
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 10, Loss: 3.589960398674011
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.31it/s]


Test Accuracy: 51.04%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15496.97it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16676.51it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158185.84it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 160165.58it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 1, Loss: 3.918723964691162
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 2, Loss: 3.598633646965027
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 3, Loss: 3.5964181196689604
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 4, Loss: 3.595758123397827
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 5, Loss: 3.595416194200516
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 6, Loss: 3.5949784660339357
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 7, Loss: 3.594966286420822
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 8, Loss: 3.594730408191681
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 9, Loss: 3.594639337062836
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 10, Loss: 3.5946448218822478
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.48it/s]


Test Accuracy: 51.21%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15514.18it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16929.26it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162007.78it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 162500.64it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 1, Loss: 3.961137526035309
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 2, Loss: 3.5968950057029723
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 3, Loss: 3.5930457031726837
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 4, Loss: 3.5918291246891023
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 5, Loss: 3.5912958097457888
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 6, Loss: 3.5908601772785187
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 7, Loss: 3.590788415670395
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 8, Loss: 3.5906599199771883
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 9, Loss: 3.590458266735077
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 10, Loss: 3.590381416082382
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.27it/s]


Test Accuracy: 50.77%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100329.00it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 120.71it/s]


Epoch 1, Loss: 0.40482930051803123


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 111.89it/s]


Epoch 2, Loss: 0.047778037805073836


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 112.78it/s]


Epoch 3, Loss: 0.011844144092947317


100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 97863.08it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 159.73it/s]


Test Accuracy: 0.9975
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15307.80it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16791.43it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145020.29it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 146499.80it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 1, Loss: 5.595932829380035
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 2, Loss: 3.923181563615799
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.80it/s]


Epoch 3, Loss: 3.6890714454650877
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 4, Loss: 3.6149335777759553
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 5, Loss: 3.5747544348239897
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.79it/s]


Epoch 6, Loss: 3.548391441106796
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.78it/s]


Epoch 7, Loss: 3.528205877542496
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.81it/s]


Epoch 8, Loss: 3.5123446702957155
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.80it/s]


Epoch 9, Loss: 3.4982355260849
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 10, Loss: 3.4852601253986357
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.12it/s]


Test Accuracy: 49.32%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15421.16it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16799.36it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158429.05it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 157647.41it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.16it/s]


Epoch 1, Loss: 5.061354248523712
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 2, Loss: 4.653534727096558
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 3, Loss: 4.520630757808686
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 4, Loss: 4.411726109981537
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 5, Loss: 4.277239532470703
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 6, Loss: 4.228151295185089
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 7, Loss: 4.214767575263977
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 8, Loss: 4.211500549316407
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 9, Loss: 4.210815290212631
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 10, Loss: 4.210765873193741
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.32it/s]


Test Accuracy: 49.43%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15458.01it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16836.26it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162344.39it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 162470.43it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.11it/s]


Epoch 1, Loss: 5.262016286849976
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 2, Loss: 4.760592656135559
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 3, Loss: 4.646305747032166
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 4, Loss: 4.615851907730103
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 5, Loss: 4.604778277873993
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 6, Loss: 4.600376315116883
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 7, Loss: 4.598731837272644
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 8, Loss: 4.598367393016815
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 9, Loss: 4.597851059436798
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 10, Loss: 4.59776745557785
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.34it/s]


Test Accuracy: 50.26%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15678.73it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16709.28it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 144584.06it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 146492.64it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 1, Loss: 4.3711578965187075
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 2, Loss: 3.970457566976547
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 3, Loss: 3.940607389211655
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 4, Loss: 3.928549803495407
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 5, Loss: 3.920349813699722
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 6, Loss: 3.9148310446739196
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 7, Loss: 3.9106791472434996
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 8, Loss: 3.9069672322273252
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 9, Loss: 3.9042954015731812
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.76it/s]


Epoch 10, Loss: 3.9020514810085296
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.28it/s]


Test Accuracy: 49.81%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15311.89it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16488.66it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 157955.97it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 158624.00it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 5.033341534137726
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 4.352913272380829
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 3, Loss: 4.236822311878204
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 4, Loss: 4.129132858514786
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 5, Loss: 4.072566599845886
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 6, Loss: 4.042298241853714
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 7, Loss: 4.020744903087616
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 8, Loss: 4.00446771144867
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 9, Loss: 3.995856032371521
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 10, Loss: 3.991596590280533
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.56it/s]


Test Accuracy: 49.89%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15647.42it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16938.63it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 161920.47it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 164161.27it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 1, Loss: 5.2852113246917725
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 2, Loss: 4.617359356880188
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 3, Loss: 4.550762341022492
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 4, Loss: 4.517148315906525
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 5, Loss: 4.496625363826752
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 6, Loss: 4.486619219779969
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 7, Loss: 4.482556331157684
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 8, Loss: 4.4807176542282106
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 9, Loss: 4.479892525672913
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 10, Loss: 4.47969176530838
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.37it/s]


Test Accuracy: 49.82%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15645.86it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16777.73it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145030.18it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 144740.48it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.06it/s]


Epoch 1, Loss: 4.396799681186676
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 4.361177411079407
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 3, Loss: 4.357234318256378
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 4, Loss: 4.353917596340179
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.79it/s]


Epoch 5, Loss: 4.351726880073548
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 6, Loss: 4.350619032382965
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 7, Loss: 4.350294787883758
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 8, Loss: 4.349907081127167
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 9, Loss: 4.349900031089783
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 10, Loss: 4.349607725143432
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.38it/s]


Test Accuracy: 50.27%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15416.27it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16852.96it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158516.85it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 158006.71it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.09it/s]


Epoch 1, Loss: 4.499024651050568
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 4.355379240512848
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 3, Loss: 4.350488381385803
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 4, Loss: 4.349979603290558
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 5, Loss: 4.349969766139984
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 6, Loss: 4.3495448970794675
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 7, Loss: 4.349500100612641
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 8, Loss: 4.349590094089508
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 9, Loss: 4.349460444450378
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 10, Loss: 4.349328293800354
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.33it/s]


Test Accuracy: 50.56%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15566.18it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16880.57it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162808.95it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 164394.83it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 4.850559535026551
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 4.364798395633698
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 3, Loss: 4.364399900436402
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 4, Loss: 4.364233314990997
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 5, Loss: 4.364116046428681
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 6, Loss: 4.3639977431297305
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 7, Loss: 4.363887777328491
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 8, Loss: 4.363857378959656
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 9, Loss: 4.363865404129029
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 10, Loss: 4.363804097175598
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.35it/s]


Test Accuracy: 50.27%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|████████████████████████████████████████████| 1048576/1048576 [00:10<00:00, 100577.35it/s]
100%|█████████████████████████████████████████████████████| 1024/1024 [00:08<00:00, 120.77it/s]


Epoch 1, Loss: 0.4238033949950477


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 111.18it/s]


Epoch 2, Loss: 0.06168463947324199


100%|█████████████████████████████████████████████████████| 1024/1024 [00:09<00:00, 112.24it/s]


Epoch 3, Loss: 0.01714127736067894


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 100276.47it/s]
100%|█████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 159.59it/s]


Test Accuracy: 0.9965
Layer1 : [[0, 1, 2, 3, 4, 5, 6, 7]]


100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15303.78it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16857.97it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145383.92it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 148374.30it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 1, Loss: 6.654012327194214
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 2, Loss: 4.959147274494171
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.82it/s]


Epoch 3, Loss: 4.752251675128937
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 4, Loss: 4.646232302188873
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 5, Loss: 4.586336317062378
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 6, Loss: 4.558071897029877
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.79it/s]


Epoch 7, Loss: 4.540982041358948
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.86it/s]


Epoch 8, Loss: 4.5296290755271915
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.77it/s]


Epoch 9, Loss: 4.522755851745606
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.84it/s]


Epoch 10, Loss: 4.51911465883255
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.21it/s]


Test Accuracy: 49.12%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15403.55it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16772.61it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 157954.48it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 156393.00it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 1, Loss: 6.302568430900574
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 2, Loss: 5.491775424480438
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 3, Loss: 5.3471599340438845
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 4, Loss: 5.274302484989167
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.90it/s]


Epoch 5, Loss: 5.241019992828369
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 6, Loss: 5.224298303127289
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 7, Loss: 5.2131958985328675
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 8, Loss: 5.191617243289947
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 9, Loss: 5.110382490158081
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 10, Loss: 4.92163075208664
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.18it/s]


Test Accuracy: 50.14%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15476.89it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16857.74it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 161783.65it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 163072.41it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.08it/s]


Epoch 1, Loss: 6.072912504673004
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 2, Loss: 5.636305944919586
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 3, Loss: 5.464079568386078
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 4, Loss: 5.412426099777222
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 5, Loss: 5.224492981433868
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 6, Loss: 5.065022435188293
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.92it/s]


Epoch 7, Loss: 5.058343007564544
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 8, Loss: 5.057702143192291
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 9, Loss: 5.057575099468231
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 10, Loss: 5.057544379234314
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.44it/s]


Test Accuracy: 49.70%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15779.85it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16801.61it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145046.48it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 145207.50it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.12it/s]


Epoch 1, Loss: 5.647190945148468
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 2, Loss: 5.396040215492248
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 3, Loss: 5.327083668708801
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 4, Loss: 5.290016708374023
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 5, Loss: 5.2670031666755674
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 6, Loss: 5.251000587940216
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 7, Loss: 5.22423672914505
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.89it/s]


Epoch 8, Loss: 5.1546105599403385
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 9, Loss: 5.132743303775787
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.87it/s]


Epoch 10, Loss: 5.124953784942627
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.26it/s]


Test Accuracy: 50.04%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:23<00:00, 15403.53it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16965.40it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 158460.61it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 161019.64it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.11it/s]


Epoch 1, Loss: 5.695870659351349
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 2, Loss: 5.397851877212524
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 3, Loss: 5.327441968917847
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 4, Loss: 5.313110613822937
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.96it/s]


Epoch 5, Loss: 5.308492896556854
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 6, Loss: 5.30103574514389
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 7, Loss: 5.277329294681549
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 8, Loss: 5.223212268352508
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.94it/s]


Epoch 9, Loss: 5.186868665218353
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 10, Loss: 5.177505824565888
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.47it/s]


Test Accuracy: 49.29%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15431.97it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16913.37it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 162725.72it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 162865.35it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.10it/s]


Epoch 1, Loss: 6.374242098331451
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 2, Loss: 6.021466028690338
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 3, Loss: 5.991330769062042
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 4, Loss: 5.967022278308868
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.00it/s]


Epoch 5, Loss: 5.946339118480682
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 6, Loss: 5.929126935005188
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 7, Loss: 5.916129274368286
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 8, Loss: 5.906799705028534
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 9, Loss: 5.9005402565002445
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.97it/s]


Epoch 10, Loss: 5.896634435653686
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.34it/s]


Test Accuracy: 50.07%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15739.58it/s]
100%|██████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4327.87it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 145257.47it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 146782.81it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.08it/s]


Epoch 1, Loss: 5.130777530670166
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 2, Loss: 5.070825788974762
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 3, Loss: 5.069475882053375
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 4, Loss: 5.06886996269226
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.83it/s]


Epoch 5, Loss: 5.068437936306
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.85it/s]


Epoch 6, Loss: 5.068422763347626
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.88it/s]


Epoch 7, Loss: 5.068254704475403
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 8, Loss: 5.0681366133689885
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.91it/s]


Epoch 9, Loss: 5.067957603931427
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 10, Loss: 5.067932686805725
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.44it/s]


Test Accuracy: 50.13%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:21<00:00, 15665.96it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16507.90it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:08<00:00, 157582.94it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 159316.29it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 1, Loss: 5.275947477817535
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00, 10.00it/s]


Epoch 2, Loss: 5.0452171993255615
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 3, Loss: 5.045076737403869
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 4, Loss: 5.045334222316742
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.95it/s]


Epoch 5, Loss: 5.045045604705811
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 6, Loss: 5.044877278804779
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.05it/s]


Epoch 7, Loss: 5.04513720035553
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.93it/s]


Epoch 8, Loss: 5.044840099811554
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.98it/s]


Epoch 9, Loss: 5.044631335735321
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.02it/s]


Epoch 10, Loss: 5.044945342540741
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.48it/s]


Test Accuracy: 49.37%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2

100%|█████████████████████████████████████████████| 1280000/1280000 [01:22<00:00, 15544.00it/s]
100%|█████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16704.54it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████| 1280000/1280000 [00:07<00:00, 161764.91it/s]


[SYST] Prepare Data


100%|████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 161074.68it/s]

[SYST] Epoch 0



100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]


Epoch 1, Loss: 5.283528451919556
[SYST] Epoch 1


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 2, Loss: 5.065073955059051
[SYST] Epoch 2


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 3, Loss: 5.064246156215668
[SYST] Epoch 3


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 4, Loss: 5.064067397117615
[SYST] Epoch 4


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 5, Loss: 5.064047696590424
[SYST] Epoch 5


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.01it/s]


Epoch 6, Loss: 5.06393016576767
[SYST] Epoch 6


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]


Epoch 7, Loss: 5.063757789134979
[SYST] Epoch 7


100%|████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.04it/s]


Epoch 8, Loss: 5.06369208574295
[SYST] Epoch 8


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 9, Loss: 5.0634840083122254
[SYST] Epoch 9


100%|████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.99it/s]


Epoch 10, Loss: 5.063301341533661
[SYST] Epoch 0


100%|████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 13.23it/s]

Test Accuracy: 49.53%
[{'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013, '[[0, 1]]': 0.5039, '[[0]]': 0.5082}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037, '[[0, 1]]': 0.5032, '[[0]]': 0.5075}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925, '[[0, 1]]': 0.5037, '[[0]]': 0.5081}}, {'accuracy': 0.9983, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012, '[[0, 1]]': 0.5059, '[[0]]': 0.4956}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027, '[[0, 1]]': 0.4957, '[[0]]': 0.493}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966, '[[0, 1]]': 0.4996, '[[0]]': 0.5071}}, {'accuracy': 0.9906, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964, '[[0, 1]]': 0.5118, '[[0]]': 0.5024}, 'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993, '[[0, 1]]': 0.4958, '[[0]]': 0.5061}, 'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949, '[[0, 1]]': 0.5015, '[[0]]': 0.4977}}, {'accuracy': 0.9955, 'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024, '[[0, 1]]': 0.5025, '[[0]]': 0.4974}, 'Layer2': {'[[0, 1, 2




In [12]:
results

[{'accuracy': 0.9983,
  'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5013,
   '[[0, 1]]': 0.5039,
   '[[0]]': 0.5082},
  'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5037,
   '[[0, 1]]': 0.5032,
   '[[0]]': 0.5075},
  'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4925,
   '[[0, 1]]': 0.5037,
   '[[0]]': 0.5081}},
 {'accuracy': 0.9983,
  'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5012,
   '[[0, 1]]': 0.5059,
   '[[0]]': 0.4956},
  'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5027,
   '[[0, 1]]': 0.4957,
   '[[0]]': 0.493},
  'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4966,
   '[[0, 1]]': 0.4996,
   '[[0]]': 0.5071}},
 {'accuracy': 0.9906,
  'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4964,
   '[[0, 1]]': 0.5118,
   '[[0]]': 0.5024},
  'Layer2': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4993,
   '[[0, 1]]': 0.4958,
   '[[0]]': 0.5061},
  'Layer3': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.4949,
   '[[0, 1]]': 0.5015,
   '[[0]]': 0.4977}},
 {'accuracy': 0.9955,
  'Layer1': {'[[0, 1, 2, 3, 4, 5, 6, 7]]': 0.5024,
   '

In [13]:
import json
with open('results.json', 'w') as f:
    json.dump(results, f)
