In [1]:
import torch
from torch.utils.data import Dataset
import numpy as np
from torch_geometric.utils import to_undirected
from sklearn.metrics import accuracy_score
from sklearn.metrics import roc_auc_score
from ssm_utlis import set_seed
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from tqdm.notebook import tqdm 
#set_seed(21)
from ssm_memory import MemoryModel
class CTDGraphDataset(Dataset):
    def __init__(self, N, M, seed=42):
        """
        Args:
            N (int): number of edges per sequence
            M (int): number of sequences
        """
        self.N = N
        self.M = M
        np.random.seed(seed)

        self.data = []
        self.labels = []

        for _ in range(M):
            # node 0 signal = label
            y = np.random.choice([0, 1])
            self.labels.append(y)

            # node signals
            signals = {0: float(y)*2-1}
            for i in range(1, N + 1):
                signals[i] = np.random.uniform(-1, 1)

            # edges
            src = np.arange(0, N)
            dst = np.arange(1, N + 1)
            times = np.sort(np.random.uniform(0, 10, N))  # increasing times

            # endpoint signals
            x_src = np.array([signals[s] for s in src])
            x_dst = np.array([signals[d] for d in dst])

            self.data.append((src, dst, times, x_src, x_dst))

    def __len__(self):
        return self.M

    def __getitem__(self, idx):
        src, dst, times, x_src, x_dst = self.data[idx]
        y = self.labels[idx]

        return {
            "src": torch.tensor(src, dtype=torch.long),
            "dst": torch.tensor(dst, dtype=torch.long),
            "t": torch.tensor(times, dtype=torch.float32),
            "x_src": torch.tensor(x_src, dtype=torch.float32),
            "x_dst": torch.tensor(x_dst, dtype=torch.float32),
            "y": torch.tensor(y, dtype=torch.float32)
        }





In [2]:
from torch.utils.data import DataLoader, random_split


def get_loaders(N, M, batch_size=4, train_split=0.7, val_split=0.15):
    """
    Args:
        N (int): number of nodes (dataset-specific param for CTDGraphDataset).
        M (int): number of samples.
        batch_size (int): batch size for loaders.
        train_split (float): fraction of data to use for training.
        val_split (float): fraction of data to use for validation.
        seed (int): random seed.
        
    Returns:
        train_loader, val_loader, test_loader
    """
    dataset = CTDGraphDataset(N, M)

    # sizes
    train_size = int(train_split * M)
    val_size = int(val_split * M)
    test_size = M - (train_size + val_size)

    # make sure the total matches exactly
    assert train_size + val_size + test_size == M, "Split sizes must sum to dataset size"

    # split
    train_dataset, val_dataset, test_dataset = random_split(
        dataset, [train_size, val_size, test_size], generator=torch.Generator()
    )

    # loaders
    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
    val_loader   = DataLoader(val_dataset, batch_size=batch_size, shuffle=False)
    test_loader  = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)

    return train_loader, val_loader, test_loader

In [3]:
class EarlyStopping:
    def __init__(self, patience=10, delta=0.0, path="best_model_sq.pt"):
        self.patience = patience
        self.delta = delta
        self.best_acc = -float("inf")
        self.counter = 0
        self.early_stop = False
        self.path = path  # save checkpoint

    def __call__(self, acc, model):
        if acc > self.best_acc + self.delta:
            self.best_acc = acc
            self.counter = 0
            # save model checkpoint
            torch.save(model.state_dict(), self.path)
        else:
            self.counter += 1
            if self.counter >= self.patience:
                self.early_stop = True

## Create Dataset

In [4]:
N = 3
M=1000
batch_size = 400
train_loader,val_laoder,test_loader = get_loaders(N=N,M=M,batch_size=batch_size)

## Create Model

In [5]:
a = torch.arange(10)
torch.hstack([a,a]).view(2*10,-1).view(2,10,-1)[0]

tensor([[0],
        [1],
        [2],
        [3],
        [4],
        [5],
        [6],
        [7],
        [8],
        [9]])

In [6]:
state_dim =32
time_dim = 4
device = 'cuda'
lr = 1e-2/2
epochs = 1600
model = MemoryModel(num_nodes=N+1,input_dim=1,hidden_dim=state_dim,time_dim=time_dim,reg=1e-4,device=device,update_type='mamba').to(device)
path = 'sq_mod.pt'


Static Embeddings: Nil


In [7]:
def train_model(model,train_loader,optimizer,criterion,delta,reg):
    model.train()
    total_loss, total_score, total_samples = 0, [], []
    pred = []
    hidden_state_list = []
    # yt = torch.zeros((len(train_loader),1),device=model.device)
    neighbour = 0

    for batch in train_loader:
        src, dst = batch["src"].to(device), batch["dst"].to(device)
        batch_size = src.shape[0]
        batch_ids = torch.arange(src.shape[0],device=device)
        x_src, x_dst, y = batch["x_src"].to(device), batch["x_dst"].to(device), batch["y"].to(device)
        src_b,dst_b = src+batch_ids[:,None],dst+batch_ids[:,None]
        m1_vec = torch.zeros((batch_size,model.num_nodes,model.hidden_dim),device=model.device)
        ne_vec = torch.zeros((batch_size,model.num_nodes,model.hidden_dim),device=model.device)
        # edge_index = torch.stack([torch.arange(batch_size*model.num_nodes,device=model.device),torch.arange(batch_size*model.num_nodes,device=model.device)])
        for t in range(src.shape[-1]):
            src_t = src_b[0,t]
            dst_t = dst_b[0,t]
            
            if t>0:
                neighbour = src[0,t-1]
            else :
                neighbour = src[0,t]

            src_tau = src[0,:t]
            dst_tau = dst[0,:t]

            L = torch.zeros((dst_t+1,dst_t+1),device=device)
            I = torch.eye(len(L),device=device)
            for u,v in zip(src_tau.tolist(),dst_tau.tolist()):
                L[u,v]=1
                L[v,u]=1

            D = torch.sum(L,dim=1)
            D[D==0]=1
            D = torch.diag(D**(-0.5))
            L_past = I - D@L.clone()@D

            L[src_t,dst_t]=1
            L[dst_t,src_t]=1

            D = torch.sum(L,dim=1)
            D[D==0]=1
            D = torch.diag(D**(-0.5))

            L_present = I - D@L.clone()@D

            active = torch.hstack([neighbour,src_t,dst_t])

            L_sub_present = L_present[active.min():active.max()+1,active.min():active.max()+1] 
            L_sub_past = L_past[active.min():active.max()+1,active.min():active.max()+1]

            if t==0:
                L_sub_past = torch.eye(len(L_sub_past),device=device)

            In = torch.eye(len(L_sub_past )).to(device)
            x_t = torch.zeros((batch_size,len(L_sub_past ),model.input_dim),device=model.device)
            # x_n =  torch.zeros((batch_size,2,model.hidden_dim),device=model.device)

            # Fill Data to Current Node
            if t>0:
                x_t[:,-3] = x_src[:,t-1].unsqueeze(-1)

                
            x_t[:,-2]= x_src[:,t].unsqueeze(-1)
            x_t[:,-1]= x_dst[:,t].unsqueeze(-1)

            
            prev_c_1= m1_vec[:,torch.unique(active)].view((batch_size*(len(L_sub_past )),-1))
            x_batch = x_t.view(batch_size*len(L_sub_past ),-1)
            zt = model.TuneInputSC(x_batch) # input Tuning / Selective Scan
            
            A = model.A_
            At_ = torch.matrix_exp(-A.T*delta) #torch.eye(len(A)).to(device) -A.T*delta #torch.matrix_exp(-A.T*delta)
            
            PL_ = model.w[0]*In + model.w[1]*L_sub_present  + model.w[2]*L_sub_present@L_sub_present
            PL_p = model.w[0]*In + model.w[1]*L_sub_past  + model.w[2]*L_sub_past@L_sub_past                  

            PL_inv = torch.linalg.inv(PL_)
            A_s= 0*In # - PL_inv@PL_p
            PL_b = torch.block_diag(*PL_inv[None,:,:].repeat(batch_size,1,1))
            A_sb = torch.block_diag(*A_s.unsqueeze(0).repeat(batch_size,1,1))
            updated_c_1=  -A_sb@ prev_c_1 +  prev_c_1 @ At_  +  PL_b @ zt
            final_state = updated_c_1

            m1_vec[:,torch.unique(active)] = updated_c_1.view(batch_size,len(L_sub_past ),-1)
            ne_vec[:,torch.unique(active)] = final_state.view(batch_size,len(L_sub_past ),-1)

            # edge_index = current_edge_index.clone()

        hidden_state_list.append(ne_vec)
        logits = model.SeqClass(hidden_state_list[-1][:,-1]).view(-1)
        loss = criterion(target = y,input=logits) #+ torch.norm(model.A_hippo-model.A_,p=2)*1e-1
        total_loss += loss #/ batch_size
        # preds = ( logits> 0).float()
        pred += (logits>0).to(int).tolist()
        total_score += logits.tolist()
        total_samples += y.tolist()

        if torch.is_grad_enabled():
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

    acc = accuracy_score(pred,total_samples)
    if torch.is_grad_enabled():
        print(f"Epoch | Loss: {total_loss:.4f} | Acc: {acc:.4f}")
        
    else:
        print(f'val/test acc: {acc} ')
    
    return acc
    

## Train Model

In [19]:
v = []

N = 20
M=1000
batch_size = 400
train_loader,val_laoder,test_loader = get_loaders(N=N,M=M,batch_size=batch_size)

for _ in range(10):
    state_dim =32
    time_dim = 4
    device = 'cuda'
    lr = 1e-2
    epochs = 1600
    model = MemoryModel(num_nodes=N+1,input_dim=1,hidden_dim=state_dim,time_dim=time_dim,reg=1e-4,device=device,update_type='mamba').to(device)
    print(model.w)
    path = 'sq_mod_x.pt'
    early_stopper = EarlyStopping(patience=50, delta=1e-3,path=path)
    criterion = nn.BCEWithLogitsLoss()  # for binary classification
    optimizer = optim.Adam(model.parameters(), lr=lr,weight_decay=1e-3)

    delta = 1/(N+1)
    for epoch in tqdm(range(epochs),desc='Epochs: '):
        train_model(model,train_loader,optimizer,criterion,delta,0.1)

        with torch.no_grad():
            val_acc = train_model(model,val_laoder,optimizer,criterion,delta,0.1)
        early_stopper(val_acc, model)
        if early_stopper.early_stop:
            print(f"Early stopping at epoch {epoch+1}")
            break
    
    model.load_state_dict(torch.load(path,weights_only=True))
    print(model.w)
    with torch.no_grad():
        test_acc = train_model(model,test_loader,optimizer,criterion,delta,0.1)
        v.append(test_acc)


Static Embeddings: Nil
Parameter containing:
tensor([ 0.2500, 10.0000, 20.0000], device='cuda:0', requires_grad=True)


Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.3944 | Acc: 0.4743
val/test acc: 0.4866666666666667 
Epoch | Loss: 1.3872 | Acc: 0.5029
val/test acc: 0.54 
Epoch | Loss: 1.3853 | Acc: 0.5271
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3935 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3865 | Acc: 0.5029
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3882 | Acc: 0.4757
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3849 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3843 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3848 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3841 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3850 | Acc: 0.5186
val/test acc: 0.5266666666666666 
Epoch | Loss: 1.3839 | Acc: 0.5329
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3838 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3832 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3835 | Acc: 0.5257
val/test acc:

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.3899 | Acc: 0.4986
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3905 | Acc: 0.4957
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3975 | Acc: 0.5257
val/test acc: 0.5666666666666667 
Epoch | Loss: 1.3878 | Acc: 0.5014
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3930 | Acc: 0.4743
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3890 | Acc: 0.4743
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3867 | Acc: 0.4743
val/test acc: 0.4866666666666667 
Epoch | Loss: 1.3862 | Acc: 0.5186
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3854 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3852 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3836 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3843 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3843 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3844 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3838 | Acc: 0.5257

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.3874 | Acc: 0.5429
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3975 | Acc: 0.4514
val/test acc: 0.5466666666666666 
Epoch | Loss: 1.3865 | Acc: 0.5271
val/test acc: 0.56 
Epoch | Loss: 1.3865 | Acc: 0.5314
val/test acc: 0.5133333333333333 
Epoch | Loss: 1.3886 | Acc: 0.5000
val/test acc: 0.52 
Epoch | Loss: 1.3858 | Acc: 0.4957
val/test acc: 0.5266666666666666 
Epoch | Loss: 1.3860 | Acc: 0.5114
val/test acc: 0.5133333333333333 
Epoch | Loss: 1.3853 | Acc: 0.5143
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3859 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3851 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3851 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3843 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3844 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3852 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3841 | Acc: 0.5257
val/test acc: 0.53333333333

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.3928 | Acc: 0.5000
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3889 | Acc: 0.4743
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3863 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3852 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3858 | Acc: 0.5086
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3862 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3862 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3841 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3838 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3846 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3840 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3837 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3839 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3833 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3838 | Acc: 0.5257

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.4119 | Acc: 0.4743
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3908 | Acc: 0.4929
val/test acc: 0.52 
Epoch | Loss: 1.3902 | Acc: 0.4600
val/test acc: 0.5466666666666666 
Epoch | Loss: 1.3875 | Acc: 0.5271
val/test acc: 0.5133333333333333 
Epoch | Loss: 1.3975 | Acc: 0.5057
val/test acc: 0.5 
Epoch | Loss: 1.3861 | Acc: 0.5129
val/test acc: 0.5 
Epoch | Loss: 1.3937 | Acc: 0.5186
val/test acc: 0.5066666666666667 
Epoch | Loss: 1.3837 | Acc: 0.5400
val/test acc: 0.5 
Epoch | Loss: 1.3867 | Acc: 0.5171
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3901 | Acc: 0.5300
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3896 | Acc: 0.5014
val/test acc: 0.4533333333333333 
Epoch | Loss: 1.3825 | Acc: 0.5457
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3867 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3827 | Acc: 0.5286
val/test acc: 0.5266666666666666 
Epoch | Loss: 1.3855 | Acc: 0.5071
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3820 | A

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.4065 | Acc: 0.4771
val/test acc: 0.5066666666666667 
Epoch | Loss: 1.3798 | Acc: 0.5414
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3924 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3882 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3835 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3838 | Acc: 0.5229
val/test acc: 0.5133333333333333 
Epoch | Loss: 1.3838 | Acc: 0.5243
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3833 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3825 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3846 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3840 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3834 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3833 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3836 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3832 | Acc: 0.5257

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.4210 | Acc: 0.4843
val/test acc: 0.5066666666666667 
Epoch | Loss: 1.3865 | Acc: 0.5314
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3837 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3876 | Acc: 0.5257
val/test acc: 0.49333333333333335 
Epoch | Loss: 1.3866 | Acc: 0.5100
val/test acc: 0.4533333333333333 
Epoch | Loss: 1.3870 | Acc: 0.5043
val/test acc: 0.4866666666666667 
Epoch | Loss: 1.3834 | Acc: 0.5329
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3845 | Acc: 0.5257
val/test acc: 0.5466666666666666 
Epoch | Loss: 1.3872 | Acc: 0.5257
val/test acc: 0.5533333333333333 
Epoch | Loss: 1.3839 | Acc: 0.5200
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3833 | Acc: 0.5271
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3843 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3851 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3834 | Acc: 0.5286
val/test acc: 0.5066666666666667 
Epoch | Loss: 1.3833 | Acc: 0.524

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.3864 | Acc: 0.4971
val/test acc: 0.5266666666666666 
Epoch | Loss: 1.3847 | Acc: 0.5243
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3864 | Acc: 0.5057
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3866 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3847 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3834 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3830 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3860 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3848 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3839 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3838 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3842 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3839 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3837 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3834 | Acc: 0.5257

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.4001 | Acc: 0.4743
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3876 | Acc: 0.5071
val/test acc: 0.54 
Epoch | Loss: 1.3930 | Acc: 0.5286
val/test acc: 0.5 
Epoch | Loss: 1.3877 | Acc: 0.4771
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3888 | Acc: 0.4743
val/test acc: 0.4666666666666667 
Epoch | Loss: 1.3866 | Acc: 0.4814
val/test acc: 0.49333333333333335 
Epoch | Loss: 1.3851 | Acc: 0.5171
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3853 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3845 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3842 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3850 | Acc: 0.5171
val/test acc: 0.5466666666666666 
Epoch | Loss: 1.3848 | Acc: 0.5157
val/test acc: 0.5266666666666666 
Epoch | Loss: 1.3853 | Acc: 0.5186
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3838 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3833 | Acc: 0.5257
val/test acc: 0.53333333333

Epochs:   0%|          | 0/1600 [00:00<?, ?it/s]

Epoch | Loss: 1.3853 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.4224 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3856 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3932 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3899 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3878 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3851 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3853 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3858 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3856 | Acc: 0.5257
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3865 | Acc: 0.5314
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3849 | Acc: 0.5214
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3847 | Acc: 0.5243
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3854 | Acc: 0.5329
val/test acc: 0.5333333333333333 
Epoch | Loss: 1.3851 | Acc: 0.5257

In [21]:
print(np.mean(v),np.std(v))

0.5446666666666666 0.007333333333333339
