# Transpose Attack using Simple Linear Layer Network

In [1]:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader, random_split, Subset
import torch.nn.functional as F
from collections import Counter
import datasets
from datasets import load_dataset
from sentence_transformers import SentenceTransformer
from tqdm import tqdm
import time
import faiss

In [2]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [3]:
# sentence transformer model
# transforms input sentences to sentence embeddings
st_model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2').to(device)  # in GPU

In [4]:
# using StanfordNLP IMDB dataset
dataset = load_dataset("stanfordnlp/imdb")

In [5]:
def grayN(base, digits, value):
    '''
    A method for producing the grayN code for the spatial index
    @base: the base for the code
    @digits: Length of the code - should be equal to the output size of the model
    @value: the value to encode
    '''
    baseN = torch.zeros(digits)
    gray = torch.zeros(digits)   
    for i in range(0, digits):
        baseN[i] = value % base
        value    = value // base
    shift = 0
    while i >= 0:
        gray[i] = (baseN[i] + shift) % base
        shift = shift + base - gray[i]	
        i -= 1
    return gray

In [6]:
class CustomDataset(Dataset):
    def __init__(self, dataset:datasets.dataset_dict.DatasetDict, st_model:SentenceTransformer, is_train=True):
        if is_train:
            self.data = dataset['train']['text']
            self.targets = dataset['train']['label']
        else:
            self.data = dataset['test']['text']
            self.targets = dataset['test']['label']
        self.st_model = st_model  # sentence transformer model
        print("Encoding sentences ...")
        start_time = time.time()
        self.embeddings = self.st_model.encode(self.data)  # encode to sentence embeddings
        self.embeddings = torch.tensor(self.embeddings)  # convert to torch tensor
        end_time = time.time()
        print("Elaped time encoding =", end_time - start_time)

    def __len__(self):
        return len(self.targets)

    def __getitem__(self, index):
        with torch.no_grad():
            text = self.data[index]
            embedding = self.embeddings[index]
            target = torch.tensor(self.targets[index])

        return {
            "target": target,
            "embedding": embedding,
            "text": text
        }

In [7]:
class CustomMemDataset(Dataset):
    def __init__(self, dataset:datasets.dataset_dict.DatasetDict, st_model:SentenceTransformer, num_classes:int, memorize_percentage:float=0.1):
        if memorize_percentage < 0.0 or memorize_percentage > 1.0:
            raise ValueError("memorize_percentage must be between 0.0 and 1.0")
        self.data = dataset['train']['text']
        self.targets = dataset['train']['label']
        self.data = self.data[:int(len(self.data) * memorize_percentage)]  # leave only some portion of data
        self.targets = self.targets[:int(len(self.targets) * memorize_percentage)]  # leave only some portion of data
        self.indxs = torch.arange(len(self.data))
        self.code_size = num_classes # equal to the number of model outputs (0, 1)
        self.st_model = st_model
        print("Encoding sentences ...")
        start_time = time.time()
        self.embeddings = self.st_model.encode(self.data)  # encode to sentence embeddings
        self.embeddings = torch.tensor(self.embeddings)  # convert to torch tensor
        end_time = time.time()
        print("Elaped time encoding =", end_time - start_time)
        

        # create index+class embeddings and a reverse lookup
        self.C = Counter()
        self.codes = torch.zeros(len(self.targets), self.code_size)
        self.inputs = []
        self.input2index = {}
        with torch.no_grad():
            for i in range(len(self.data)):
                label = int(self.targets[i])
                self.C.update(str(label))

                class_code = torch.zeros(self.code_size)
                class_code[int(self.targets[i])] = 3  # gray code base (3)
                self.codes[i] = grayN(3, self.code_size, self.C[str(label)]) + class_code
        # need to implement lookup table

    def __len__(self):
        return len(self.targets)

    def __getitem__(self, index):
        with torch.no_grad():
            text = self.data[index]
            embedding = self.embeddings[index]
            target = torch.tensor(self.targets[index])
            enc = self.codes[index]

        return {
            "gray_code": enc,
            "target": target,
            "embedding": embedding,
            "text": text
        }

In [8]:
train_data = CustomDataset(
    dataset=dataset,
    st_model=st_model,
    is_train=True
)

Encoding sentences ...
Elaped time encoding = 50.950690269470215


In [9]:
test_data = CustomDataset(
    dataset=dataset,
    st_model=st_model,
    is_train=False
)

Encoding sentences ...
Elaped time encoding = 49.68204593658447


In [10]:
train_mem_data = CustomMemDataset(
    dataset=dataset,
    st_model=st_model,
    num_classes=2,
    memorize_percentage=0.05
)

Encoding sentences ...
Elaped time encoding = 2.538942337036133


In [11]:
input_size = 384
output_size = 2
hidden_layers = [2048, 2048, 2048, 2048, 1024, 1024]
batch_size = 128
epochs = 100

In [12]:
class MemNetFC(nn.Module):
    def __init__(self, **kwargs):
        super().__init__()
        self.n_layers = len(kwargs['hidden_layers'])
        self.input_layer = nn.Linear(
            in_features=kwargs["input_size"],
            out_features=kwargs['hidden_layers'][0]
        )
        self.hidden_layers = nn.Sequential(*[nn.Linear(
            in_features=kwargs['hidden_layers'][i-1], 
            out_features=kwargs['hidden_layers'][i]
        ) for i in range(1, self.n_layers)])

        self.decoder_output_layer = nn.Linear(
            in_features=kwargs['hidden_layers'][-1],
            out_features=kwargs["output_size"]
        )

    def forward(self, x):
        activation = torch.relu(self.input_layer(x))
        for layer in self.hidden_layers:
            activation = torch.relu(layer(activation))
        predlabel = self.decoder_output_layer(activation)
        return predlabel

    def forward_transposed(self, code):
        activation = torch.relu(torch.matmul(code, self.decoder_output_layer.weight))
        for layer in self.hidden_layers[::-1]:
            activation = torch.relu(torch.matmul(activation, layer.weight))
        pred_embedding = torch.matmul(activation, self.input_layer.weight)
        return pred_embedding

In [13]:
model = MemNetFC(input_size=input_size, output_size=output_size, hidden_layers=hidden_layers).to(device)

In [14]:
model

MemNetFC(
  (input_layer): Linear(in_features=384, out_features=2048, bias=True)
  (hidden_layers): Sequential(
    (0): Linear(in_features=2048, out_features=2048, bias=True)
    (1): Linear(in_features=2048, out_features=2048, bias=True)
    (2): Linear(in_features=2048, out_features=2048, bias=True)
    (3): Linear(in_features=2048, out_features=1024, bias=True)
    (4): Linear(in_features=1024, out_features=1024, bias=True)
  )
  (decoder_output_layer): Linear(in_features=1024, out_features=2, bias=True)
)

In [15]:
optimizer_cls = optim.AdamW(model.parameters(), lr=1e-4)
optimizer_mem = optim.AdamW(model.parameters(), lr=1e-3)

loss_cls = nn.CrossEntropyLoss()  # binary classification
loss_mem = nn.MSELoss()  # MSE for memorization

In [16]:
train_dataloader = DataLoader(train_data, batch_size=batch_size, shuffle=False)
test_dataloader = DataLoader(test_data, batch_size=batch_size, shuffle=False)
train_dataloader_mem = DataLoader(train_mem_data, batch_size=batch_size, shuffle=False)

In [17]:
# train code
def train_model(model, train_loader_cls, train_loader_mem, val_loader_cls, optimizer_cls, optimizer_mem, loss_cls, loss_mem, epochs, save_path, device):
    best_loss_r = np.inf
    for epoch in range(epochs):
        model.train()
        loss_c = 0
        loss_r = 0
        c = 0
        mem_iterator = iter(train_loader_mem)  # iterator for mem dataset
        for batch in tqdm(train_loader_cls):
            try:
                mem_batch = next(mem_iterator)
                code = mem_batch["gray_code"]
                mem_embeddings = mem_batch["embedding"]
            except:
                mem_iterator = iter(train_loader_mem)
                mem_batch = next(mem_iterator)
                code = mem_batch["gray_code"]
                mem_embeddings = mem_batch["embedding"]

            # process forward inputs
            embeddings = batch["embedding"]
            labels = batch["target"]
            # input_ids = input_ids.to(torch.float32)
            labels = labels.to(torch.int64)
            embeddings = embeddings.to(device)
            labels = labels.to(device)

            # process backward inputs
            mem_embeddings = mem_embeddings.to(device)
            code = code.to(device)

            # forward train
            optimizer_cls.zero_grad()
            optimizer_mem.zero_grad()
            pred_labels = model(embeddings)
            loss_classf = loss_cls(pred_labels, labels)
            loss_classf.backward()
            optimizer_cls.step()

            # backward train
            optimizer_mem.zero_grad()
            optimizer_cls.zero_grad()
            pred_embeddings = model.forward_transposed(code)
            loss_recon = loss_mem(pred_embeddings, mem_embeddings)
            loss_recon.backward()
            optimizer_mem.step()

            loss_c += loss_classf.item()
            loss_r += loss_recon.item()
            c += 1
        print("epoch: {}/{}, loss_c = {:.6f}, loss_r = {:.6f}".format(epoch + 1, epochs, loss_c/c, loss_r/c))

In [18]:
# train
train_model(
    model=model,
    train_loader_cls=train_dataloader,
    train_loader_mem=train_dataloader_mem,
    val_loader_cls=None,
    optimizer_cls=optimizer_cls,
    optimizer_mem=optimizer_mem,
    loss_cls=loss_cls,
    loss_mem=loss_mem,
    epochs=epochs,
    save_path=None,
    device=device
)

100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.23it/s]


epoch: 1/100, loss_c = 0.378814, loss_r = 0.001979


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.13it/s]


epoch: 2/100, loss_c = 1.214069, loss_r = 0.001760


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.88it/s]


epoch: 3/100, loss_c = 0.891860, loss_r = 0.001755


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.75it/s]


epoch: 4/100, loss_c = 1.239808, loss_r = 0.001752


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.00it/s]


epoch: 5/100, loss_c = 0.822353, loss_r = 0.001750


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.02it/s]


epoch: 6/100, loss_c = 1.099111, loss_r = 0.001748


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.75it/s]


epoch: 7/100, loss_c = 0.802355, loss_r = 0.001745


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.90it/s]


epoch: 8/100, loss_c = 0.699175, loss_r = 0.001747


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.81it/s]


epoch: 9/100, loss_c = 0.855069, loss_r = 0.001746


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.88it/s]


epoch: 10/100, loss_c = 1.000597, loss_r = 0.001744


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.35it/s]


epoch: 11/100, loss_c = 0.704167, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.04it/s]


epoch: 12/100, loss_c = 0.611336, loss_r = 0.001746


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.96it/s]


epoch: 13/100, loss_c = 0.956599, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.71it/s]


epoch: 14/100, loss_c = 0.827543, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.85it/s]


epoch: 15/100, loss_c = 0.646011, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.14it/s]


epoch: 16/100, loss_c = 0.981525, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.89it/s]


epoch: 17/100, loss_c = 0.629677, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.38it/s]


epoch: 18/100, loss_c = 0.933216, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.99it/s]


epoch: 19/100, loss_c = 0.568595, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.90it/s]


epoch: 20/100, loss_c = 1.003166, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.36it/s]


epoch: 21/100, loss_c = 0.670566, loss_r = 0.001745


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.06it/s]


epoch: 22/100, loss_c = 0.778632, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.80it/s]


epoch: 23/100, loss_c = 0.806874, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.43it/s]


epoch: 24/100, loss_c = 0.671235, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.28it/s]


epoch: 25/100, loss_c = 0.810787, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.50it/s]


epoch: 26/100, loss_c = 0.811844, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.53it/s]


epoch: 27/100, loss_c = 0.807644, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.27it/s]


epoch: 28/100, loss_c = 0.748450, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.76it/s]


epoch: 29/100, loss_c = 0.799659, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.79it/s]


epoch: 30/100, loss_c = 0.579816, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.69it/s]


epoch: 31/100, loss_c = 0.605141, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.45it/s]


epoch: 32/100, loss_c = 0.719735, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.11it/s]


epoch: 33/100, loss_c = 0.602381, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.11it/s]


epoch: 34/100, loss_c = 0.567967, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.16it/s]


epoch: 35/100, loss_c = 0.553413, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.81it/s]


epoch: 36/100, loss_c = 0.515063, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.70it/s]


epoch: 37/100, loss_c = 0.508828, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.55it/s]


epoch: 38/100, loss_c = 0.470904, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.08it/s]


epoch: 39/100, loss_c = 0.451360, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.83it/s]


epoch: 40/100, loss_c = 0.484455, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.28it/s]


epoch: 41/100, loss_c = 0.590922, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.25it/s]


epoch: 42/100, loss_c = 0.635291, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.10it/s]


epoch: 43/100, loss_c = 0.523137, loss_r = 0.001748


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.88it/s]


epoch: 44/100, loss_c = 0.542691, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.31it/s]


epoch: 45/100, loss_c = 0.540248, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.02it/s]


epoch: 46/100, loss_c = 0.478449, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.58it/s]


epoch: 47/100, loss_c = 0.448131, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.69it/s]


epoch: 48/100, loss_c = 0.428576, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.44it/s]


epoch: 49/100, loss_c = 0.448639, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.05it/s]


epoch: 50/100, loss_c = 0.397366, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.79it/s]


epoch: 51/100, loss_c = 0.367073, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.58it/s]


epoch: 52/100, loss_c = 0.389813, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.79it/s]


epoch: 53/100, loss_c = 0.403936, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.95it/s]


epoch: 54/100, loss_c = 0.340140, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.36it/s]


epoch: 55/100, loss_c = 0.326587, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.24it/s]


epoch: 56/100, loss_c = 0.317043, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.95it/s]


epoch: 57/100, loss_c = 0.338684, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.18it/s]


epoch: 58/100, loss_c = 0.323111, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.96it/s]


epoch: 59/100, loss_c = 0.274583, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.83it/s]


epoch: 60/100, loss_c = 0.256826, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.18it/s]


epoch: 61/100, loss_c = 0.253409, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.92it/s]


epoch: 62/100, loss_c = 0.236078, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.42it/s]


epoch: 63/100, loss_c = 0.222562, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.79it/s]


epoch: 64/100, loss_c = 0.209627, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.30it/s]


epoch: 65/100, loss_c = 0.197636, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.02it/s]


epoch: 66/100, loss_c = 0.200300, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.05it/s]


epoch: 67/100, loss_c = 0.182066, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.32it/s]


epoch: 68/100, loss_c = 0.180639, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.78it/s]


epoch: 69/100, loss_c = 0.168813, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.94it/s]


epoch: 70/100, loss_c = 0.162547, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.93it/s]


epoch: 71/100, loss_c = 0.160313, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.71it/s]


epoch: 72/100, loss_c = 0.161384, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.75it/s]


epoch: 73/100, loss_c = 0.160112, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.22it/s]


epoch: 74/100, loss_c = 0.155290, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.68it/s]


epoch: 75/100, loss_c = 0.150288, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.28it/s]


epoch: 76/100, loss_c = 0.148195, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.60it/s]


epoch: 77/100, loss_c = 0.140261, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.08it/s]


epoch: 78/100, loss_c = 0.134487, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.95it/s]


epoch: 79/100, loss_c = 0.128978, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.32it/s]


epoch: 80/100, loss_c = 0.124459, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.27it/s]


epoch: 81/100, loss_c = 0.119680, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.20it/s]


epoch: 82/100, loss_c = 0.117694, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.45it/s]


epoch: 83/100, loss_c = 0.121096, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.60it/s]


epoch: 84/100, loss_c = 0.128340, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.65it/s]


epoch: 85/100, loss_c = 0.107915, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.10it/s]


epoch: 86/100, loss_c = 0.104942, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.66it/s]


epoch: 87/100, loss_c = 0.102857, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.46it/s]


epoch: 88/100, loss_c = 0.103933, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.19it/s]


epoch: 89/100, loss_c = 0.102494, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.47it/s]


epoch: 90/100, loss_c = 0.099667, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.88it/s]


epoch: 91/100, loss_c = 0.097264, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.54it/s]


epoch: 92/100, loss_c = 0.098365, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.76it/s]


epoch: 93/100, loss_c = 0.098568, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.36it/s]


epoch: 94/100, loss_c = 0.096417, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.77it/s]


epoch: 95/100, loss_c = 0.093597, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.47it/s]


epoch: 96/100, loss_c = 0.094327, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.74it/s]


epoch: 97/100, loss_c = 0.090354, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 51.24it/s]


epoch: 98/100, loss_c = 0.102979, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.91it/s]


epoch: 99/100, loss_c = 0.091448, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.52it/s]

epoch: 100/100, loss_c = 0.091634, loss_r = 0.001741





In [19]:
# get accuracy of test data
def test_acc(model, data_loader, device):
    correct=0
    model.eval()
    with torch.no_grad():
        for batch in data_loader:
            embeddings = batch["embedding"]
            labels = batch["target"]
            embeddings = embeddings.to(device)
            labels = labels.to(device)
            output = model(embeddings)
            ypred = output.data.max(1, keepdim=True)[1].squeeze()
            correct += ypred.eq(labels).sum()
    acc = correct/len(data_loader.dataset)
    return acc

In [20]:
test_acc(
    model=model,
    data_loader=test_dataloader,
    device=device
)

tensor(0.6084, device='cuda:0')

In [21]:
# test memorization accuracy
def test_mem_accuracy(mem_data:CustomMemDataset, device:torch.device):
    index = faiss.IndexFlatL2(384)  # create index
    index.add(mem_data.embeddings)
    print("Total Number of Index:", index.ntotal)

    correct = 0
    with torch.no_grad():
        idx = 0
        for data in mem_data:
            code = data["gray_code"]
            code = code.to(device)
            pred_embedding = model.forward_transposed(code)
            pred_embedding = pred_embedding.to("cpu")  # for faiss cpu
            D, I = index.search(pred_embedding.view(1, -1), 1)  # similarity search
            if idx == I[0][0]:
                correct += 1
            idx += 1  # next data

    print("Correct = {}/{}, Accuracy = {:.6f}".format(correct, len(mem_data), correct / len(mem_data)))

In [22]:
test_mem_accuracy(
    mem_data=train_mem_data,
    device=device
)

Total Number of Index: 1250
Correct = 1/1250, Accuracy = 0.000800
