# Transpose Attack using Simple Linear Layer Network

In [1]:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader, random_split, Subset
import torch.nn.functional as F
from collections import Counter
import datasets
from datasets import load_dataset
from sentence_transformers import SentenceTransformer
from tqdm import tqdm
import time
import faiss

In [2]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [3]:
# MODEL_ID = "sentence-transformers/facebook-dpr-ctx_encoder-single-nq-base"
MODEL_ID = "sentence-transformers/all-MiniLM-L6-v2"

In [4]:
# sentence transformer model
# transforms input sentences to sentence embeddings
st_model = SentenceTransformer(MODEL_ID).to(device)  # in GPU

In [5]:
# using StanfordNLP IMDB dataset
dataset = load_dataset("stanfordnlp/imdb")

In [6]:
def grayN(base, digits, value):
    '''
    A method for producing the grayN code for the spatial index
    @base: the base for the code
    @digits: Length of the code - should be equal to the output size of the model
    @value: the value to encode
    '''
    baseN = torch.zeros(digits)
    gray = torch.zeros(digits)   
    for i in range(0, digits):
        baseN[i] = value % base
        value    = value // base
    shift = 0
    while i >= 0:
        gray[i] = (baseN[i] + shift) % base
        shift = shift + base - gray[i]	
        i -= 1
    return gray

In [7]:
class CustomDataset(Dataset):
    def __init__(self, dataset:datasets.dataset_dict.DatasetDict, st_model:SentenceTransformer, is_train=True):
        if is_train:
            self.data = dataset['train']['text']
            self.targets = dataset['train']['label']
        else:
            self.data = dataset['test']['text']
            self.targets = dataset['test']['label']
        self.st_model = st_model  # sentence transformer model
        print("Encoding sentences ...")
        start_time = time.time()
        self.embeddings = self.st_model.encode(self.data)  # encode to sentence embeddings
        self.embeddings = torch.tensor(self.embeddings)  # convert to torch tensor
        end_time = time.time()
        print("Elaped time encoding =", end_time - start_time)

    def __len__(self):
        return len(self.targets)

    def __getitem__(self, index):
        with torch.no_grad():
            text = self.data[index]
            embedding = self.embeddings[index]
            target = torch.tensor(self.targets[index])

        return {
            "target": target,
            "embedding": embedding,
            "text": text
        }

In [8]:
class CustomMemDataset(Dataset):
    def __init__(self, dataset:datasets.dataset_dict.DatasetDict, st_model:SentenceTransformer, num_classes:int, memorize_percentage:float=0.1):
        if memorize_percentage < 0.0 or memorize_percentage > 1.0:
            raise ValueError("memorize_percentage must be between 0.0 and 1.0")
        self.data = dataset['train']['text']
        self.targets = dataset['train']['label']
        self.data = self.data[:int(len(self.data) * memorize_percentage)]  # leave only some portion of data
        self.targets = self.targets[:int(len(self.targets) * memorize_percentage)]  # leave only some portion of data
        self.indxs = torch.arange(len(self.data))
        self.code_size = num_classes # equal to the number of model outputs (0, 1)
        self.st_model = st_model
        print("Encoding sentences ...")
        start_time = time.time()
        self.embeddings = self.st_model.encode(self.data)  # encode to sentence embeddings
        self.embeddings = torch.tensor(self.embeddings)  # convert to torch tensor
        end_time = time.time()
        print("Elaped time encoding =", end_time - start_time)
        

        # create index+class embeddings and a reverse lookup
        self.C = Counter()
        self.codes = torch.zeros(len(self.targets), self.code_size)
        self.inputs = []
        self.input2index = {}
        with torch.no_grad():
            for i in range(len(self.data)):
                label = int(self.targets[i])
                self.C.update(str(label))

                class_code = torch.zeros(self.code_size)
                class_code[int(self.targets[i])] = 3  # gray code base (3)
                self.codes[i] = grayN(3, self.code_size, self.C[str(label)]) + class_code
        # need to implement lookup table

    def __len__(self):
        return len(self.targets)

    def __getitem__(self, index):
        with torch.no_grad():
            text = self.data[index]
            embedding = self.embeddings[index]
            target = torch.tensor(self.targets[index])
            enc = self.codes[index]

        return {
            "gray_code": enc,
            "target": target,
            "embedding": embedding,
            "text": text
        }

In [9]:
train_data = CustomDataset(
    dataset=dataset,
    st_model=st_model,
    is_train=True
)

Encoding sentences ...
Elaped time encoding = 50.2164363861084


In [10]:
test_data = CustomDataset(
    dataset=dataset,
    st_model=st_model,
    is_train=False
)

Encoding sentences ...
Elaped time encoding = 49.43476319313049


In [11]:
train_mem_data = CustomMemDataset(
    dataset=dataset,
    st_model=st_model,
    num_classes=2,
    memorize_percentage=0.05
)

Encoding sentences ...
Elaped time encoding = 2.5287067890167236


In [12]:
# input_size = 768
input_size = 384
output_size = 2
hidden_layers = [4096,4096]
batch_size = 128
epochs = 100

In [13]:
class MemNetFC(nn.Module):
    def __init__(self, **kwargs):
        super().__init__()
        self.n_layers = len(kwargs['hidden_layers'])
        self.input_layer = nn.Linear(
            in_features=kwargs["input_size"],
            out_features=kwargs['hidden_layers'][0]
        )
        self.hidden_layers = nn.Sequential(*[nn.Linear(
            in_features=kwargs['hidden_layers'][i-1], 
            out_features=kwargs['hidden_layers'][i]
        ) for i in range(1, self.n_layers)])

        self.decoder_output_layer = nn.Linear(
            in_features=kwargs['hidden_layers'][-1],
            out_features=kwargs["output_size"]
        )

    def forward(self, x):
        activation = torch.relu(self.input_layer(x))
        for layer in self.hidden_layers:
            activation = torch.relu(layer(activation))
        predlabel = self.decoder_output_layer(activation)
        return predlabel

    def forward_transposed(self, code):
        activation = torch.relu(torch.matmul(code, self.decoder_output_layer.weight))
        for layer in self.hidden_layers[::-1]:
            activation = torch.relu(torch.matmul(activation, layer.weight))
        pred_embedding = torch.matmul(activation, self.input_layer.weight)
        return pred_embedding

In [14]:
model = MemNetFC(input_size=input_size, output_size=output_size, hidden_layers=hidden_layers).to(device)

In [15]:
model

MemNetFC(
  (input_layer): Linear(in_features=384, out_features=4096, bias=True)
  (hidden_layers): Sequential(
    (0): Linear(in_features=4096, out_features=4096, bias=True)
  )
  (decoder_output_layer): Linear(in_features=4096, out_features=2, bias=True)
)

In [16]:
optimizer_cls = optim.AdamW(model.parameters(), lr=1e-4)
optimizer_mem = optim.AdamW(model.parameters(), lr=1e-3)

loss_cls = nn.CrossEntropyLoss()  # binary classification
loss_mem = nn.MSELoss()  # MSE for memorization

In [17]:
train_dataloader = DataLoader(train_data, batch_size=batch_size, shuffle=False)
test_dataloader = DataLoader(test_data, batch_size=batch_size, shuffle=False)
train_dataloader_mem = DataLoader(train_mem_data, batch_size=batch_size, shuffle=False)

In [18]:
# train code
def train_model(model, train_loader_cls, train_loader_mem, val_loader_cls, optimizer_cls, optimizer_mem, loss_cls, loss_mem, epochs, save_path, device):
    best_loss_r = np.inf
    for epoch in range(epochs):
        model.train()
        loss_c = 0
        loss_r = 0
        c = 0
        mem_iterator = iter(train_loader_mem)  # iterator for mem dataset
        for batch in tqdm(train_loader_cls):
            try:
                mem_batch = next(mem_iterator)
                code = mem_batch["gray_code"]
                mem_embeddings = mem_batch["embedding"]
            except:
                mem_iterator = iter(train_loader_mem)
                mem_batch = next(mem_iterator)
                code = mem_batch["gray_code"]
                mem_embeddings = mem_batch["embedding"]

            # process forward inputs
            embeddings = batch["embedding"]
            labels = batch["target"]
            # input_ids = input_ids.to(torch.float32)
            labels = labels.to(torch.int64)
            embeddings = embeddings.to(device)
            labels = labels.to(device)

            # process backward inputs
            mem_embeddings = mem_embeddings.to(device)
            code = code.to(device)

            # forward train
            optimizer_cls.zero_grad()
            optimizer_mem.zero_grad()
            pred_labels = model(embeddings)
            loss_classf = loss_cls(pred_labels, labels)
            loss_classf.backward()
            optimizer_cls.step()

            # backward train
            optimizer_mem.zero_grad()
            optimizer_cls.zero_grad()
            pred_embeddings = model.forward_transposed(code)
            loss_recon = loss_mem(pred_embeddings, mem_embeddings)
            loss_recon.backward()
            optimizer_mem.step()

            loss_c += loss_classf.item()
            loss_r += loss_recon.item()
            c += 1
        print("epoch: {}/{}, loss_c = {:.6f}, loss_r = {:.6f}".format(epoch + 1, epochs, loss_c/c, loss_r/c))

In [19]:
# train
train_model(
    model=model,
    train_loader_cls=train_dataloader,
    train_loader_mem=train_dataloader_mem,
    val_loader_cls=None,
    optimizer_cls=optimizer_cls,
    optimizer_mem=optimizer_mem,
    loss_cls=loss_cls,
    loss_mem=loss_mem,
    epochs=epochs,
    save_path=None,
    device=device
)

100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.54it/s]


epoch: 1/100, loss_c = 0.564850, loss_r = 0.001964


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.10it/s]


epoch: 2/100, loss_c = 0.714664, loss_r = 0.001760


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.14it/s]


epoch: 3/100, loss_c = 0.767789, loss_r = 0.001797


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.06it/s]


epoch: 4/100, loss_c = 0.835751, loss_r = 0.001758


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.81it/s]


epoch: 5/100, loss_c = 0.875774, loss_r = 0.001753


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.92it/s]


epoch: 6/100, loss_c = 0.711400, loss_r = 0.001748


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.99it/s]


epoch: 7/100, loss_c = 0.605604, loss_r = 0.001747


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.08it/s]


epoch: 8/100, loss_c = 0.602645, loss_r = 0.001746


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.04it/s]


epoch: 9/100, loss_c = 0.530501, loss_r = 0.001745


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.44it/s]


epoch: 10/100, loss_c = 0.537712, loss_r = 0.001744


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.37it/s]


epoch: 11/100, loss_c = 0.499738, loss_r = 0.001744


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.53it/s]


epoch: 12/100, loss_c = 0.478539, loss_r = 0.001744


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.28it/s]


epoch: 13/100, loss_c = 0.471415, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.94it/s]


epoch: 14/100, loss_c = 0.484866, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.44it/s]


epoch: 15/100, loss_c = 0.474766, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.57it/s]


epoch: 16/100, loss_c = 0.450967, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.75it/s]


epoch: 17/100, loss_c = 0.443546, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.76it/s]


epoch: 18/100, loss_c = 0.447040, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.86it/s]


epoch: 19/100, loss_c = 0.428128, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.88it/s]


epoch: 20/100, loss_c = 0.418219, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.78it/s]


epoch: 21/100, loss_c = 0.412435, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.84it/s]


epoch: 22/100, loss_c = 0.400791, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.57it/s]


epoch: 23/100, loss_c = 0.390049, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.76it/s]


epoch: 24/100, loss_c = 0.380192, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.91it/s]


epoch: 25/100, loss_c = 0.371494, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.83it/s]


epoch: 26/100, loss_c = 0.364772, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.61it/s]


epoch: 27/100, loss_c = 0.351607, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.65it/s]


epoch: 28/100, loss_c = 0.342185, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.98it/s]


epoch: 29/100, loss_c = 0.327493, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.45it/s]


epoch: 30/100, loss_c = 0.322386, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.74it/s]


epoch: 31/100, loss_c = 0.302051, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.72it/s]


epoch: 32/100, loss_c = 0.299620, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.67it/s]


epoch: 33/100, loss_c = 0.276329, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.81it/s]


epoch: 34/100, loss_c = 0.265487, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.44it/s]


epoch: 35/100, loss_c = 0.250381, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.02it/s]


epoch: 36/100, loss_c = 0.234674, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.76it/s]


epoch: 37/100, loss_c = 0.219073, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.59it/s]


epoch: 38/100, loss_c = 0.202621, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.70it/s]


epoch: 39/100, loss_c = 0.201104, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.73it/s]


epoch: 40/100, loss_c = 0.186107, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.56it/s]


epoch: 41/100, loss_c = 0.166870, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.41it/s]


epoch: 42/100, loss_c = 0.161127, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.61it/s]


epoch: 43/100, loss_c = 0.151403, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.80it/s]


epoch: 44/100, loss_c = 0.132459, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.63it/s]


epoch: 45/100, loss_c = 0.125214, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.42it/s]


epoch: 46/100, loss_c = 0.111144, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.62it/s]


epoch: 47/100, loss_c = 0.096671, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.65it/s]


epoch: 48/100, loss_c = 0.086020, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.40it/s]


epoch: 49/100, loss_c = 0.079237, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.43it/s]


epoch: 50/100, loss_c = 0.067349, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.77it/s]


epoch: 51/100, loss_c = 0.062072, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.68it/s]


epoch: 52/100, loss_c = 0.054949, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.56it/s]


epoch: 53/100, loss_c = 0.048171, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.50it/s]


epoch: 54/100, loss_c = 0.041843, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.00it/s]


epoch: 55/100, loss_c = 0.033622, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.35it/s]


epoch: 56/100, loss_c = 0.028208, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.14it/s]


epoch: 57/100, loss_c = 0.022844, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.17it/s]


epoch: 58/100, loss_c = 0.018693, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.71it/s]


epoch: 59/100, loss_c = 0.015038, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.57it/s]


epoch: 60/100, loss_c = 0.012124, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.61it/s]


epoch: 61/100, loss_c = 0.010279, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.63it/s]


epoch: 62/100, loss_c = 0.008419, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.53it/s]


epoch: 63/100, loss_c = 0.007137, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.54it/s]


epoch: 64/100, loss_c = 0.005425, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.84it/s]


epoch: 65/100, loss_c = 0.004375, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.53it/s]


epoch: 66/100, loss_c = 0.003483, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.45it/s]


epoch: 67/100, loss_c = 0.002824, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.55it/s]


epoch: 68/100, loss_c = 0.002255, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 50.02it/s]


epoch: 69/100, loss_c = 0.001853, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.52it/s]


epoch: 70/100, loss_c = 0.001546, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.23it/s]


epoch: 71/100, loss_c = 0.001265, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.69it/s]


epoch: 72/100, loss_c = 0.001069, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.65it/s]


epoch: 73/100, loss_c = 0.000888, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.41it/s]


epoch: 74/100, loss_c = 0.000759, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.30it/s]


epoch: 75/100, loss_c = 0.001831, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.76it/s]


epoch: 76/100, loss_c = 0.005146, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.67it/s]


epoch: 77/100, loss_c = 0.023229, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.38it/s]


epoch: 78/100, loss_c = 0.032556, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.67it/s]


epoch: 79/100, loss_c = 0.013739, loss_r = 0.001741


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.96it/s]


epoch: 80/100, loss_c = 0.007416, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.47it/s]


epoch: 81/100, loss_c = 0.005634, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.59it/s]


epoch: 82/100, loss_c = 0.006156, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.52it/s]


epoch: 83/100, loss_c = 0.005174, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.94it/s]


epoch: 84/100, loss_c = 0.004034, loss_r = 0.001740


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.35it/s]


epoch: 85/100, loss_c = 2.000808, loss_r = 0.001754


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.58it/s]


epoch: 86/100, loss_c = 3.074737, loss_r = 0.001746


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.87it/s]


epoch: 87/100, loss_c = 0.269197, loss_r = 0.001744


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.39it/s]


epoch: 88/100, loss_c = 0.162589, loss_r = 0.001744


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.44it/s]


epoch: 89/100, loss_c = 0.119617, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.81it/s]


epoch: 90/100, loss_c = 0.088368, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.88it/s]


epoch: 91/100, loss_c = 0.062463, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.31it/s]


epoch: 92/100, loss_c = 0.043299, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.46it/s]


epoch: 93/100, loss_c = 0.030291, loss_r = 0.001743


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.86it/s]


epoch: 94/100, loss_c = 0.021086, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.53it/s]


epoch: 95/100, loss_c = 0.014889, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.42it/s]


epoch: 96/100, loss_c = 0.010966, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.51it/s]


epoch: 97/100, loss_c = 0.008688, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.84it/s]


epoch: 98/100, loss_c = 0.007149, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.51it/s]


epoch: 99/100, loss_c = 0.005991, loss_r = 0.001742


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.39it/s]

epoch: 100/100, loss_c = 0.005111, loss_r = 0.001742





In [20]:
# get accuracy of test data
def test_acc(model, data_loader, device):
    correct=0
    model.eval()
    with torch.no_grad():
        for batch in data_loader:
            embeddings = batch["embedding"]
            labels = batch["target"]
            embeddings = embeddings.to(device)
            labels = labels.to(device)
            output = model(embeddings)
            ypred = output.data.max(1, keepdim=True)[1].squeeze()
            correct += ypred.eq(labels).sum()
    acc = correct/len(data_loader.dataset)
    return acc

In [21]:
test_acc(
    model=model,
    data_loader=test_dataloader,
    device=device
)

tensor(0.7334, device='cuda:0')

In [22]:
# test memorization accuracy
def test_mem_accuracy(mem_data:CustomMemDataset, device:torch.device, input_size:int):
    index = faiss.IndexFlatL2(input_size)  # create index
    index.add(mem_data.embeddings)
    print("Total Number of Index:", index.ntotal)

    correct = 0
    with torch.no_grad():
        idx = 0
        for data in mem_data:
            code = data["gray_code"]
            code = code.to(device)
            pred_embedding = model.forward_transposed(code)
            pred_embedding = pred_embedding.to("cpu")  # for faiss cpu
            D, I = index.search(pred_embedding.view(1, -1), 1)  # similarity search
            if idx == I[0][0]:
                correct += 1
            idx += 1  # next data

    print("Correct = {}/{}, Accuracy = {:.6f}".format(correct, len(mem_data), correct / len(mem_data)))

In [23]:
test_mem_accuracy(
    mem_data=train_mem_data,
    device=device,
    input_size=input_size
)

Total Number of Index: 1250
Correct = 1/1250, Accuracy = 0.000800
