# Transpose Attack using Simple Linear Layer Network

In [1]:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader, random_split, Subset
import torch.nn.functional as F
from collections import Counter
import datasets
from datasets import load_dataset
from sentence_transformers import SentenceTransformer
from tqdm import tqdm
import time
import faiss

In [2]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [3]:
MODEL_ID = "sentence-transformers/facebook-dpr-ctx_encoder-single-nq-base"

In [4]:
# sentence transformer model
# transforms input sentences to sentence embeddings
st_model = SentenceTransformer(MODEL_ID).to(device)  # in GPU

modules.json:   0%|          | 0.00/229 [00:00<?, ?B/s]

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to see activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development


config_sentence_transformers.json:   0%|          | 0.00/122 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/2.91k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/669 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/438M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/450 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

1_Pooling/config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

In [5]:
# using StanfordNLP IMDB dataset
dataset = load_dataset("stanfordnlp/imdb")

In [6]:
def grayN(base, digits, value):
    '''
    A method for producing the grayN code for the spatial index
    @base: the base for the code
    @digits: Length of the code - should be equal to the output size of the model
    @value: the value to encode
    '''
    baseN = torch.zeros(digits)
    gray = torch.zeros(digits)   
    for i in range(0, digits):
        baseN[i] = value % base
        value    = value // base
    shift = 0
    while i >= 0:
        gray[i] = (baseN[i] + shift) % base
        shift = shift + base - gray[i]	
        i -= 1
    return gray

In [7]:
class CustomDataset(Dataset):
    def __init__(self, dataset:datasets.dataset_dict.DatasetDict, st_model:SentenceTransformer, is_train=True):
        if is_train:
            self.data = dataset['train']['text']
            self.targets = dataset['train']['label']
        else:
            self.data = dataset['test']['text']
            self.targets = dataset['test']['label']
        self.st_model = st_model  # sentence transformer model
        print("Encoding sentences ...")
        start_time = time.time()
        self.embeddings = self.st_model.encode(self.data)  # encode to sentence embeddings
        self.embeddings = torch.tensor(self.embeddings)  # convert to torch tensor
        end_time = time.time()
        print("Elaped time encoding =", end_time - start_time)

    def __len__(self):
        return len(self.targets)

    def __getitem__(self, index):
        with torch.no_grad():
            text = self.data[index]
            embedding = self.embeddings[index]
            target = torch.tensor(self.targets[index])

        return {
            "target": target,
            "embedding": embedding,
            "text": text
        }

In [8]:
class CustomMemDataset(Dataset):
    def __init__(self, dataset:datasets.dataset_dict.DatasetDict, st_model:SentenceTransformer, num_classes:int, memorize_percentage:float=0.1):
        if memorize_percentage < 0.0 or memorize_percentage > 1.0:
            raise ValueError("memorize_percentage must be between 0.0 and 1.0")
        self.data = dataset['train']['text']
        self.targets = dataset['train']['label']
        self.data = self.data[:int(len(self.data) * memorize_percentage)]  # leave only some portion of data
        self.targets = self.targets[:int(len(self.targets) * memorize_percentage)]  # leave only some portion of data
        self.indxs = torch.arange(len(self.data))
        self.code_size = num_classes # equal to the number of model outputs (0, 1)
        self.st_model = st_model
        print("Encoding sentences ...")
        start_time = time.time()
        self.embeddings = self.st_model.encode(self.data)  # encode to sentence embeddings
        self.embeddings = torch.tensor(self.embeddings)  # convert to torch tensor
        end_time = time.time()
        print("Elaped time encoding =", end_time - start_time)
        

        # create index+class embeddings and a reverse lookup
        self.C = Counter()
        self.codes = torch.zeros(len(self.targets), self.code_size)
        self.inputs = []
        self.input2index = {}
        with torch.no_grad():
            for i in range(len(self.data)):
                label = int(self.targets[i])
                self.C.update(str(label))

                class_code = torch.zeros(self.code_size)
                class_code[int(self.targets[i])] = 3  # gray code base (3)
                self.codes[i] = grayN(3, self.code_size, self.C[str(label)]) + class_code
        # need to implement lookup table

    def __len__(self):
        return len(self.targets)

    def __getitem__(self, index):
        with torch.no_grad():
            text = self.data[index]
            embedding = self.embeddings[index]
            target = torch.tensor(self.targets[index])
            enc = self.codes[index]

        return {
            "gray_code": enc,
            "target": target,
            "embedding": embedding,
            "text": text
        }

In [9]:
train_data = CustomDataset(
    dataset=dataset,
    st_model=st_model,
    is_train=True
)

Encoding sentences ...
Elaped time encoding = 352.8251805305481


In [10]:
test_data = CustomDataset(
    dataset=dataset,
    st_model=st_model,
    is_train=False
)

Encoding sentences ...
Elaped time encoding = 358.81697177886963


In [11]:
train_mem_data = CustomMemDataset(
    dataset=dataset,
    st_model=st_model,
    num_classes=2,
    memorize_percentage=0.05
)

Encoding sentences ...
Elaped time encoding = 18.0316960811615


In [12]:
input_size = 768
output_size = 2
hidden_layers = [4096,4096]
batch_size = 128
epochs = 100

In [13]:
class MemNetFC(nn.Module):
    def __init__(self, **kwargs):
        super().__init__()
        self.n_layers = len(kwargs['hidden_layers'])
        self.input_layer = nn.Linear(
            in_features=kwargs["input_size"],
            out_features=kwargs['hidden_layers'][0]
        )
        self.hidden_layers = nn.Sequential(*[nn.Linear(
            in_features=kwargs['hidden_layers'][i-1], 
            out_features=kwargs['hidden_layers'][i]
        ) for i in range(1, self.n_layers)])

        self.decoder_output_layer = nn.Linear(
            in_features=kwargs['hidden_layers'][-1],
            out_features=kwargs["output_size"]
        )

    def forward(self, x):
        activation = torch.relu(self.input_layer(x))
        for layer in self.hidden_layers:
            activation = torch.relu(layer(activation))
        predlabel = self.decoder_output_layer(activation)
        return predlabel

    def forward_transposed(self, code):
        activation = torch.relu(torch.matmul(code, self.decoder_output_layer.weight))
        for layer in self.hidden_layers[::-1]:
            activation = torch.relu(torch.matmul(activation, layer.weight))
        pred_embedding = torch.matmul(activation, self.input_layer.weight)
        return pred_embedding

In [14]:
model = MemNetFC(input_size=input_size, output_size=output_size, hidden_layers=hidden_layers).to(device)

In [15]:
model

MemNetFC(
  (input_layer): Linear(in_features=768, out_features=2048, bias=True)
  (hidden_layers): Sequential(
    (0): Linear(in_features=2048, out_features=2048, bias=True)
    (1): Linear(in_features=2048, out_features=2048, bias=True)
    (2): Linear(in_features=2048, out_features=2048, bias=True)
    (3): Linear(in_features=2048, out_features=1024, bias=True)
    (4): Linear(in_features=1024, out_features=1024, bias=True)
  )
  (decoder_output_layer): Linear(in_features=1024, out_features=2, bias=True)
)

In [16]:
optimizer_cls = optim.AdamW(model.parameters(), lr=1e-4)
optimizer_mem = optim.AdamW(model.parameters(), lr=1e-3)

loss_cls = nn.CrossEntropyLoss()  # binary classification
loss_mem = nn.MSELoss()  # MSE for memorization

In [17]:
train_dataloader = DataLoader(train_data, batch_size=batch_size, shuffle=False)
test_dataloader = DataLoader(test_data, batch_size=batch_size, shuffle=False)
train_dataloader_mem = DataLoader(train_mem_data, batch_size=batch_size, shuffle=False)

In [18]:
# train code
def train_model(model, train_loader_cls, train_loader_mem, val_loader_cls, optimizer_cls, optimizer_mem, loss_cls, loss_mem, epochs, save_path, device):
    best_loss_r = np.inf
    for epoch in range(epochs):
        model.train()
        loss_c = 0
        loss_r = 0
        c = 0
        mem_iterator = iter(train_loader_mem)  # iterator for mem dataset
        for batch in tqdm(train_loader_cls):
            try:
                mem_batch = next(mem_iterator)
                code = mem_batch["gray_code"]
                mem_embeddings = mem_batch["embedding"]
            except:
                mem_iterator = iter(train_loader_mem)
                mem_batch = next(mem_iterator)
                code = mem_batch["gray_code"]
                mem_embeddings = mem_batch["embedding"]

            # process forward inputs
            embeddings = batch["embedding"]
            labels = batch["target"]
            # input_ids = input_ids.to(torch.float32)
            labels = labels.to(torch.int64)
            embeddings = embeddings.to(device)
            labels = labels.to(device)

            # process backward inputs
            mem_embeddings = mem_embeddings.to(device)
            code = code.to(device)

            # forward train
            optimizer_cls.zero_grad()
            optimizer_mem.zero_grad()
            pred_labels = model(embeddings)
            loss_classf = loss_cls(pred_labels, labels)
            loss_classf.backward()
            optimizer_cls.step()

            # backward train
            optimizer_mem.zero_grad()
            optimizer_cls.zero_grad()
            pred_embeddings = model.forward_transposed(code)
            loss_recon = loss_mem(pred_embeddings, mem_embeddings)
            loss_recon.backward()
            optimizer_mem.step()

            loss_c += loss_classf.item()
            loss_r += loss_recon.item()
            c += 1
        print("epoch: {}/{}, loss_c = {:.6f}, loss_r = {:.6f}".format(epoch + 1, epochs, loss_c/c, loss_r/c))

In [19]:
# train
train_model(
    model=model,
    train_loader_cls=train_dataloader,
    train_loader_mem=train_dataloader_mem,
    val_loader_cls=None,
    optimizer_cls=optimizer_cls,
    optimizer_mem=optimizer_mem,
    loss_cls=loss_cls,
    loss_mem=loss_mem,
    epochs=epochs,
    save_path=None,
    device=device
)

100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.67it/s]


epoch: 1/100, loss_c = 0.117256, loss_r = 0.074492


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.02it/s]


epoch: 2/100, loss_c = 0.767523, loss_r = 0.068027


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.34it/s]


epoch: 3/100, loss_c = 1.166138, loss_r = 0.065225


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.74it/s]


epoch: 4/100, loss_c = 1.186898, loss_r = 0.064975


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.69it/s]


epoch: 5/100, loss_c = 1.157723, loss_r = 0.064803


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.09it/s]


epoch: 6/100, loss_c = 0.832515, loss_r = 0.064772


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.21it/s]


epoch: 7/100, loss_c = 0.874844, loss_r = 0.064596


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.71it/s]


epoch: 8/100, loss_c = 0.870301, loss_r = 0.064605


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.82it/s]


epoch: 9/100, loss_c = 0.715525, loss_r = 0.064594


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.11it/s]


epoch: 10/100, loss_c = 0.880424, loss_r = 0.064516


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.90it/s]


epoch: 11/100, loss_c = 0.776671, loss_r = 0.064503


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.54it/s]


epoch: 12/100, loss_c = 0.848507, loss_r = 0.064518


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.90it/s]


epoch: 13/100, loss_c = 0.862643, loss_r = 0.064482


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.06it/s]


epoch: 14/100, loss_c = 0.769694, loss_r = 0.064490


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.82it/s]


epoch: 15/100, loss_c = 0.780508, loss_r = 0.064469


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.56it/s]


epoch: 16/100, loss_c = 0.664477, loss_r = 0.064567


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.27it/s]


epoch: 17/100, loss_c = 0.939005, loss_r = 0.064467


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.92it/s]


epoch: 18/100, loss_c = 0.705923, loss_r = 0.064456


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.73it/s]


epoch: 19/100, loss_c = 0.791205, loss_r = 0.064428


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.88it/s]


epoch: 20/100, loss_c = 0.773591, loss_r = 0.064481


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.54it/s]


epoch: 21/100, loss_c = 0.841721, loss_r = 0.064422


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.29it/s]


epoch: 22/100, loss_c = 0.867395, loss_r = 0.064419


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.95it/s]


epoch: 23/100, loss_c = 0.720439, loss_r = 0.064416


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.02it/s]


epoch: 24/100, loss_c = 0.776131, loss_r = 0.065355


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.76it/s]


epoch: 25/100, loss_c = 0.775636, loss_r = 0.064563


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.05it/s]


epoch: 26/100, loss_c = 0.848997, loss_r = 0.064968


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.78it/s]


epoch: 27/100, loss_c = 0.895912, loss_r = 0.064587


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.87it/s]


epoch: 28/100, loss_c = 0.752697, loss_r = 0.064559


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.47it/s]


epoch: 29/100, loss_c = 0.857938, loss_r = 0.064553


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.08it/s]


epoch: 30/100, loss_c = 0.849820, loss_r = 0.064562


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.74it/s]


epoch: 31/100, loss_c = 0.848115, loss_r = 0.064567


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.66it/s]


epoch: 32/100, loss_c = 0.789578, loss_r = 0.064523


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.53it/s]


epoch: 33/100, loss_c = 0.588409, loss_r = 0.064497


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.16it/s]


epoch: 34/100, loss_c = 0.898334, loss_r = 0.064489


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.96it/s]


epoch: 35/100, loss_c = 0.603459, loss_r = 0.064534


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.46it/s]


epoch: 36/100, loss_c = 0.959811, loss_r = 0.064466


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.46it/s]


epoch: 37/100, loss_c = 0.663150, loss_r = 0.064510


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.13it/s]


epoch: 38/100, loss_c = 1.040609, loss_r = 0.064461


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.20it/s]


epoch: 39/100, loss_c = 0.711028, loss_r = 0.064447


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.31it/s]


epoch: 40/100, loss_c = 0.800514, loss_r = 0.064465


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.23it/s]


epoch: 41/100, loss_c = 0.933054, loss_r = 0.064439


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.68it/s]


epoch: 42/100, loss_c = 0.513129, loss_r = 0.064480


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.53it/s]


epoch: 43/100, loss_c = 0.994315, loss_r = 0.064424


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.06it/s]


epoch: 44/100, loss_c = 0.457417, loss_r = 0.064455


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.95it/s]


epoch: 45/100, loss_c = 0.905532, loss_r = 0.064406


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.58it/s]


epoch: 46/100, loss_c = 0.791549, loss_r = 0.064421


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.82it/s]


epoch: 47/100, loss_c = 0.787534, loss_r = 0.064381


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.14it/s]


epoch: 48/100, loss_c = 0.783947, loss_r = 0.064432


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.24it/s]


epoch: 49/100, loss_c = 0.769397, loss_r = 0.064343


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.82it/s]


epoch: 50/100, loss_c = 0.720644, loss_r = 0.064332


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.06it/s]


epoch: 51/100, loss_c = 0.748726, loss_r = 0.064328


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.53it/s]


epoch: 52/100, loss_c = 0.854751, loss_r = 0.064323


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.31it/s]


epoch: 53/100, loss_c = 0.661186, loss_r = 0.064317


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.86it/s]


epoch: 54/100, loss_c = 0.625623, loss_r = 0.064323


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.39it/s]


epoch: 55/100, loss_c = 0.738247, loss_r = 0.064364


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.60it/s]


epoch: 56/100, loss_c = 0.574887, loss_r = 0.064384


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.38it/s]


epoch: 57/100, loss_c = 0.911909, loss_r = 0.064362


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.27it/s]


epoch: 58/100, loss_c = 0.559118, loss_r = 0.064354


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.41it/s]


epoch: 59/100, loss_c = 0.721135, loss_r = 0.064355


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.22it/s]


epoch: 60/100, loss_c = 0.743420, loss_r = 0.064323


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.58it/s]


epoch: 61/100, loss_c = 0.657146, loss_r = 0.064327


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.10it/s]


epoch: 62/100, loss_c = 0.756871, loss_r = 0.064866


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.46it/s]


epoch: 63/100, loss_c = 0.681644, loss_r = 0.064423


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.41it/s]


epoch: 64/100, loss_c = 0.777083, loss_r = 0.064335


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.77it/s]


epoch: 65/100, loss_c = 0.549681, loss_r = 0.064329


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.35it/s]


epoch: 66/100, loss_c = 0.573408, loss_r = 0.064326


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.85it/s]


epoch: 67/100, loss_c = 0.635420, loss_r = 0.064331


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.31it/s]


epoch: 68/100, loss_c = 0.715774, loss_r = 0.064328


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.84it/s]


epoch: 69/100, loss_c = 0.640929, loss_r = 0.064324


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.72it/s]


epoch: 70/100, loss_c = 0.640585, loss_r = 0.064314


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 49.00it/s]


epoch: 71/100, loss_c = 0.639594, loss_r = 0.064313


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.67it/s]


epoch: 72/100, loss_c = 0.679256, loss_r = 0.064312


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.41it/s]


epoch: 73/100, loss_c = 0.668798, loss_r = 0.064312


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.83it/s]


epoch: 74/100, loss_c = 0.664235, loss_r = 0.064375


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.99it/s]


epoch: 75/100, loss_c = 0.977009, loss_r = 0.064327


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.30it/s]


epoch: 76/100, loss_c = 0.573959, loss_r = 0.064363


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.32it/s]


epoch: 77/100, loss_c = 0.622500, loss_r = 0.064379


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.59it/s]


epoch: 78/100, loss_c = 0.647781, loss_r = 0.064365


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.52it/s]


epoch: 79/100, loss_c = 0.615483, loss_r = 0.064329


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.12it/s]


epoch: 80/100, loss_c = 0.689317, loss_r = 0.064329


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.79it/s]


epoch: 81/100, loss_c = 0.639330, loss_r = 0.064289


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.41it/s]


epoch: 82/100, loss_c = 0.716780, loss_r = 0.064304


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.28it/s]


epoch: 83/100, loss_c = 0.643591, loss_r = 0.064295


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.27it/s]


epoch: 84/100, loss_c = 0.479450, loss_r = 0.064274


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.90it/s]


epoch: 85/100, loss_c = 0.615906, loss_r = 0.064275


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.99it/s]


epoch: 86/100, loss_c = 0.528823, loss_r = 0.064260


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.80it/s]


epoch: 87/100, loss_c = 0.571709, loss_r = 0.064256


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.40it/s]


epoch: 88/100, loss_c = 0.751184, loss_r = 0.064262


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.06it/s]


epoch: 89/100, loss_c = 0.700656, loss_r = 0.064367


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.30it/s]


epoch: 90/100, loss_c = 0.731686, loss_r = 0.064345


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.60it/s]


epoch: 91/100, loss_c = 0.695358, loss_r = 0.064275


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.44it/s]


epoch: 92/100, loss_c = 0.623381, loss_r = 0.064341


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:03<00:00, 49.04it/s]


epoch: 93/100, loss_c = 0.776484, loss_r = 0.064280


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.21it/s]


epoch: 94/100, loss_c = 0.696624, loss_r = 0.064261


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.61it/s]


epoch: 95/100, loss_c = 0.676010, loss_r = 0.064248


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.65it/s]


epoch: 96/100, loss_c = 0.523724, loss_r = 0.064243


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.16it/s]


epoch: 97/100, loss_c = 0.453188, loss_r = 0.064237


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 48.17it/s]


epoch: 98/100, loss_c = 0.495167, loss_r = 0.064235


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.49it/s]


epoch: 99/100, loss_c = 0.453854, loss_r = 0.064236


100%|████████████████████████████████████████████████████████████████████████████████| 196/196 [00:04<00:00, 47.77it/s]

epoch: 100/100, loss_c = 0.499873, loss_r = 0.064228





In [20]:
# get accuracy of test data
def test_acc(model, data_loader, device):
    correct=0
    model.eval()
    with torch.no_grad():
        for batch in data_loader:
            embeddings = batch["embedding"]
            labels = batch["target"]
            embeddings = embeddings.to(device)
            labels = labels.to(device)
            output = model(embeddings)
            ypred = output.data.max(1, keepdim=True)[1].squeeze()
            correct += ypred.eq(labels).sum()
    acc = correct/len(data_loader.dataset)
    return acc

In [21]:
test_acc(
    model=model,
    data_loader=test_dataloader,
    device=device
)

tensor(0.5000, device='cuda:0')

In [22]:
# test memorization accuracy
def test_mem_accuracy(mem_data:CustomMemDataset, device:torch.device):
    index = faiss.IndexFlatL2(768)  # create index
    index.add(mem_data.embeddings)
    print("Total Number of Index:", index.ntotal)

    correct = 0
    with torch.no_grad():
        idx = 0
        for data in mem_data:
            code = data["gray_code"]
            code = code.to(device)
            pred_embedding = model.forward_transposed(code)
            pred_embedding = pred_embedding.to("cpu")  # for faiss cpu
            D, I = index.search(pred_embedding.view(1, -1), 1)  # similarity search
            if idx == I[0][0]:
                correct += 1
            idx += 1  # next data

    print("Correct = {}/{}, Accuracy = {:.6f}".format(correct, len(mem_data), correct / len(mem_data)))

In [23]:
test_mem_accuracy(
    mem_data=train_mem_data,
    device=device
)

Total Number of Index: 1250
Correct = 1/1250, Accuracy = 0.000800
