In [1]:
import os
import numpy as np
import pandas as pd
import pickle
import matplotlib.pyplot as plt
import json
from utils.experiment import Experiment

In [2]:
dataset = 'point_mnist'
slice_setting = 'over'

In [3]:
if dataset == 'point_mnist':
    df_train = pd.read_csv('../dataset/pointcloud_mnist_2d/train.csv')

    X = df_train[df_train.columns[1:]].to_numpy()
    y = df_train[df_train.columns[0]].to_numpy()

    X = X.reshape(X.shape[0], -1, 3)
    
    num_points = np.sum((X[:, :, 2] > 0).astype(int), axis=1)
    
    set_size_median = np.median(num_points).astype(int)
    n_slices = 8 if slice_setting == 'over' else 2

elif dataset == 'modelnet40':
    set_size_median = 512
    n_slices = 16 if slice_setting == 'over' else 3
    
elif dataset == 'oxford':
    with open('../dataset/oxford/train_test_AE8.pkl', 'rb') as f:
        data = pickle.load(f)

    X_train, y_train, X_test, y_test, classnames = data

    num_points = np.array([i.shape[0] for i in X_train])

    set_size_median = np.median(num_points).astype(int)
    n_slices = 128 if slice_setting == 'over' else 8

print(dataset, set_size_median, n_slices)

point_mnist 150 8


In [4]:
code_length = 1024
ref = 'rand'
seeds = [0, 1, 4, 10, 16]
ks = [4, 8, 16]
reports = []

### FS

In [5]:
for seed in seeds:
    for k in ks:
        exp = Experiment(dataset, 'fs', 'faiss-lsh', 
                         random_state=seed, ref_func=ref, k=k, ref_size=set_size_median, code_length=code_length)
        exp.test()
        report = exp.get_exp_report()
        print(report)
        reports.append(report)

loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3645.01it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0002970361948013306, 'inf_time_per_sample': 0.00038264269828796384, 'acc': 0.8021, 'precision_k': 0.7509}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4023.79it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.00026838419437408447, 'inf_time_per_sample': 0.00045978360176086424, 'acc': 0.8107, 'precision_k': 0.739475}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4064.36it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0002653214931488037, 'inf_time_per_sample': 0.0003796648979187012, 'acc': 0.8118, 'precision_k': 0.7254375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3854.85it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0002789320945739746, 'inf_time_per_sample': 0.0004295259714126587, 'acc': 0.8003, 'precision_k': 0.7535}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3534.09it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.0003022948980331421, 'inf_time_per_sample': 0.0003903196096420288, 'acc': 0.8129, 'precision_k': 0.7433375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3507.25it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.00031693649291992187, 'inf_time_per_sample': 0.0004334427118301392, 'acc': 0.8151, 'precision_k': 0.7307125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3691.73it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.00029342708587646487, 'inf_time_per_sample': 0.00047824881076812746, 'acc': 0.7951, 'precision_k': 0.7471}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3438.24it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.00031150829792022706, 'inf_time_per_sample': 0.0004939509868621826, 'acc': 0.8078, 'precision_k': 0.7328875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 3796.72it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.00028458540439605713, 'inf_time_per_sample': 0.00038386948108673095, 'acc': 0.8069, 'precision_k': 0.71895625}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:03<00:00, 3010.23it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.00035347328186035156, 'inf_time_per_sample': 0.0003956390142440796, 'acc': 0.8002, 'precision_k': 0.753825}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:03<00:00, 3137.03it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.0003382011890411377, 'inf_time_per_sample': 0.00038137691020965575, 'acc': 0.8119, 'precision_k': 0.74415}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:03<00:00, 2818.91it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.00037712209224700926, 'inf_time_per_sample': 0.0003930300235748291, 'acc': 0.8087, 'precision_k': 0.72950625}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4249.21it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0002567981004714966, 'inf_time_per_sample': 0.0003881385326385498, 'acc': 0.794, 'precision_k': 0.74525}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4156.35it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.0002594175338745117, 'inf_time_per_sample': 0.0003754882097244263, 'acc': 0.8041, 'precision_k': 0.7334}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4133.78it/s]


{'dataset': 'point_mnist', 'pooling': 'fs', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.00027086079120635986, 'inf_time_per_sample': 0.0003759662866592407, 'acc': 0.806, 'precision_k': 0.7188}


### SWE

In [6]:
for seed in seeds:
    for k in ks:
        exp = Experiment(dataset, 'swe', 'faiss-lsh', random_state=seed, ref_func=ref, k=k, ref_size=set_size_median, code_length=code_length, num_slices=n_slices)
        exp.test()
        report = exp.get_exp_report()
        print(report)
        reports.append(report)

loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:04<00:00, 2177.16it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0004803830862045288, 'inf_time_per_sample': 0.0003893955945968628, 'acc': 0.9197, 'precision_k': 0.89705}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:04<00:00, 2105.41it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.0004948450088500977, 'inf_time_per_sample': 0.00038885202407836915, 'acc': 0.9202, 'precision_k': 0.8836125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:04<00:00, 2022.64it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0005172230958938598, 'inf_time_per_sample': 0.0004006269931793213, 'acc': 0.9123, 'precision_k': 0.86655}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:04<00:00, 2138.25it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0004994014978408814, 'inf_time_per_sample': 0.00038876860141754153, 'acc': 0.9215, 'precision_k': 0.89575}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:05<00:00, 1863.11it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.0005569815158843994, 'inf_time_per_sample': 0.0003978794813156128, 'acc': 0.919, 'precision_k': 0.882375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:04<00:00, 2033.20it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0005132303953170776, 'inf_time_per_sample': 0.0003884979963302612, 'acc': 0.9109, 'precision_k': 0.86511875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:05<00:00, 1845.20it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0005641487836837768, 'inf_time_per_sample': 0.00039207370281219483, 'acc': 0.9211, 'precision_k': 0.896725}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:06<00:00, 1613.07it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.0006418863773345947, 'inf_time_per_sample': 0.00039911468029022216, 'acc': 0.9232, 'precision_k': 0.884475}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:05<00:00, 1981.90it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0005243875980377197, 'inf_time_per_sample': 0.0004049114942550659, 'acc': 0.9177, 'precision_k': 0.8675}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:05<00:00, 1871.49it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.000555581283569336, 'inf_time_per_sample': 0.0003957517862319946, 'acc': 0.9264, 'precision_k': 0.901225}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:05<00:00, 1728.78it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.0006013029098510742, 'inf_time_per_sample': 0.00039609310626983644, 'acc': 0.9242, 'precision_k': 0.8865875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:04<00:00, 2036.94it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0005104917049407959, 'inf_time_per_sample': 0.0003881707191467285, 'acc': 0.9218, 'precision_k': 0.86946875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:04<00:00, 2153.84it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.00048592169284820556, 'inf_time_per_sample': 0.00038374199867248536, 'acc': 0.9086, 'precision_k': 0.87685}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:04<00:00, 2007.43it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.0005215465068817139, 'inf_time_per_sample': 0.00039430990219116213, 'acc': 0.9057, 'precision_k': 0.861775}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:05<00:00, 1867.03it/s]


{'dataset': 'point_mnist', 'pooling': 'swe', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0005565723180770874, 'inf_time_per_sample': 0.0003972540855407715, 'acc': 0.9003, 'precision_k': 0.8424125}


### WE

In [7]:
for seed in seeds:
    for k in ks:
        exp = Experiment(dataset, 'we', 'faiss-lsh', 
                         random_state=seed, ref_func=ref, k=k, ref_size=set_size_median, code_length=code_length)
        exp.test()
        report = exp.get_exp_report()
        print(report)
        reports.append(report)

loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:25<00:00, 397.61it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.002533702611923218, 'inf_time_per_sample': 0.0003858808994293213, 'acc': 0.9209, 'precision_k': 0.89005}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:24<00:00, 416.57it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.002421518397331238, 'inf_time_per_sample': 0.0003738917827606201, 'acc': 0.9224, 'precision_k': 0.87765}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 433.78it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0023251107931137084, 'inf_time_per_sample': 0.000373866605758667, 'acc': 0.9159, 'precision_k': 0.86173125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 422.45it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0023858142137527464, 'inf_time_per_sample': 0.00037774522304534914, 'acc': 0.9198, 'precision_k': 0.8887}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 426.75it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.002362943387031555, 'inf_time_per_sample': 0.00037846760749816896, 'acc': 0.923, 'precision_k': 0.8778625}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 425.72it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0023698612928390503, 'inf_time_per_sample': 0.00037509031295776367, 'acc': 0.9153, 'precision_k': 0.86188125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 419.36it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.002412331795692444, 'inf_time_per_sample': 0.0003770792007446289, 'acc': 0.9186, 'precision_k': 0.8847}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 418.30it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.002409420394897461, 'inf_time_per_sample': 0.0003744368076324463, 'acc': 0.915, 'precision_k': 0.871525}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:25<00:00, 399.65it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0025225847005844117, 'inf_time_per_sample': 0.0003755937099456787, 'acc': 0.9122, 'precision_k': 0.85616875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:24<00:00, 410.78it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0024545366764068604, 'inf_time_per_sample': 0.0003912111043930054, 'acc': 0.9246, 'precision_k': 0.894725}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 417.22it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.002418043804168701, 'inf_time_per_sample': 0.00037397379875183105, 'acc': 0.9234, 'precision_k': 0.88285}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 421.34it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.0023925716876983644, 'inf_time_per_sample': 0.0003757025718688965, 'acc': 0.9194, 'precision_k': 0.86819375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 430.11it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 0.0023444679021835326, 'inf_time_per_sample': 0.0003768328905105591, 'acc': 0.9203, 'precision_k': 0.887925}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:23<00:00, 419.16it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 0.002405758810043335, 'inf_time_per_sample': 0.00038958652019500733, 'acc': 0.9193, 'precision_k': 0.8766375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:26<00:00, 384.23it/s]


{'dataset': 'point_mnist', 'pooling': 'we', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 0.00262330219745636, 'inf_time_per_sample': 0.00038140270709991457, 'acc': 0.915, 'precision_k': 0.862525}


### Cov

In [8]:
for seed in seeds:
    for k in ks:
        exp = Experiment(dataset, 'cov', 'faiss-lsh',
                         random_state=seed, k=k, ref_size=set_size_median, code_length=code_length)
        exp.test()
        report = exp.get_exp_report()
        print(report)
        reports.append(report)

loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 19674.05it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 7.202529907226563e-05, 'inf_time_per_sample': 0.00038690080642700197, 'acc': 0.2648, 'precision_k': 0.2473}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17041.20it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 7.7789306640625e-05, 'inf_time_per_sample': 0.0003719609260559082, 'acc': 0.276, 'precision_k': 0.248125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 19995.28it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 7.079741954803467e-05, 'inf_time_per_sample': 0.00037229340076446534, 'acc': 0.281, 'precision_k': 0.24801875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 20233.78it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 7.022030353546143e-05, 'inf_time_per_sample': 0.00036978511810302733, 'acc': 0.2648, 'precision_k': 0.2473}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16649.27it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 8.302268981933594e-05, 'inf_time_per_sample': 0.0004015040159225464, 'acc': 0.276, 'precision_k': 0.248125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 20346.26it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 6.982650756835938e-05, 'inf_time_per_sample': 0.00038590569496154786, 'acc': 0.281, 'precision_k': 0.24801875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 20435.57it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 6.803030967712403e-05, 'inf_time_per_sample': 0.00040654759407043455, 'acc': 0.2648, 'precision_k': 0.2473}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17245.51it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 7.883598804473877e-05, 'inf_time_per_sample': 0.00037874131202697754, 'acc': 0.276, 'precision_k': 0.248125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 19806.26it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 7.206757068634033e-05, 'inf_time_per_sample': 0.00039531450271606443, 'acc': 0.281, 'precision_k': 0.24801875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 18950.52it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 7.548201084136962e-05, 'inf_time_per_sample': 0.00038673701286315917, 'acc': 0.2648, 'precision_k': 0.2473}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17386.85it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 7.6729416847229e-05, 'inf_time_per_sample': 0.00037868680953979494, 'acc': 0.276, 'precision_k': 0.248125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 20010.37it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 7.015011310577393e-05, 'inf_time_per_sample': 0.00038259861469268797, 'acc': 0.281, 'precision_k': 0.24801875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 19758.54it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'emb_time_per_sample': 7.228522300720214e-05, 'inf_time_per_sample': 0.00038124232292175293, 'acc': 0.2648, 'precision_k': 0.2473}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17056.26it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'emb_time_per_sample': 7.982578277587891e-05, 'inf_time_per_sample': 0.0003696885824203491, 'acc': 0.276, 'precision_k': 0.248125}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 20119.46it/s]


{'dataset': 'point_mnist', 'pooling': 'cov', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'emb_time_per_sample': 6.942558288574219e-05, 'inf_time_per_sample': 0.00039804840087890626, 'acc': 0.281, 'precision_k': 0.24801875}


### GeM-1

In [9]:
for seed in seeds:
    for k in ks:
        exp = Experiment(dataset, 'gem', 'faiss-lsh',
                         random_state=seed, k=k, ref_size=set_size_median, code_length=code_length, power=1)
        exp.test()
        report = exp.get_exp_report()
        print(report)
        reports.append(report)

loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 48708.00it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 4.2551398277282715e-05, 'inf_time_per_sample': 0.0003985496997833252, 'acc': 0.1086, 'precision_k': 0.1044}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 53140.89it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.8455986976623534e-05, 'inf_time_per_sample': 0.0003771803855895996, 'acc': 0.1042, 'precision_k': 0.1023375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 54809.31it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 4.649150371551514e-05, 'inf_time_per_sample': 0.0003702794075012207, 'acc': 0.1004, 'precision_k': 0.101225}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 56306.34it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.6470580101013187e-05, 'inf_time_per_sample': 0.0003665106296539307, 'acc': 0.1086, 'precision_k': 0.1044}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 55305.37it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.784661293029785e-05, 'inf_time_per_sample': 0.00037074382305145266, 'acc': 0.1042, 'precision_k': 0.1023375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 55997.52it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.610892295837402e-05, 'inf_time_per_sample': 0.000366972017288208, 'acc': 0.1004, 'precision_k': 0.101225}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 55957.85it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 4.5283317565917966e-05, 'inf_time_per_sample': 0.0003711618900299072, 'acc': 0.1086, 'precision_k': 0.1044}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 54855.54it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.682219982147217e-05, 'inf_time_per_sample': 0.00037225589752197264, 'acc': 0.1042, 'precision_k': 0.1023375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 56077.11it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.8891911506652835e-05, 'inf_time_per_sample': 0.0003689895868301392, 'acc': 0.1004, 'precision_k': 0.101225}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 54837.47it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.636381626129151e-05, 'inf_time_per_sample': 0.00037015657424926756, 'acc': 0.1086, 'precision_k': 0.1044}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 38795.31it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 4.638161659240723e-05, 'inf_time_per_sample': 0.00037074291706085203, 'acc': 0.1042, 'precision_k': 0.1023375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 54561.26it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.6934709548950197e-05, 'inf_time_per_sample': 0.0003761444330215454, 'acc': 0.1004, 'precision_k': 0.101225}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 55731.08it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.865180015563965e-05, 'inf_time_per_sample': 0.0003745671033859253, 'acc': 0.1086, 'precision_k': 0.1044}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 55000.12it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.635149002075195e-05, 'inf_time_per_sample': 0.00037083740234375, 'acc': 0.1042, 'precision_k': 0.1023375}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 55952.78it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-1', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 1, 'emb_time_per_sample': 3.6765599250793455e-05, 'inf_time_per_sample': 0.00036921517848968505, 'acc': 0.1004, 'precision_k': 0.101225}


### GeM-2

In [10]:
for seed in seeds:
    for k in ks:
        exp = Experiment(dataset, 'gem', 'faiss-lsh',
                         random_state=seed, k=k, ref_size=set_size_median, code_length=code_length, power=2)
        exp.test()
        report = exp.get_exp_report()
        print(report)
        reports.append(report)

loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 26149.34it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 5.6570601463317874e-05, 'inf_time_per_sample': 0.00037008697986602783, 'acc': 0.3214, 'precision_k': 0.28705}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33002.08it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.9127721786499024e-05, 'inf_time_per_sample': 0.00036777870655059817, 'acc': 0.3466, 'precision_k': 0.285675}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 32370.23it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.9360513687133786e-05, 'inf_time_per_sample': 0.00036956329345703124, 'acc': 0.3705, 'precision_k': 0.28901875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33402.78it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.829201698303223e-05, 'inf_time_per_sample': 0.00036777660846710206, 'acc': 0.3214, 'precision_k': 0.28705}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33466.51it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.7609996795654296e-05, 'inf_time_per_sample': 0.00037202510833740237, 'acc': 0.3466, 'precision_k': 0.285675}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33482.43it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.8957204818725584e-05, 'inf_time_per_sample': 0.00037139949798583986, 'acc': 0.3705, 'precision_k': 0.28901875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33395.90it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.8797011375427246e-05, 'inf_time_per_sample': 0.0003670634031295776, 'acc': 0.3214, 'precision_k': 0.28705}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33303.22it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.942758083343506e-05, 'inf_time_per_sample': 0.00037208449840545657, 'acc': 0.3466, 'precision_k': 0.285675}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33061.78it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.958598613739014e-05, 'inf_time_per_sample': 0.0003706617832183838, 'acc': 0.3705, 'precision_k': 0.28901875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33300.55it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 5.661187171936035e-05, 'inf_time_per_sample': 0.0003679971218109131, 'acc': 0.3214, 'precision_k': 0.28705}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33020.43it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.9558520317077634e-05, 'inf_time_per_sample': 0.0003690037965774536, 'acc': 0.3466, 'precision_k': 0.285675}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 33079.93it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 4.890282154083252e-05, 'inf_time_per_sample': 0.0003665180206298828, 'acc': 0.3705, 'precision_k': 0.28901875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 30960.42it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 5.3960394859313966e-05, 'inf_time_per_sample': 0.00036841652393341064, 'acc': 0.3214, 'precision_k': 0.28705}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 25742.54it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 5.739588737487793e-05, 'inf_time_per_sample': 0.0003660981893539429, 'acc': 0.3466, 'precision_k': 0.285675}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 32724.23it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-2', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 2, 'emb_time_per_sample': 5.104701519012451e-05, 'inf_time_per_sample': 0.0003694002866744995, 'acc': 0.3705, 'precision_k': 0.28901875}


### GeM-4

In [11]:
for seed in seeds:
    for k in ks:
        exp = Experiment(dataset, 'gem', 'faiss-lsh',
                         random_state=seed, k=k, ref_size=set_size_median, code_length=code_length, power=4)
        exp.test()
        report = exp.get_exp_report()
        print(report)
        reports.append(report)

loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 15978.04it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 8.341200351715088e-05, 'inf_time_per_sample': 0.00037127938270568845, 'acc': 0.4458, 'precision_k': 0.393575}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16204.54it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 8.194692134857178e-05, 'inf_time_per_sample': 0.0003683065176010132, 'acc': 0.4711, 'precision_k': 0.3903}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16190.66it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 8.362438678741455e-05, 'inf_time_per_sample': 0.000374837589263916, 'acc': 0.487, 'precision_k': 0.38306875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16252.58it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 9.210700988769531e-05, 'inf_time_per_sample': 0.0003714257717132568, 'acc': 0.4458, 'precision_k': 0.393575}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16121.39it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 8.376328945159913e-05, 'inf_time_per_sample': 0.0003664239168167114, 'acc': 0.4711, 'precision_k': 0.3903}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16178.69it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 8.351960182189941e-05, 'inf_time_per_sample': 0.00036617400646209717, 'acc': 0.487, 'precision_k': 0.38306875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 16162.09it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 8.23760986328125e-05, 'inf_time_per_sample': 0.00037018916606903075, 'acc': 0.4458, 'precision_k': 0.393575}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 15405.83it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 8.425297737121583e-05, 'inf_time_per_sample': 0.0003662482976913452, 'acc': 0.4711, 'precision_k': 0.3903}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17532.48it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 7.665021419525147e-05, 'inf_time_per_sample': 0.0003722698926925659, 'acc': 0.487, 'precision_k': 0.38306875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17384.33it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 7.681798934936523e-05, 'inf_time_per_sample': 0.0003669736862182617, 'acc': 0.4458, 'precision_k': 0.393575}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17465.81it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 7.673590183258057e-05, 'inf_time_per_sample': 0.00036836788654327394, 'acc': 0.4711, 'precision_k': 0.3903}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 15343.98it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 8.362312316894531e-05, 'inf_time_per_sample': 0.00036809468269348146, 'acc': 0.487, 'precision_k': 0.38306875}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17490.29it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 4, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 7.612059116363525e-05, 'inf_time_per_sample': 0.0003658282041549683, 'acc': 0.4458, 'precision_k': 0.393575}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17514.51it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 8, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 7.680182456970215e-05, 'inf_time_per_sample': 0.0003727047920227051, 'acc': 0.4711, 'precision_k': 0.3903}
loading dataset...
loading cached base embedding...
compute query embedding...


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 17511.32it/s]


{'dataset': 'point_mnist', 'pooling': 'gem-4', 'ann': 'faiss-lsh', 'k': 16, 'code_length': 1024, 'power': 4, 'emb_time_per_sample': 7.557501792907715e-05, 'inf_time_per_sample': 0.00036609373092651366, 'acc': 0.487, 'precision_k': 0.38306875}


In [12]:
import altair as alt

In [13]:
labels = {'fs': 'FSPool', 'swe': 'SLOSH', 'we': 'WE', 
          'cov': 'Cov', 'gem-1': 'GeM-1', 'gem-2': 'GeM-2', 'gem-4': 'GeM-4'}

In [14]:
data = pd.DataFrame(reports)
data['pooling'] = data['pooling'].apply(lambda x: labels[x])

In [15]:
points = alt.Chart(data).mark_point().encode(
    alt.X('mean(emb_time_per_sample):Q', title='Average Embedding Time'),
    alt.Y('mean(acc):Q', title='Accuracy'),
    color=alt.Color('pooling:N', legend=None),
).properties(
    width=240,
    height=240
)

In [16]:
text = points.mark_text(
    align='left',
    baseline='middle',
    dx=5,
    size=15
).encode(
    text='pooling:N'
)

In [17]:
alt.layer(points + text).configure_axis(
    labelFontSize=12,
    titleFontSize=16
)

In [18]:
pd.options.display.float_format = "{:,.2f}".format

In [19]:
data.groupby(['pooling', 'k'])[['precision_k', 'acc']].mean()

Unnamed: 0_level_0,Unnamed: 1_level_0,precision_k,acc
pooling,k,Unnamed: 2_level_1,Unnamed: 3_level_1
Cov,4,0.25,0.26
Cov,8,0.25,0.28
Cov,16,0.25,0.28
FSPool,4,0.75,0.8
FSPool,8,0.74,0.81
FSPool,16,0.72,0.81
GeM-1,4,0.1,0.11
GeM-1,8,0.1,0.1
GeM-1,16,0.1,0.1
GeM-2,4,0.29,0.32
