In [1]:
import numpy as np
import pandas as pd
import torch
from config import load_config
from pathlib import Path
from lightning.pytorch.loggers.wandb import WandbLogger
from scipy.stats import wasserstein_distance, entropy
from sklearn.metrics import roc_auc_score
from tqdm import tqdm
from umap import UMAP
from matplotlib import pyplot as plt
import seaborn as sns
import faiss
import os

# initialize the RNG deterministically
np.random.seed(42)
torch.manual_seed(42)
torch.set_float32_matmul_precision('medium')
run_stats = {}

In [2]:
# parameters
dataset_name = ""
model_name = "flow_ss_vcr_mse"
ood = ""

In [3]:
# Parameters
dataset_name = "MNIST"
ood = "5:6:7:8:9"


In [4]:
# initialize data attributes and loaders
save_name = f"assets/results/{dataset_name}/{model_name}/{ood}"
os.makedirs(os.path.dirname(save_name + "_blank.file"), exist_ok=True)
config = load_config(
    dataset_name = dataset_name,
    model_name = model_name,
    ood = ood,
)
config.load_data(shuffle_training_data=False)
config.print_labels()
dm = config.datamodule

assert dm

  0%|                                                                                                                            | 0/60000 [00:00<?, ?it/s]

 15%|████████████████▌                                                                                             | 9012/60000 [00:00<00:00, 90115.14it/s]

 30%|████████████████████████████████▋                                                                            | 18024/60000 [00:00<00:00, 86757.37it/s]

 45%|████████████████████████████████████████████████▌                                                            | 26709/60000 [00:00<00:00, 85787.29it/s]

 60%|████████████████████████████████████████████████████████████████▉                                            | 35739/60000 [00:00<00:00, 87528.41it/s]

 75%|█████████████████████████████████████████████████████████████████████████████████▍                           | 44849/60000 [00:00<00:00, 88795.22it/s]

 90%|█████████████████████████████████████████████████████████████████████████████████████████████████▉           | 53944/60000 [00:00<00:00, 89518.88it/s]

100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 60000/60000 [00:00<00:00, 88609.90it/s]




  0%|                                                                                                                            | 0/10000 [00:00<?, ?it/s]

 88%|████████████████████████████████████████████████████████████████████████████████████████████████▌             | 8777/10000 [00:00<00:00, 87762.55it/s]

100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:00<00:00, 84490.18it/s]




In [5]:
# initialize data modules
dm.setup("fit")
dm.setup("test")
dm.setup("predict")

In [6]:
# model ids
ood_str = ":".join(map(str, config.ood))
df = pd.read_csv("ids.csv").fillna("")
model_id = df[(df.dataset_name == dataset_name) & (df.model_name == model_name) & (df.ood == ood)].id.item()
print(ood_str, model_id)

5:6:7:8:9 umry49p9


In [7]:
# load model and weights
model = config.get_model()
artifact_dir = WandbLogger.download_artifact(artifact=f"yasith/robustml/model-{model_id}:best")
model = model.__class__.load_from_checkpoint(Path(artifact_dir) / "model.ckpt", config=config)
model = model.cuda()
model.eval();

[34m[1mwandb[0m:   1 of 1 files downloaded.  


In [8]:
# create data loaders
train_loader = dm.train_dataloader()
val_loader = dm.val_dataloader()
test_loader = dm.test_dataloader()
if ood_str:
    predict_loader = dm.predict_dataloader()

In [9]:
# forward pass
with torch.no_grad():
    trn_inp = []
    trn_e_u = []
    trn_e_v = []
    trn_rcn = []
    trn_tgt = []

    val_inp = []
    val_e_u = []
    val_e_v = []
    val_rcn = []
    val_tgt = []

    ind_inp = []
    ind_e_u = []
    ind_e_v = []
    ind_rcn = []
    ind_tgt = []

    if ood_str:
        ood_inp = []
        ood_e_u = []
        ood_e_v = []
        ood_rcn = []
        ood_tgt = []

    # train set (ind)
    for batch_idx, batch in enumerate(tqdm(train_loader)):
        x, y, *_ = batch
        x = x.float().cuda()
        (e_u, e_v), (n_u, n_v), rcn, _ = model(x)
        trn_inp.extend(x.detach().cpu().numpy())
        trn_e_u.extend(e_u.detach().cpu().numpy())
        trn_e_v.extend(e_v.detach().cpu().numpy())
        trn_rcn.extend(rcn.detach().cpu().numpy())
        trn_tgt.extend(y.detach().cpu().numpy())
    print("train - OK")

    # val set (ind)
    for batch_idx, batch in enumerate(tqdm(val_loader)):
        x, y, *_ = batch
        x = x.float().cuda()
        (e_u, e_v), (n_u, n_v), rcn, _ = model(x)
        val_inp.extend(x.detach().cpu().numpy())
        val_e_u.extend(e_u.detach().cpu().numpy())
        val_e_v.extend(e_v.detach().cpu().numpy())
        val_rcn.extend(rcn.detach().cpu().numpy())
        val_tgt.extend(y.detach().cpu().numpy())
    print("val - OK")

    # test set (ind)
    for batch_idx, batch in enumerate(tqdm(test_loader)):
        x, y, *_ = batch
        x = x.float().cuda()
        (e_u, e_v), (n_u, n_v), rcn, _ = model(x)
        ind_inp.extend(x.detach().cpu().numpy())
        ind_e_u.extend(e_u.detach().cpu().numpy())
        ind_e_v.extend(e_v.detach().cpu().numpy())
        ind_rcn.extend(rcn.detach().cpu().numpy())
        ind_tgt.extend(y.detach().cpu().numpy())
    print("test InD - OK")

    # predict set (ood)
    if ood_str:
        for batch_idx, batch in enumerate(tqdm(predict_loader)):
            x, y, *_ = batch
            x = x.float().cuda()
            (e_u, e_v), (n_u, n_v), rcn, _ = model(x)
            ood_inp.extend(x.detach().cpu().numpy())
            ood_e_u.extend(e_u.detach().cpu().numpy())
            ood_e_v.extend(e_v.detach().cpu().numpy())
            ood_rcn.extend(rcn.detach().cpu().numpy())
            ood_tgt.extend(y.detach().cpu().numpy())
        print("test OoD - OK")

  0%|                                                                                                                              | 0/192 [00:00<?, ?it/s]

  1%|▌                                                                                                                     | 1/192 [00:01<03:24,  1.07s/it]

  2%|█▊                                                                                                                    | 3/192 [00:01<01:00,  3.13it/s]

  3%|███                                                                                                                   | 5/192 [00:01<00:34,  5.47it/s]

  4%|████▎                                                                                                                 | 7/192 [00:01<00:23,  7.78it/s]

  5%|█████▌                                                                                                                | 9/192 [00:01<00:18,  9.95it/s]

  6%|██████▋                                                                                                              | 11/192 [00:01<00:15, 11.87it/s]

  7%|███████▉                                                                                                             | 13/192 [00:01<00:13, 13.46it/s]

  8%|█████████▏                                                                                                           | 15/192 [00:01<00:12, 14.73it/s]

  9%|██████████▎                                                                                                          | 17/192 [00:01<00:11, 15.71it/s]

 10%|███████████▌                                                                                                         | 19/192 [00:02<00:10, 16.47it/s]

 11%|████████████▊                                                                                                        | 21/192 [00:02<00:10, 17.04it/s]

 12%|██████████████                                                                                                       | 23/192 [00:02<00:09, 17.47it/s]

 13%|███████████████▏                                                                                                     | 25/192 [00:02<00:09, 17.78it/s]

 14%|████████████████▍                                                                                                    | 27/192 [00:02<00:09, 18.00it/s]

 15%|█████████████████▋                                                                                                   | 29/192 [00:02<00:08, 18.15it/s]

 16%|██████████████████▉                                                                                                  | 31/192 [00:02<00:08, 18.25it/s]

 17%|████████████████████                                                                                                 | 33/192 [00:02<00:08, 18.33it/s]

 18%|█████████████████████▎                                                                                               | 35/192 [00:02<00:08, 18.41it/s]

 19%|██████████████████████▌                                                                                              | 37/192 [00:03<00:08, 18.44it/s]

 20%|███████████████████████▊                                                                                             | 39/192 [00:03<00:08, 18.47it/s]

 21%|████████████████████████▉                                                                                            | 41/192 [00:03<00:08, 18.48it/s]

 22%|██████████████████████████▏                                                                                          | 43/192 [00:03<00:08, 18.50it/s]

 23%|███████████████████████████▍                                                                                         | 45/192 [00:03<00:07, 18.51it/s]

 24%|████████████████████████████▋                                                                                        | 47/192 [00:03<00:07, 18.51it/s]

 26%|█████████████████████████████▊                                                                                       | 49/192 [00:03<00:07, 18.50it/s]

 27%|███████████████████████████████                                                                                      | 51/192 [00:03<00:07, 18.51it/s]

 28%|████████████████████████████████▎                                                                                    | 53/192 [00:03<00:07, 18.52it/s]

 29%|█████████████████████████████████▌                                                                                   | 55/192 [00:03<00:07, 18.53it/s]

 30%|██████████████████████████████████▋                                                                                  | 57/192 [00:04<00:07, 18.52it/s]

 31%|███████████████████████████████████▉                                                                                 | 59/192 [00:04<00:07, 18.52it/s]

 32%|█████████████████████████████████████▏                                                                               | 61/192 [00:04<00:07, 18.51it/s]

 33%|██████████████████████████████████████▍                                                                              | 63/192 [00:04<00:06, 18.51it/s]

 34%|███████████████████████████████████████▌                                                                             | 65/192 [00:04<00:06, 18.51it/s]

 35%|████████████████████████████████████████▊                                                                            | 67/192 [00:04<00:06, 18.51it/s]

 36%|██████████████████████████████████████████                                                                           | 69/192 [00:04<00:06, 18.50it/s]

 37%|███████████████████████████████████████████▎                                                                         | 71/192 [00:04<00:06, 18.51it/s]

 38%|████████████████████████████████████████████▍                                                                        | 73/192 [00:04<00:06, 18.50it/s]

 39%|█████████████████████████████████████████████▋                                                                       | 75/192 [00:05<00:06, 18.52it/s]

 40%|██████████████████████████████████████████████▉                                                                      | 77/192 [00:05<00:06, 18.51it/s]

 41%|████████████████████████████████████████████████▏                                                                    | 79/192 [00:05<00:06, 18.52it/s]

 42%|█████████████████████████████████████████████████▎                                                                   | 81/192 [00:05<00:06, 18.44it/s]

 43%|██████████████████████████████████████████████████▌                                                                  | 83/192 [00:05<00:05, 18.46it/s]

 44%|███████████████████████████████████████████████████▊                                                                 | 85/192 [00:05<00:05, 18.48it/s]

 45%|█████████████████████████████████████████████████████                                                                | 87/192 [00:05<00:05, 18.49it/s]

 46%|██████████████████████████████████████████████████████▏                                                              | 89/192 [00:05<00:05, 18.50it/s]

 47%|███████████████████████████████████████████████████████▍                                                             | 91/192 [00:05<00:05, 18.52it/s]

 48%|████████████████████████████████████████████████████████▋                                                            | 93/192 [00:06<00:05, 18.53it/s]

 49%|█████████████████████████████████████████████████████████▉                                                           | 95/192 [00:06<00:05, 18.52it/s]

 51%|███████████████████████████████████████████████████████████                                                          | 97/192 [00:06<00:05, 18.52it/s]

 52%|████████████████████████████████████████████████████████████▎                                                        | 99/192 [00:06<00:05, 18.53it/s]

 53%|█████████████████████████████████████████████████████████████                                                       | 101/192 [00:06<00:04, 18.53it/s]

 54%|██████████████████████████████████████████████████████████████▏                                                     | 103/192 [00:06<00:04, 18.55it/s]

 55%|███████████████████████████████████████████████████████████████▍                                                    | 105/192 [00:06<00:04, 18.53it/s]

 56%|████████████████████████████████████████████████████████████████▋                                                   | 107/192 [00:06<00:04, 18.52it/s]

 57%|█████████████████████████████████████████████████████████████████▊                                                  | 109/192 [00:06<00:04, 18.51it/s]

 58%|███████████████████████████████████████████████████████████████████                                                 | 111/192 [00:07<00:04, 18.46it/s]

 59%|████████████████████████████████████████████████████████████████████▎                                               | 113/192 [00:07<00:04, 18.48it/s]

 60%|█████████████████████████████████████████████████████████████████████▍                                              | 115/192 [00:07<00:04, 18.50it/s]

 61%|██████████████████████████████████████████████████████████████████████▋                                             | 117/192 [00:07<00:04, 18.50it/s]

 62%|███████████████████████████████████████████████████████████████████████▉                                            | 119/192 [00:07<00:03, 18.51it/s]

 63%|█████████████████████████████████████████████████████████████████████████                                           | 121/192 [00:07<00:03, 18.45it/s]

 64%|██████████████████████████████████████████████████████████████████████████▎                                         | 123/192 [00:07<00:03, 18.43it/s]

 65%|███████████████████████████████████████████████████████████████████████████▌                                        | 125/192 [00:07<00:03, 18.45it/s]

 66%|████████████████████████████████████████████████████████████████████████████▋                                       | 127/192 [00:07<00:03, 18.47it/s]

 67%|█████████████████████████████████████████████████████████████████████████████▉                                      | 129/192 [00:07<00:03, 18.48it/s]

 68%|███████████████████████████████████████████████████████████████████████████████▏                                    | 131/192 [00:08<00:03, 18.50it/s]

 69%|████████████████████████████████████████████████████████████████████████████████▎                                   | 133/192 [00:08<00:03, 18.50it/s]

 70%|█████████████████████████████████████████████████████████████████████████████████▌                                  | 135/192 [00:08<00:03, 18.51it/s]

 71%|██████████████████████████████████████████████████████████████████████████████████▊                                 | 137/192 [00:08<00:02, 18.49it/s]

 72%|███████████████████████████████████████████████████████████████████████████████████▉                                | 139/192 [00:08<00:02, 18.51it/s]

 73%|█████████████████████████████████████████████████████████████████████████████████████▏                              | 141/192 [00:08<00:02, 18.48it/s]

 74%|██████████████████████████████████████████████████████████████████████████████████████▍                             | 143/192 [00:08<00:02, 18.49it/s]

 76%|███████████████████████████████████████████████████████████████████████████████████████▌                            | 145/192 [00:08<00:02, 18.48it/s]

 77%|████████████████████████████████████████████████████████████████████████████████████████▊                           | 147/192 [00:08<00:02, 18.51it/s]

 78%|██████████████████████████████████████████████████████████████████████████████████████████                          | 149/192 [00:09<00:02, 18.47it/s]

 79%|███████████████████████████████████████████████████████████████████████████████████████████▏                        | 151/192 [00:09<00:02, 18.45it/s]

 80%|████████████████████████████████████████████████████████████████████████████████████████████▍                       | 153/192 [00:09<00:02, 18.47it/s]

 81%|█████████████████████████████████████████████████████████████████████████████████████████████▋                      | 155/192 [00:09<00:02, 18.46it/s]

 82%|██████████████████████████████████████████████████████████████████████████████████████████████▊                     | 157/192 [00:09<00:01, 18.48it/s]

 83%|████████████████████████████████████████████████████████████████████████████████████████████████                    | 159/192 [00:09<00:01, 18.49it/s]

 84%|█████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 161/192 [00:09<00:01, 18.49it/s]

 85%|██████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 163/192 [00:09<00:01, 18.50it/s]

 86%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                | 165/192 [00:09<00:01, 18.50it/s]

 87%|████████████████████████████████████████████████████████████████████████████████████████████████████▉               | 167/192 [00:10<00:01, 18.50it/s]

 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████              | 169/192 [00:10<00:01, 18.50it/s]

 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 171/192 [00:10<00:01, 18.51it/s]

 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████▌           | 173/192 [00:10<00:01, 18.47it/s]

 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▋          | 175/192 [00:10<00:00, 18.43it/s]

 92%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉         | 177/192 [00:10<00:00, 18.45it/s]

 93%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏       | 179/192 [00:10<00:00, 18.47it/s]

 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▎      | 181/192 [00:10<00:00, 18.48it/s]

 95%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▌     | 183/192 [00:10<00:00, 18.50it/s]

 96%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▊    | 185/192 [00:11<00:00, 18.52it/s]

 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉   | 187/192 [00:11<00:00, 18.56it/s]

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 189/192 [00:11<00:00, 18.57it/s]

 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍| 191/192 [00:11<00:00, 18.60it/s]

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 192/192 [00:11<00:00, 16.82it/s]




train - OK


  0%|                                                                                                                               | 0/48 [00:00<?, ?it/s]

  2%|██▍                                                                                                                    | 1/48 [00:00<00:05,  8.03it/s]

  6%|███████▍                                                                                                               | 3/48 [00:00<00:03, 13.74it/s]

 10%|████████████▍                                                                                                          | 5/48 [00:00<00:02, 15.78it/s]

 15%|█████████████████▎                                                                                                     | 7/48 [00:00<00:02, 16.84it/s]

 19%|██████████████████████▎                                                                                                | 9/48 [00:00<00:02, 17.45it/s]

 23%|███████████████████████████                                                                                           | 11/48 [00:00<00:02, 17.83it/s]

 27%|███████████████████████████████▉                                                                                      | 13/48 [00:00<00:01, 18.08it/s]

 31%|████████████████████████████████████▉                                                                                 | 15/48 [00:00<00:01, 18.24it/s]

 35%|█████████████████████████████████████████▊                                                                            | 17/48 [00:00<00:01, 18.34it/s]

 40%|██████████████████████████████████████████████▋                                                                       | 19/48 [00:01<00:01, 18.42it/s]

 44%|███████████████████████████████████████████████████▋                                                                  | 21/48 [00:01<00:01, 18.48it/s]

 48%|████████████████████████████████████████████████████████▌                                                             | 23/48 [00:01<00:01, 18.52it/s]

 52%|█████████████████████████████████████████████████████████████▍                                                        | 25/48 [00:01<00:01, 18.53it/s]

 56%|██████████████████████████████████████████████████████████████████▍                                                   | 27/48 [00:01<00:01, 18.55it/s]

 60%|███████████████████████████████████████████████████████████████████████▎                                              | 29/48 [00:01<00:01, 18.56it/s]

 65%|████████████████████████████████████████████████████████████████████████████▏                                         | 31/48 [00:01<00:00, 18.58it/s]

 69%|█████████████████████████████████████████████████████████████████████████████████▏                                    | 33/48 [00:01<00:00, 18.57it/s]

 73%|██████████████████████████████████████████████████████████████████████████████████████                                | 35/48 [00:01<00:00, 18.58it/s]

 77%|██████████████████████████████████████████████████████████████████████████████████████████▉                           | 37/48 [00:02<00:00, 18.58it/s]

 81%|███████████████████████████████████████████████████████████████████████████████████████████████▉                      | 39/48 [00:02<00:00, 18.58it/s]

 85%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                 | 41/48 [00:02<00:00, 18.61it/s]

 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▋            | 43/48 [00:02<00:00, 18.62it/s]

 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 45/48 [00:02<00:00, 18.65it/s]

 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌  | 47/48 [00:02<00:00, 18.68it/s]

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 48/48 [00:02<00:00, 17.78it/s]




val - OK


  0%|                                                                                                                               | 0/41 [00:00<?, ?it/s]

  2%|██▉                                                                                                                    | 1/41 [00:00<00:04,  8.07it/s]

  7%|████████▋                                                                                                              | 3/41 [00:00<00:02, 13.81it/s]

 12%|██████████████▌                                                                                                        | 5/41 [00:00<00:02, 15.85it/s]

 17%|████████████████████▎                                                                                                  | 7/41 [00:00<00:02, 16.88it/s]

 22%|██████████████████████████                                                                                             | 9/41 [00:00<00:01, 17.44it/s]

 27%|███████████████████████████████▋                                                                                      | 11/41 [00:00<00:01, 17.81it/s]

 32%|█████████████████████████████████████▍                                                                                | 13/41 [00:00<00:01, 18.05it/s]

 37%|███████████████████████████████████████████▏                                                                          | 15/41 [00:00<00:01, 18.20it/s]

 41%|████████████████████████████████████████████████▉                                                                     | 17/41 [00:00<00:01, 18.30it/s]

 46%|██████████████████████████████████████████████████████▋                                                               | 19/41 [00:01<00:01, 18.37it/s]

 51%|████████████████████████████████████████████████████████████▍                                                         | 21/41 [00:01<00:01, 18.43it/s]

 56%|██████████████████████████████████████████████████████████████████▏                                                   | 23/41 [00:01<00:00, 18.48it/s]

 61%|███████████████████████████████████████████████████████████████████████▉                                              | 25/41 [00:01<00:00, 18.51it/s]

 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 27/41 [00:01<00:00, 18.53it/s]

 71%|███████████████████████████████████████████████████████████████████████████████████▍                                  | 29/41 [00:01<00:00, 18.54it/s]

 76%|█████████████████████████████████████████████████████████████████████████████████████████▏                            | 31/41 [00:01<00:00, 18.55it/s]

 80%|██████████████████████████████████████████████████████████████████████████████████████████████▉                       | 33/41 [00:01<00:00, 18.60it/s]

 85%|████████████████████████████████████████████████████████████████████████████████████████████████████▋                 | 35/41 [00:01<00:00, 18.64it/s]

 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▍           | 37/41 [00:02<00:00, 18.68it/s]

 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏     | 39/41 [00:02<00:00, 18.68it/s]

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 41/41 [00:02<00:00, 18.87it/s]

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 41/41 [00:02<00:00, 17.81it/s]




test InD - OK


  0%|                                                                                                                               | 0/38 [00:00<?, ?it/s]

  3%|███▏                                                                                                                   | 1/38 [00:00<00:04,  7.63it/s]

  8%|█████████▍                                                                                                             | 3/38 [00:00<00:02, 13.46it/s]

 13%|███████████████▋                                                                                                       | 5/38 [00:00<00:02, 15.67it/s]

 18%|█████████████████████▉                                                                                                 | 7/38 [00:00<00:01, 16.77it/s]

 24%|████████████████████████████▏                                                                                          | 9/38 [00:00<00:01, 17.40it/s]

 29%|██████████████████████████████████▏                                                                                   | 11/38 [00:00<00:01, 17.78it/s]

 34%|████████████████████████████████████████▎                                                                             | 13/38 [00:00<00:01, 18.02it/s]

 39%|██████████████████████████████████████████████▌                                                                       | 15/38 [00:00<00:01, 18.18it/s]

 45%|████████████████████████████████████████████████████▊                                                                 | 17/38 [00:00<00:01, 18.30it/s]

 50%|███████████████████████████████████████████████████████████                                                           | 19/38 [00:01<00:01, 18.38it/s]

 55%|█████████████████████████████████████████████████████████████████▏                                                    | 21/38 [00:01<00:00, 18.44it/s]

 61%|███████████████████████████████████████████████████████████████████████▍                                              | 23/38 [00:01<00:00, 18.48it/s]

 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 25/38 [00:01<00:00, 18.52it/s]

 71%|███████████████████████████████████████████████████████████████████████████████████▊                                  | 27/38 [00:01<00:00, 18.53it/s]

 76%|██████████████████████████████████████████████████████████████████████████████████████████                            | 29/38 [00:01<00:00, 18.54it/s]

 82%|████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 31/38 [00:01<00:00, 18.58it/s]

 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████▍               | 33/38 [00:01<00:00, 18.61it/s]

 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▋         | 35/38 [00:01<00:00, 18.64it/s]

 97%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉   | 37/38 [00:02<00:00, 18.64it/s]

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 38/38 [00:02<00:00, 17.44it/s]

test OoD - OK





In [None]:
# create numpy arrays
trn_inp = np.array(trn_inp)
trn_e_u = np.array(trn_e_u).squeeze()
trn_e_v = np.array(trn_e_v).squeeze()
trn_rcn = np.array(trn_rcn)
trn_tgt = np.array(trn_tgt)
np.savez_compressed(f"{save_name}_trn.npz", inp=trn_inp, e_u=trn_e_u, e_v=trn_e_v, rcn=trn_rcn, tgt=trn_tgt)

val_inp = np.array(val_inp)
val_e_u = np.array(val_e_u).squeeze()
val_e_v = np.array(val_e_v).squeeze()
val_rcn = np.array(val_rcn)
val_tgt = np.array(val_tgt)
np.savez_compressed(f"{save_name}_val.npz", inp=val_inp, e_u=val_e_u, e_v=val_e_v, rcn=val_rcn, tgt=val_tgt)

ind_inp = np.array(ind_inp)
ind_e_u = np.array(ind_e_u).squeeze()
ind_e_v = np.array(ind_e_v).squeeze()
ind_rcn = np.array(ind_rcn)
ind_tgt = np.array(ind_tgt)
np.savez_compressed(f"{save_name}_ind.npz", inp=ind_inp, e_u=ind_e_u, e_v=ind_e_v, rcn=ind_rcn, tgt=ind_tgt)

if ood_str:
    ood_inp = np.array(ood_inp)
    ood_e_u = np.array(ood_e_u).squeeze()
    ood_e_v = np.array(ood_e_v).squeeze()
    ood_rcn = np.array(ood_rcn)
    ood_tgt = np.array(ood_tgt)
    np.savez_compressed(f"{save_name}_ood.npz", inp=ood_inp, e_u=ood_e_u, e_v=ood_e_v, rcn=ood_rcn, tgt=ood_tgt)

ind_labels = [config.labels[i] for i in ind_tgt]
if ood_str:
    ood_labels = [config.labels[i] for i in ood_tgt]

print(trn_inp.shape, trn_e_u.shape, trn_e_v.shape, trn_rcn.shape, trn_tgt.shape)
print(val_inp.shape, val_e_u.shape, val_e_v.shape, val_rcn.shape, val_tgt.shape)
print(ind_inp.shape, ind_e_u.shape, ind_e_v.shape, ind_rcn.shape, ind_tgt.shape)
if ood_str:
    print(ood_inp.shape, ood_e_u.shape, ood_e_v.shape, ood_rcn.shape, ood_tgt.shape)

In [None]:
# create 2d embeddings
n = ind_inp.shape[0]
if ood_str:
    all_e_u = np.concatenate([ind_e_u, ood_e_u], axis=0)
    all_e_v = np.concatenate([ind_e_v, ood_e_v], axis=0)
else:
    all_e_u = ind_e_u
    all_e_v = ind_e_v

umap = UMAP(n_components=2, random_state=42)
e_u2d = umap.fit_transform(all_e_u)
ind_e_u2d = np.array(e_u2d[:n], order='C').astype(np.float32)
ood_e_u2d = np.array(e_u2d[n:], order='C').astype(np.float32)
print(ind_e_u2d.shape, ood_e_u2d.shape)

umap = UMAP(n_components=2, random_state=42)
e_v2d = umap.fit_transform(all_e_v)
ind_e_v2d = np.array(e_v2d[:n], order='C').astype(np.float32)
ood_e_v2d = np.array(e_v2d[n:], order='C').astype(np.float32)
print(ind_e_v2d.shape, ood_e_v2d.shape)

In [None]:
# plot feature space
ind_labels = [config.labels[i] for i in ind_tgt]
df_emb2d = pd.DataFrame()
u1, u2 = ind_e_u2d.T
v1, v2 = ind_e_v2d.T
df_emb2d = pd.concat([df_emb2d, pd.DataFrame(dict(u1=u1, u2=u2, v1=v1, v2=v2, label=ind_labels, source="ind"))])

if ood_str:
    ood_labels = [config.labels[i] for i in ood_tgt]
    u1, u2 = ood_e_u2d.T
    v1, v2 = ood_e_v2d.T
    df_emb2d = pd.concat([df_emb2d, pd.DataFrame(dict(u1=u1, u2=u2, v1=v1, v2=v2, label=ood_labels, source="ood"))])

fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(10, 10))
fig.suptitle(f"Feature Space - {dataset_name} - {model_name} - {ood_str}")
ax1.set_title("U - InD")
ax2.set_title("V - InD")
ax3.set_title("U - OoD")
ax4.set_title("V - OoD")
sns.scatterplot(data=df_emb2d[(df_emb2d['source'] == "ind")], x="u1", y="u2", hue="label", s=5, ax=ax1)
sns.scatterplot(data=df_emb2d[(df_emb2d['source'] == "ind")], x="v1", y="v2", hue="label", s=5, ax=ax2)
sns.scatterplot(data=df_emb2d[(df_emb2d['source'] == "ood")], x="u1", y="u2", hue="label", s=5, ax=ax3)
sns.scatterplot(data=df_emb2d[(df_emb2d['source'] == "ood")], x="v1", y="v2", hue="label", s=5, ax=ax4)
plt.tight_layout()
plt.show()

In [None]:
# plot knn distance from ind/ood to val data
def plot_knn_dists(index_fn, ax, trn_data, val_data, ind_data, ood_data=None, k=5, scale="linspace"):
    stats = {}
    index = index_fn(trn_data.shape[-1])
    index.add(trn_data)
    Dv = index.search(val_data, k)[0].mean(-1)
    Di = index.search(ind_data, k)[0].mean(-1)
    D = [Di]
    T = [[0] * Di.shape[0]]
    if ood_str:
        Do = index.search(ood_data, k)[0].mean(-1)
        D.append(Do)
        T.append([1] * Do.shape[0]) 
    D = np.concatenate(D, axis=0)
    T = np.concatenate(T, axis=0)
    if scale == "linspace":
        s, e = D.min(), D.max()
        bins = np.linspace(s, e, 100)
    if scale == "logspace":
        s, e = np.log10(D.min() + 1e-7), np.log10(D.max())
        bins = np.logspace(s, e, 100)
    sns.histplot(Di, fill=True, label='ind', stat='probability', ax=ax, bins=bins)
    prefix = ""
    if ood_str:
        Ci = np.histogram(Di, bins, density=True)[0]
        Co = np.histogram(Do, bins, density=True)[0]
        kld = entropy(Co + 1e-7, Ci + 1e-7)
        emd = wasserstein_distance(Do, Di)
        auc = roc_auc_score(T, D)
        auc = max(auc, 1-auc)
        sns.histplot(Do, fill=True, label='ood', stat='probability', ax=ax, bins=bins)
        ax.set_title(f"KL={kld:.4f} EMD={emd:.4f}, AUC={auc:.4f}")
        stats.update(dict(kld=kld, emd=emd, auc=auc, val_data=Dv.tolist(), ind_data=Di.tolist(), ood_data=Do.tolist()))
        
    if scale == "logspace":
        ax.set_xscale('log')
    ax.legend()
    return stats

fig, axs = plt.subplots(nrows=1, ncols=4, figsize=(20, 5))
fig.suptitle(f"KNN Distance (K=5) - {dataset_name} - {model_name} - {ood_str}")
run_stats["knn_u_l2"] = plot_knn_dists(faiss.IndexFlatL2, axs[0], trn_e_u, val_e_u, ind_e_u, ood_e_u if ood_str else None, scale="logspace")
axs[0].set_xlabel("U - L2")
run_stats["knn_u_ip"] = plot_knn_dists(faiss.IndexFlatIP, axs[1], trn_e_u, val_e_u, ind_e_u, ood_e_u if ood_str else None, scale="linspace")
axs[1].set_xlabel("U - IP")
run_stats["knn_v_l2"] = plot_knn_dists(faiss.IndexFlatL2, axs[2], trn_e_v, val_e_v, ind_e_v, ood_e_v if ood_str else None, scale="logspace")
axs[2].set_xlabel("V - L2")
run_stats["knn_v_ip"] = plot_knn_dists(faiss.IndexFlatIP, axs[3], trn_e_v, val_e_v, ind_e_v, ood_e_v if ood_str else None, scale="linspace")
axs[3].set_xlabel("V - IP")
plt.tight_layout()
plt.show()

In [None]:
# plot reconstruction-based ood metrics
def plot_rcn(val_rcn, ind_rcn, ood_rcn, ax, scale="linspace"):
    stats = {}
    D = ind_rcn
    if ood_str:
        D = np.concatenate([ind_rcn, ood_rcn], axis=0)
    if scale == "linspace":
        s, e = D.min(), D.max()
        bins = np.linspace(s, e, 100)
    if scale == "logspace":
        s, e = np.log10(D.min() + 1e-7), np.log10(D.max())
        bins = np.logspace(s, e, 100)
    sns.histplot(ind_rcn, label="ind", stat="probability", bins=bins, ax=ax)
    if ood_str:
        sns.histplot(ood_rcn, label="ood", stat="probability", bins=bins, ax=ax)
        T = np.concatenate([[0]*ind_rcn.shape[0],[1]*ood_rcn.shape[0]], axis=0)
        Ci = np.histogram(ind_rcn, bins, density=True)[0]
        Co = np.histogram(ood_rcn, bins, density=True)[0]
        kld = entropy(Co + 1e-7, Ci + 1e-7)
        emd = wasserstein_distance(ood_rcn, ind_rcn)
        auc = roc_auc_score(T, D)
        auc = max(auc, 1-auc)
        ax.set_title(f"KL={kld:.4f}, EMD={emd:.4f}, AUC={auc:.4f}")
        stats.update(dict(kld=kld, emd=emd, auc=auc, val_data=val_rcn.tolist(), ind_data=ind_rcn.tolist(), ood_data=ood_rcn.tolist()))
    if scale == "logspace":
        ax.set_xscale("log")
    ax.legend()
    return stats

flatten = lambda x: x.reshape((x.shape[0], -1))
unit = lambda x: x / (np.linalg.norm(x, axis=-1, keepdims=True) + 1e-7)


# training data
_val_inp, _val_rcn = flatten(val_inp), flatten(val_rcn)
_val_inp_unit, _val_rcn_unit = unit(_val_inp), unit(_val_rcn)
# metrics
val_rcn_l2 = ((_val_inp - _val_rcn) ** 2).mean(-1)
val_rcn_ip = (_val_inp_unit * _val_rcn_unit).sum(-1)

# ind test data
_ind_inp, _ind_rcn = flatten(ind_inp), flatten(ind_rcn)
_ind_inp_unit, _ind_rcn_unit = unit(_ind_inp), unit(_ind_rcn)
# metrics
ind_rcn_l2 = ((_ind_inp - _ind_rcn) ** 2).mean(-1)
ind_rcn_ip = (_ind_inp_unit * _ind_rcn_unit).sum(-1)

if ood_str:
    # ood test data
    _ood_inp, _ood_rcn = flatten(ood_inp), flatten(ood_rcn)
    _ood_inp_unit, _ood_rcn_unit = unit(_ood_inp), unit(_ood_rcn)
    # metrics
    ood_rcn_l2 = ((_ood_inp - _ood_rcn) ** 2).mean(-1)
    ood_rcn_ip = (_ood_inp_unit * _ood_rcn_unit).sum(-1)

fig, (ax1, ax2) = plt.subplots(nrows=1, ncols=2, figsize=(10, 5))
run_stats["rcn_l2"] = plot_rcn(val_rcn_l2, ind_rcn_l2, ood_rcn_l2 if ood_str else None, ax1, scale="logspace")
ax1.set_xlabel("L2")
run_stats["rcn_ip"] = plot_rcn(val_rcn_ip, ind_rcn_ip, ood_rcn_ip if ood_str else None, ax2, scale="linspace")
ax2.set_xlabel("IP")
plt.suptitle(f"Reconstruction L2 and IP (InD vs OoD) - {dataset_name} - {model_name} - {ood_str}")
plt.tight_layout()
plt.show()

In [None]:
# compute vector norms
trn_n_u = np.linalg.norm(trn_e_u, axis=-1)
trn_n_v = np.linalg.norm(trn_e_v, axis=-1)
val_n_u = np.linalg.norm(val_e_u, axis=-1)
val_n_v = np.linalg.norm(val_e_v, axis=-1)
ind_n_u = np.linalg.norm(ind_e_u, axis=-1)
ind_n_v = np.linalg.norm(ind_e_v, axis=-1)

if ood_str:
    ood_n_u = np.linalg.norm(ood_e_u, axis=-1)
    ood_n_v = np.linalg.norm(ood_e_v, axis=-1)

run_stats["norm_u"] = dict(val_data=val_n_u.tolist(), ind_data=ind_n_u.tolist(), ood_data=ood_n_u.tolist() if ood_str else None)
run_stats["norm_v"] = dict(val_data=val_n_v.tolist(), ind_data=ind_n_v.tolist(), ood_data=ood_n_v.tolist() if ood_str else None)

In [None]:
# plot pointwise ood metrics
df_trn = pd.DataFrame(dict(n_u=trn_n_u, n_v=trn_n_v, ratio=trn_n_v/trn_n_u, prod=trn_n_v*trn_n_u, target=trn_tgt))
df_val = pd.DataFrame(dict(n_u=val_n_u, n_v=val_n_v, ratio=val_n_v/val_n_u, prod=val_n_v*val_n_u, target=val_tgt))
df_ind = pd.DataFrame(dict(n_u=ind_n_u, n_v=ind_n_v, ratio=ind_n_v/ind_n_u, prod=ind_n_v*ind_n_u, target=ind_tgt))
if ood_str:
    df_ood = pd.DataFrame(dict(n_u=ood_n_u, n_v=ood_n_v, ratio=ood_n_v/ood_n_u, prod=ood_n_v*ood_n_u, target=ood_tgt))

fig, (ax1, ax2, ax3, ax4) = plt.subplots(1, 4, figsize = (15, 5))
fig.suptitle(f"Point OOD - {dataset_name} - {model_name} - {ood_str}")

def plot_row(prop, ax):
    sns.histplot(data=df_trn, x=prop, log_scale=True, fill=True, label='trn', stat='probability', ax=ax)
    sns.histplot(data=df_val, x=prop, log_scale=True, fill=True, label='val', stat='probability', ax=ax)
    sns.histplot(data=df_ind, x=prop, log_scale=True, fill=True, label='ind', stat='probability', ax=ax)
    if ood_str:
        sns.histplot(data=df_ood, x=prop, log_scale=True, fill=True, label='ood', stat='probability', ax=ax)
    ax.legend()

plot_row("n_u", ax1)
plot_row("n_v", ax2)
plot_row("ratio", ax3)
plot_row("prod", ax4)
ax1.title.set_text('||U||')
ax2.title.set_text('||V||')
ax3.title.set_text('||V||/||U||')
ax4.title.set_text('||V||*||U||')

plt.tight_layout()
plt.show()

In [None]:
# organize data by class, aggregate groupwise
if ood_str:
    df_tst = pd.concat([df_ind, df_ood], axis=0)
else:
    df_tst = df_ind

all_targets = list(df_tst['target'].unique())
K = len(all_targets)
N = 128
rw, rh = 2, 0.75
colors = sns.color_palette(n_colors=K)

pointwise_trn = {}
pointwise_val = {}
pointwise_tst = {}

groupwise_trn = {}
groupwise_val = {}
groupwise_tst = {}

for i in range(K):
    _trn = df_trn[df_trn['target'] == all_targets[i]]
    _val = df_val[df_val['target'] == all_targets[i]]
    _tst = df_tst[df_tst['target'] == all_targets[i]]
    pointwise_trn[i] = _trn.copy()
    pointwise_val[i] = _val.copy()
    pointwise_tst[i] = _tst.copy()
    groupwise_trn[i] = _trn.rolling(N).agg(['mean', 'std']).dropna().copy()
    groupwise_val[i] = _val.rolling(N).agg(['mean', 'std']).dropna().copy()
    groupwise_tst[i] = _tst.rolling(N).agg(['mean', 'std']).dropna().copy()


In [None]:
# plot per-class pointwise ood metrics
fig, axs = plt.subplots(K, 6, figsize=(6*rw, K*rh+2), sharex='col', sharey='row')
fig.suptitle(f"Point OOD - Classwise - {dataset_name} - {model_name} - {ood_str}")

for i in range(K):
    _trn = pointwise_trn[i]
    _val = pointwise_val[i]
    _tst = pointwise_tst[i]
    _tgt = all_targets[i]
    _label = config.labels[_tgt]
    _hue = colors[i]
    (ax1, ax2, ax3, ax4, ax5, ax6) = axs[i]
    ax1.set_ylabel(_label)
    if len(_trn) > 0:
        sns.histplot(data=_trn, x="n_u", fill=True, legend=False, color=_hue, stat='probability', ax=ax1)
        sns.histplot(data=_trn, x="n_v", fill=True, legend=False, color=_hue, stat='probability', ax=ax2)
    if len(_val) > 0:
        sns.histplot(data=_val, x="n_u", fill=True, legend=False, color=_hue, stat='probability', ax=ax3)
        sns.histplot(data=_val, x="n_v", fill=True, legend=False, color=_hue, stat='probability', ax=ax4)
    if len(_tst) > 0:
        sns.histplot(data=_tst, x="n_u", fill=True, legend=False, color=_hue, stat='probability', ax=ax5)
        sns.histplot(data=_tst, x="n_v", fill=True, legend=False, color=_hue, stat='probability', ax=ax6)

axs[0][0].title.set_text('|U| (trn)')
axs[0][1].title.set_text('|V| (trn)')
axs[0][2].title.set_text('|U| (val)')
axs[0][3].title.set_text('|V| (val)')
axs[0][4].title.set_text('|U| (tst)')
axs[0][5].title.set_text('|V| (tst)')

plt.tight_layout()
plt.show()

In [None]:
# plot per-class groupwise ood metrics
fig, axs = plt.subplots(K, 6, figsize = (6*rw, K*rh+2), sharex='col', sharey='row')
fig.suptitle(f"Group OOD - Classwise - {dataset_name} - {model_name} - {ood_str}")

for i in all_targets:
    _trn = groupwise_trn[i]
    _val = groupwise_val[i]
    _tst = groupwise_tst[i]
    _tgt = all_targets[i]
    _label = config.labels[_tgt]
    _hue = colors[i]
    (ax1, ax2, ax3, ax4, ax5, ax6) = axs[i]
    ax1.set_ylabel(_label)
    if len(_trn) > 0:
        sns.histplot(data=_trn.n_u, x="mean", fill=True, legend=False, color=_hue, stat='probability', ax=ax1)
        sns.histplot(data=_trn.n_v, x="mean", fill=True, legend=False, color=_hue, stat='probability', ax=ax2)
    if len(_val) > 0:
        sns.histplot(data=_val.n_u, x="mean", fill=True, legend=False, color=_hue, stat='probability', ax=ax3)
        sns.histplot(data=_val.n_v, x="mean", fill=True, legend=False, color=_hue, stat='probability', ax=ax4)
    if len(_tst) > 0:
        sns.histplot(data=_tst.n_u, x="mean", fill=True, legend=False, color=_hue, stat='probability', ax=ax5)
        sns.histplot(data=_tst.n_v, x="mean", fill=True, legend=False, color=_hue, stat='probability', ax=ax6)

axs[0][0].title.set_text('|U| (trn)')
axs[0][1].title.set_text('|V| (trn)')
axs[0][2].title.set_text('|U| (val)')
axs[0][3].title.set_text('|V| (val)')
axs[0][4].title.set_text('|U| (tst)')
axs[0][5].title.set_text('|V| (tst)')

plt.tight_layout()
plt.show()

In [None]:
run_stats.update(dict(dataset_name=dataset_name, model_name=model_name, ood=ood))
import gzip
import pickle
with gzip.open(f"{save_name}_stats.gz", "wb") as f:
    pickle.dump(run_stats, f)