In [5]:
import numpy as np
import pandas as pd  
import os
import glob
from tqdm import tqdm
from collections import defaultdict
import matplotlib.pyplot as plt

import torch
from torch import nn
from torch.utils.data import DataLoader

from utils import NPR,\
                  l1_normalized_error,\
                  KNN_MAE,\
                  calculate_Q_mae,\
                  l1_normalized_error_torch
                
from sklearn.model_selection import train_test_split

In [3]:
intrinsic_dims = np.load(f'./intrinsic_dims_pca_strict.npy', allow_pickle=True).item()

data_pca = {}
for dataset_name in tqdm(['AGP', 'HMP']):
    for tax in ['o', 'f', 'g']: 
        label = f'{dataset_name}_{tax}'
        data_pca[label] = np.genfromtxt(f'./results/pca/{label}', delimiter=';')
        
data_orig = {}
for dataset_name in tqdm(['AGP', 'HMP']):
    for tax in ['o', 'f', 'g']: 
        dataframe = pd.read_csv(f'./data_processed/{dataset_name}_{tax}.csv', sep=',')
        label = f'{dataset_name}_{tax}'
        data_orig[label] = dataframe.drop('Unnamed: 0', axis=1).values
        
embeddings_root = f'./results/embeddings/'
os.makedirs(embeddings_root, exist_ok=True)

In [6]:
# uncomment to use synthetic data

intrinsic_dims = np.load(f'./intrinsic_dims_pca_strict_synthetic.npy', allow_pickle=True).item()

data_orig = {}
for path in glob.glob('data_processed/synthetic/*'):
    dataframe = pd.read_csv(path, index_col=0)
    label = path.split('/')[-1].split('.')[0]
    data_orig[label] = dataframe.values

data_pca = {}
for path in tqdm(glob.glob('./results/pca/synthetic/*')):
    label = path.split('/')[-1]
    data_pca[label] = np.genfromtxt(path, delimiter = ';')

    
embeddings_root = 'results/embeddings_synthetic'
os.makedirs(embeddings_root, exist_ok=True)

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:02<00:00,  3.11it/s]


# Model

In [7]:
class AE(nn.Module):
    def __init__(self, input_dim, z_dim, config):
        hidden_dim = config['hidden_dim']
        dropout_rate1 = config['dropout_rate1']
        dropout_rate2 = config['dropout_rate2']
        dropout_rate3 = config['dropout_rate3']

        dropout_rate4 = config['dropout_rate4']
        dropout_rate5 = config['dropout_rate5']
        dropout_rate6 = config['dropout_rate6']
        
        super().__init__()
        self.input_dim = input_dim
        self.z_dim = z_dim
        self.encoder = nn.Sequential(nn.Linear(input_dim, hidden_dim),
                                    nn.BatchNorm1d(hidden_dim),
                                    nn.LeakyReLU(),
                                     
                                    nn.Linear(hidden_dim, hidden_dim),
                                    nn.BatchNorm1d(hidden_dim),
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate1), 
                                     
                                    nn.Linear(hidden_dim, hidden_dim//2),
                                    nn.BatchNorm1d(hidden_dim//2), 
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate2),
                                     
                                    nn.Linear(hidden_dim//2, hidden_dim//4),
                                    nn.BatchNorm1d(hidden_dim//4),
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate3), 
                                    nn.Linear(hidden_dim//4, z_dim))
        
        self.decoder = nn.Sequential(nn.Linear(z_dim, hidden_dim//4),
                                    nn.BatchNorm1d(hidden_dim//4),
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate4),
                                     
                                    nn.Linear(hidden_dim//4, hidden_dim//2),
                                    nn.BatchNorm1d(hidden_dim//2),
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate5), 
                                     
                                    nn.Linear(hidden_dim//2, hidden_dim),
                                    nn.BatchNorm1d(hidden_dim), 
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate6),
                                     
                                    nn.Linear(hidden_dim, hidden_dim),
                                    nn.BatchNorm1d(hidden_dim),
                                    nn.LeakyReLU(),
                                    nn.Linear(hidden_dim, input_dim))
    def forward(self, X):
        Z = self.encoder(X)
        X = self.decoder(Z)
        return Z,X


In [8]:
def train_ae(ae,
             opt,
             X,
             n_epochs=6000,
             calc_npr=True, 
             npr_calc_step=100):

    X_train, X_test = train_test_split(X)
    X_tensor = torch.tensor(X, dtype=torch.float).cuda()
        
    X_train_tensor = torch.tensor(X_train, dtype=torch.float).cuda()
    X_test_tensor = torch.tensor(X_test, dtype=torch.float).cuda()
    
    torch.manual_seed(42)
    results = defaultdict(list)
    loss_val_min = np.inf

    for i in tqdm(range(n_epochs)):
        #########
        # TRAIN #
        #########
        ae.train()
        # add noise to the input
        ae_input = X_train_tensor + 1e-2*torch.randn_like(X_train_tensor).cuda() # Add noise
        embedding, data_rec = ae(ae_input)
        
        if i%npr_calc_step==0 and calc_npr:
            results['npr_train'].append(NPR(data_train, 
                                        embedding.detach().cpu().numpy()))

        opt.zero_grad()
        loss = l1_normalized_error_torch(X_train_tensor, data_rec).mean() # mean of loss
        loss.backward()
        opt.step()

        results['loss_train'].append(loss.item())

        ##############
        # VALIDATION #
        ##############
        ae.eval()
        with torch.no_grad():
            embedding_, data_rec_test = ae(X_test_tensor)
            loss_ = l1_normalized_error_torch(X_test_tensor, data_rec_test).mean()
            results['loss_val'].append(loss_.item())

            if results['loss_val'][-1] < loss_val_min:
                loss_val_min = results['loss_val'][-1]
                torch.save(ae.state_dict(), 'best_weights')
            
        if i%npr_calc_step==0 and calc_npr:
            results['npr_val'].append(NPR(data_test, 
                                      embedding_.detach().cpu().numpy()))

        # KNN MAE
        Z, _ = ae(X_tensor)
        results['knn_maes'].append(KNN_MAE(X,Z.detach().cpu().numpy(), 
                                           weights='distance', 
                                           averaging='median'))
        
    ae.load_state_dict(torch.load('best_weights'))
    Z, _ = ae(X_tensor)
    
    return Z.detach().cpu().numpy(), ae, opt, results

# Train

In [None]:
config = {'hidden_dim': 1024,
        'dropout_rate1': 0.05,#encoder
        'dropout_rate2': 0.1,#encoder
        'dropout_rate3': 0.1,#encoder
        'dropout_rate4': 0.1,#decoder
        'dropout_rate5': 0.1,#decoder
        'dropout_rate6': 0.05}#decoder

ae_results = {}
ae_embeddings = {}

for label,X in tqdm(data_pca.items()):
    intrinsic_dim = intrinsic_dims[label]


    ae = AE(X.shape[1],
            intrinsic_dim,
            config).cuda()

    opt = torch.optim.Adam(ae.parameters(), 
                            lr=5e-4, 
                            weight_decay=1e-5) 

    Z, ae, opt, results = train_ae(ae,
                                    opt,
                                    X,
                                    n_epochs=5000,
                                    calc_npr=False)
    
    ae_results[label] = [ae, opt, results]
    ae_embeddings[label] = Z.detach().cpu().numpy()

  0%|                                                                                                                                                  | 0/9 [00:00<?, ?it/s]
  0%|                                                                                                                                               | 0/5000 [00:00<?, ?it/s][A
  0%|                                                                                                                                     | 1/5000 [00:05<7:48:00,  5.62s/it][A
  0%|                                                                                                                                     | 2/5000 [00:05<3:30:36,  2.53s/it][A
  0%|                                                                                                                                     | 3/5000 [00:06<2:09:45,  1.56s/it][A
  0%|                                                                                                                 

  1%|█▏                                                                                                                                    | 45/5000 [00:22<33:26,  2.47it/s][A
  1%|█▏                                                                                                                                    | 46/5000 [00:23<32:17,  2.56it/s][A
  1%|█▎                                                                                                                                    | 47/5000 [00:23<31:29,  2.62it/s][A
  1%|█▎                                                                                                                                    | 48/5000 [00:24<30:56,  2.67it/s][A
  1%|█▎                                                                                                                                    | 49/5000 [00:24<30:43,  2.69it/s][A
  1%|█▎                                                                                                            

  2%|██▍                                                                                                                                   | 91/5000 [00:41<28:10,  2.90it/s][A
  2%|██▍                                                                                                                                   | 92/5000 [00:41<27:55,  2.93it/s][A
  2%|██▍                                                                                                                                   | 93/5000 [00:41<26:49,  3.05it/s][A
  2%|██▌                                                                                                                                   | 94/5000 [00:42<26:34,  3.08it/s][A
  2%|██▌                                                                                                                                   | 95/5000 [00:42<26:24,  3.10it/s][A
  2%|██▌                                                                                                           

  3%|███▋                                                                                                                                 | 137/5000 [00:56<27:28,  2.95it/s][A
  3%|███▋                                                                                                                                 | 138/5000 [00:57<27:11,  2.98it/s][A
  3%|███▋                                                                                                                                 | 139/5000 [00:57<26:50,  3.02it/s][A
  3%|███▋                                                                                                                                 | 140/5000 [00:57<26:30,  3.06it/s][A
  3%|███▊                                                                                                                                 | 141/5000 [00:58<26:22,  3.07it/s][A
  3%|███▊                                                                                                          

  4%|████▊                                                                                                                                | 183/5000 [01:12<26:18,  3.05it/s][A
  4%|████▉                                                                                                                                | 184/5000 [01:12<25:43,  3.12it/s][A
  4%|████▉                                                                                                                                | 185/5000 [01:12<25:40,  3.13it/s][A
  4%|████▉                                                                                                                                | 186/5000 [01:13<25:46,  3.11it/s][A
  4%|████▉                                                                                                                                | 187/5000 [01:13<25:44,  3.12it/s][A
  4%|█████                                                                                                         

  5%|██████                                                                                                                               | 229/5000 [01:27<27:38,  2.88it/s][A
  5%|██████                                                                                                                               | 230/5000 [01:27<27:16,  2.92it/s][A
  5%|██████▏                                                                                                                              | 231/5000 [01:28<26:38,  2.98it/s][A
  5%|██████▏                                                                                                                              | 232/5000 [01:28<26:08,  3.04it/s][A
  5%|██████▏                                                                                                                              | 233/5000 [01:28<25:49,  3.08it/s][A
  5%|██████▏                                                                                                       

  6%|███████▎                                                                                                                             | 275/5000 [01:42<25:25,  3.10it/s][A
  6%|███████▎                                                                                                                             | 276/5000 [01:42<25:44,  3.06it/s][A
  6%|███████▎                                                                                                                             | 277/5000 [01:42<25:36,  3.07it/s][A
  6%|███████▍                                                                                                                             | 278/5000 [01:43<25:40,  3.06it/s][A
  6%|███████▍                                                                                                                             | 279/5000 [01:43<25:45,  3.06it/s][A
  6%|███████▍                                                                                                      

  6%|████████▌                                                                                                                            | 321/5000 [01:56<23:12,  3.36it/s][A
  6%|████████▌                                                                                                                            | 322/5000 [01:57<23:11,  3.36it/s][A
  6%|████████▌                                                                                                                            | 323/5000 [01:57<23:39,  3.29it/s][A
  6%|████████▌                                                                                                                            | 324/5000 [01:57<24:00,  3.25it/s][A
  6%|████████▋                                                                                                                            | 325/5000 [01:58<24:20,  3.20it/s][A
  7%|████████▋                                                                                                     

  7%|█████████▊                                                                                                                           | 367/5000 [02:11<24:33,  3.15it/s][A
  7%|█████████▊                                                                                                                           | 368/5000 [02:12<24:33,  3.14it/s][A
  7%|█████████▊                                                                                                                           | 369/5000 [02:12<24:30,  3.15it/s][A
  7%|█████████▊                                                                                                                           | 370/5000 [02:12<24:32,  3.14it/s][A
  7%|█████████▊                                                                                                                           | 371/5000 [02:13<24:36,  3.13it/s][A
  7%|█████████▉                                                                                                    

  8%|██████████▉                                                                                                                          | 413/5000 [02:27<27:10,  2.81it/s][A
  8%|███████████                                                                                                                          | 414/5000 [02:27<26:14,  2.91it/s][A
  8%|███████████                                                                                                                          | 415/5000 [02:28<25:38,  2.98it/s][A
  8%|███████████                                                                                                                          | 416/5000 [02:28<25:12,  3.03it/s][A
  8%|███████████                                                                                                                          | 417/5000 [02:28<24:54,  3.07it/s][A
  8%|███████████                                                                                                   

  9%|████████████▏                                                                                                                        | 459/5000 [02:42<26:55,  2.81it/s][A
  9%|████████████▏                                                                                                                        | 460/5000 [02:42<26:04,  2.90it/s][A
  9%|████████████▎                                                                                                                        | 461/5000 [02:43<25:29,  2.97it/s][A
  9%|████████████▎                                                                                                                        | 462/5000 [02:43<25:18,  2.99it/s][A
  9%|████████████▎                                                                                                                        | 463/5000 [02:43<25:20,  2.98it/s][A
  9%|████████████▎                                                                                                 

 10%|█████████████▍                                                                                                                       | 505/5000 [02:57<24:15,  3.09it/s][A
 10%|█████████████▍                                                                                                                       | 506/5000 [02:58<24:13,  3.09it/s][A
 10%|█████████████▍                                                                                                                       | 507/5000 [02:58<24:14,  3.09it/s][A
 10%|█████████████▌                                                                                                                       | 508/5000 [02:58<24:13,  3.09it/s][A
 10%|█████████████▌                                                                                                                       | 509/5000 [02:58<24:28,  3.06it/s][A
 10%|█████████████▌                                                                                                

 11%|██████████████▋                                                                                                                      | 551/5000 [03:12<24:14,  3.06it/s][A
 11%|██████████████▋                                                                                                                      | 552/5000 [03:13<24:10,  3.07it/s][A
 11%|██████████████▋                                                                                                                      | 553/5000 [03:13<24:07,  3.07it/s][A
 11%|██████████████▋                                                                                                                      | 554/5000 [03:13<24:06,  3.07it/s][A
 11%|██████████████▊                                                                                                                      | 555/5000 [03:14<24:06,  3.07it/s][A
 11%|██████████████▊                                                                                               

 12%|███████████████▉                                                                                                                     | 597/5000 [03:28<23:42,  3.10it/s][A
 12%|███████████████▉                                                                                                                     | 598/5000 [03:28<23:47,  3.08it/s][A
 12%|███████████████▉                                                                                                                     | 599/5000 [03:28<23:43,  3.09it/s][A
 12%|███████████████▉                                                                                                                     | 600/5000 [03:29<23:42,  3.09it/s][A
 12%|███████████████▉                                                                                                                     | 601/5000 [03:29<23:44,  3.09it/s][A
 12%|████████████████                                                                                              

 13%|█████████████████                                                                                                                    | 643/5000 [03:43<23:23,  3.10it/s][A
 13%|█████████████████▏                                                                                                                   | 644/5000 [03:44<23:27,  3.09it/s][A
 13%|█████████████████▏                                                                                                                   | 645/5000 [03:44<24:58,  2.91it/s][A
 13%|█████████████████▏                                                                                                                   | 646/5000 [03:44<24:54,  2.91it/s][A
 13%|█████████████████▏                                                                                                                   | 647/5000 [03:45<26:08,  2.78it/s][A
 13%|█████████████████▏                                                                                            

 14%|██████████████████▎                                                                                                                  | 689/5000 [03:59<23:10,  3.10it/s][A
 14%|██████████████████▎                                                                                                                  | 690/5000 [04:00<23:12,  3.10it/s][A
 14%|██████████████████▍                                                                                                                  | 691/5000 [04:00<23:07,  3.11it/s][A
 14%|██████████████████▍                                                                                                                  | 692/5000 [04:00<23:05,  3.11it/s][A
 14%|██████████████████▍                                                                                                                  | 693/5000 [04:00<23:06,  3.11it/s][A
 14%|██████████████████▍                                                                                           

 15%|███████████████████▌                                                                                                                 | 735/5000 [04:15<23:18,  3.05it/s][A
 15%|███████████████████▌                                                                                                                 | 736/5000 [04:15<23:23,  3.04it/s][A
 15%|███████████████████▌                                                                                                                 | 737/5000 [04:15<23:22,  3.04it/s][A
 15%|███████████████████▋                                                                                                                 | 738/5000 [04:16<23:27,  3.03it/s][A
 15%|███████████████████▋                                                                                                                 | 739/5000 [04:16<23:25,  3.03it/s][A
 15%|███████████████████▋                                                                                          

 16%|████████████████████▊                                                                                                                | 781/5000 [04:31<27:47,  2.53it/s][A
 16%|████████████████████▊                                                                                                                | 782/5000 [04:31<28:17,  2.48it/s][A
 16%|████████████████████▊                                                                                                                | 783/5000 [04:32<28:16,  2.49it/s][A
 16%|████████████████████▊                                                                                                                | 784/5000 [04:32<26:36,  2.64it/s][A
 16%|████████████████████▉                                                                                                                | 785/5000 [04:33<25:45,  2.73it/s][A
 16%|████████████████████▉                                                                                         

 17%|█████████████████████▉                                                                                                               | 827/5000 [04:47<27:49,  2.50it/s][A
 17%|██████████████████████                                                                                                               | 828/5000 [04:48<25:35,  2.72it/s][A
 17%|██████████████████████                                                                                                               | 829/5000 [04:48<27:35,  2.52it/s][A
 17%|██████████████████████                                                                                                               | 830/5000 [04:49<28:22,  2.45it/s][A
 17%|██████████████████████                                                                                                               | 831/5000 [04:49<28:45,  2.42it/s][A
 17%|██████████████████████▏                                                                                       

 17%|███████████████████████▏                                                                                                             | 873/5000 [05:04<24:43,  2.78it/s][A
 17%|███████████████████████▏                                                                                                             | 874/5000 [05:04<26:56,  2.55it/s][A
 18%|███████████████████████▎                                                                                                             | 875/5000 [05:05<27:56,  2.46it/s][A
 18%|███████████████████████▎                                                                                                             | 876/5000 [05:05<26:46,  2.57it/s][A
 18%|███████████████████████▎                                                                                                             | 877/5000 [05:05<27:25,  2.51it/s][A
 18%|███████████████████████▎                                                                                      

 18%|████████████████████████▍                                                                                                            | 919/5000 [05:19<21:31,  3.16it/s][A
 18%|████████████████████████▍                                                                                                            | 920/5000 [05:20<21:52,  3.11it/s][A
 18%|████████████████████████▍                                                                                                            | 921/5000 [05:20<21:44,  3.13it/s][A
 18%|████████████████████████▌                                                                                                            | 922/5000 [05:20<20:53,  3.25it/s][A
 18%|████████████████████████▌                                                                                                            | 923/5000 [05:21<21:23,  3.18it/s][A
 18%|████████████████████████▌                                                                                     

 19%|█████████████████████████▋                                                                                                           | 965/5000 [05:36<22:14,  3.02it/s][A
 19%|█████████████████████████▋                                                                                                           | 966/5000 [05:36<22:08,  3.04it/s][A
 19%|█████████████████████████▋                                                                                                           | 967/5000 [05:36<22:00,  3.05it/s][A
 19%|█████████████████████████▋                                                                                                           | 968/5000 [05:37<21:58,  3.06it/s][A
 19%|█████████████████████████▊                                                                                                           | 969/5000 [05:37<21:55,  3.06it/s][A
 19%|█████████████████████████▊                                                                                    

 20%|██████████████████████████▋                                                                                                         | 1011/5000 [05:51<22:02,  3.02it/s][A
 20%|██████████████████████████▋                                                                                                         | 1012/5000 [05:51<21:52,  3.04it/s][A
 20%|██████████████████████████▋                                                                                                         | 1013/5000 [05:52<21:54,  3.03it/s][A
 20%|██████████████████████████▊                                                                                                         | 1014/5000 [05:52<21:46,  3.05it/s][A
 20%|██████████████████████████▊                                                                                                         | 1015/5000 [05:52<21:43,  3.06it/s][A
 20%|██████████████████████████▊                                                                                   

 21%|███████████████████████████▉                                                                                                        | 1057/5000 [06:07<21:51,  3.01it/s][A
 21%|███████████████████████████▉                                                                                                        | 1058/5000 [06:07<21:41,  3.03it/s][A
 21%|███████████████████████████▉                                                                                                        | 1059/5000 [06:07<21:38,  3.04it/s][A
 21%|███████████████████████████▉                                                                                                        | 1060/5000 [06:08<21:33,  3.05it/s][A
 21%|████████████████████████████                                                                                                        | 1061/5000 [06:08<21:31,  3.05it/s][A
 21%|████████████████████████████                                                                                  

 22%|█████████████████████████████                                                                                                       | 1103/5000 [06:22<21:10,  3.07it/s][A
 22%|█████████████████████████████▏                                                                                                      | 1104/5000 [06:22<21:09,  3.07it/s][A
 22%|█████████████████████████████▏                                                                                                      | 1105/5000 [06:22<21:30,  3.02it/s][A
 22%|█████████████████████████████▏                                                                                                      | 1106/5000 [06:23<21:29,  3.02it/s][A
 22%|█████████████████████████████▏                                                                                                      | 1107/5000 [06:23<21:20,  3.04it/s][A
 22%|█████████████████████████████▎                                                                                

 23%|██████████████████████████████▎                                                                                                     | 1149/5000 [06:37<22:28,  2.86it/s][A
 23%|██████████████████████████████▎                                                                                                     | 1150/5000 [06:37<22:08,  2.90it/s][A
 23%|██████████████████████████████▍                                                                                                     | 1151/5000 [06:37<21:50,  2.94it/s][A
 23%|██████████████████████████████▍                                                                                                     | 1152/5000 [06:38<21:24,  3.00it/s][A
 23%|██████████████████████████████▍                                                                                                     | 1153/5000 [06:38<21:09,  3.03it/s][A
 23%|██████████████████████████████▍                                                                               

 24%|███████████████████████████████▌                                                                                                    | 1195/5000 [06:52<21:15,  2.98it/s][A
 24%|███████████████████████████████▌                                                                                                    | 1196/5000 [06:52<21:46,  2.91it/s][A
 24%|███████████████████████████████▌                                                                                                    | 1197/5000 [06:53<22:32,  2.81it/s][A
 24%|███████████████████████████████▋                                                                                                    | 1198/5000 [06:53<22:12,  2.85it/s][A
 24%|███████████████████████████████▋                                                                                                    | 1199/5000 [06:53<21:47,  2.91it/s][A
 24%|███████████████████████████████▋                                                                              

 25%|████████████████████████████████▊                                                                                                   | 1241/5000 [07:07<20:21,  3.08it/s][A
 25%|████████████████████████████████▊                                                                                                   | 1242/5000 [07:07<20:21,  3.08it/s][A
 25%|████████████████████████████████▊                                                                                                   | 1243/5000 [07:08<20:22,  3.07it/s][A
 25%|████████████████████████████████▊                                                                                                   | 1244/5000 [07:08<20:21,  3.07it/s][A
 25%|████████████████████████████████▊                                                                                                   | 1245/5000 [07:08<21:10,  2.96it/s][A
 25%|████████████████████████████████▉                                                                             

 26%|█████████████████████████████████▉                                                                                                  | 1287/5000 [07:22<19:49,  3.12it/s][A
 26%|██████████████████████████████████                                                                                                  | 1288/5000 [07:22<20:12,  3.06it/s][A
 26%|██████████████████████████████████                                                                                                  | 1289/5000 [07:23<20:09,  3.07it/s][A
 26%|██████████████████████████████████                                                                                                  | 1290/5000 [07:23<20:07,  3.07it/s][A
 26%|██████████████████████████████████                                                                                                  | 1291/5000 [07:23<20:20,  3.04it/s][A
 26%|██████████████████████████████████                                                                            

 27%|███████████████████████████████████▏                                                                                                | 1333/5000 [07:37<19:38,  3.11it/s][A
 27%|███████████████████████████████████▏                                                                                                | 1334/5000 [07:37<19:43,  3.10it/s][A
 27%|███████████████████████████████████▏                                                                                                | 1335/5000 [07:38<19:47,  3.09it/s][A
 27%|███████████████████████████████████▎                                                                                                | 1336/5000 [07:38<19:47,  3.09it/s][A
 27%|███████████████████████████████████▎                                                                                                | 1337/5000 [07:38<19:48,  3.08it/s][A
 27%|███████████████████████████████████▎                                                                          

 28%|████████████████████████████████████▍                                                                                               | 1379/5000 [07:52<21:30,  2.81it/s][A
 28%|████████████████████████████████████▍                                                                                               | 1380/5000 [07:53<21:43,  2.78it/s][A
 28%|████████████████████████████████████▍                                                                                               | 1381/5000 [07:53<21:40,  2.78it/s][A
 28%|████████████████████████████████████▍                                                                                               | 1382/5000 [07:53<21:01,  2.87it/s][A
 28%|████████████████████████████████████▌                                                                                               | 1383/5000 [07:54<20:33,  2.93it/s][A
 28%|████████████████████████████████████▌                                                                         

 28%|█████████████████████████████████████▌                                                                                              | 1425/5000 [08:08<19:09,  3.11it/s][A
 29%|█████████████████████████████████████▋                                                                                              | 1426/5000 [08:08<19:09,  3.11it/s][A
 29%|█████████████████████████████████████▋                                                                                              | 1427/5000 [08:08<19:09,  3.11it/s][A
 29%|█████████████████████████████████████▋                                                                                              | 1428/5000 [08:09<19:09,  3.11it/s][A
 29%|█████████████████████████████████████▋                                                                                              | 1429/5000 [08:09<19:10,  3.10it/s][A
 29%|█████████████████████████████████████▊                                                                        

 29%|██████████████████████████████████████▊                                                                                             | 1471/5000 [08:23<22:21,  2.63it/s][A
 29%|██████████████████████████████████████▊                                                                                             | 1472/5000 [08:23<21:18,  2.76it/s][A
 29%|██████████████████████████████████████▉                                                                                             | 1473/5000 [08:24<20:40,  2.84it/s][A
 29%|██████████████████████████████████████▉                                                                                             | 1474/5000 [08:24<20:49,  2.82it/s][A
 30%|██████████████████████████████████████▉                                                                                             | 1475/5000 [08:25<21:21,  2.75it/s][A
 30%|██████████████████████████████████████▉                                                                       

 30%|████████████████████████████████████████                                                                                            | 1517/5000 [08:39<18:39,  3.11it/s][A
 30%|████████████████████████████████████████                                                                                            | 1518/5000 [08:39<18:37,  3.12it/s][A
 30%|████████████████████████████████████████                                                                                            | 1519/5000 [08:40<18:36,  3.12it/s][A
 30%|████████████████████████████████████████▏                                                                                           | 1520/5000 [08:40<18:41,  3.10it/s][A
 30%|████████████████████████████████████████▏                                                                                           | 1521/5000 [08:40<18:40,  3.11it/s][A
 30%|████████████████████████████████████████▏                                                                     

 31%|█████████████████████████████████████████▎                                                                                          | 1563/5000 [08:54<18:13,  3.14it/s][A
 31%|█████████████████████████████████████████▎                                                                                          | 1564/5000 [08:55<18:14,  3.14it/s][A
 31%|█████████████████████████████████████████▎                                                                                          | 1565/5000 [08:55<18:16,  3.13it/s][A
 31%|█████████████████████████████████████████▎                                                                                          | 1566/5000 [08:55<18:17,  3.13it/s][A
 31%|█████████████████████████████████████████▎                                                                                          | 1567/5000 [08:56<18:28,  3.10it/s][A
 31%|█████████████████████████████████████████▍                                                                    

 32%|██████████████████████████████████████████▍                                                                                         | 1609/5000 [09:11<25:16,  2.24it/s][A
 32%|██████████████████████████████████████████▌                                                                                         | 1610/5000 [09:11<23:08,  2.44it/s][A
 32%|██████████████████████████████████████████▌                                                                                         | 1611/5000 [09:11<23:01,  2.45it/s][A
 32%|██████████████████████████████████████████▌                                                                                         | 1612/5000 [09:12<21:54,  2.58it/s][A
 32%|██████████████████████████████████████████▌                                                                                         | 1613/5000 [09:12<21:54,  2.58it/s][A
 32%|██████████████████████████████████████████▌                                                                   

 33%|███████████████████████████████████████████▋                                                                                        | 1655/5000 [09:27<18:11,  3.06it/s][A
 33%|███████████████████████████████████████████▋                                                                                        | 1656/5000 [09:27<18:07,  3.07it/s][A
 33%|███████████████████████████████████████████▋                                                                                        | 1657/5000 [09:28<18:05,  3.08it/s][A
 33%|███████████████████████████████████████████▊                                                                                        | 1658/5000 [09:28<18:03,  3.08it/s][A
 33%|███████████████████████████████████████████▊                                                                                        | 1659/5000 [09:28<18:03,  3.08it/s][A
 33%|███████████████████████████████████████████▊                                                                  

 34%|████████████████████████████████████████████▉                                                                                       | 1701/5000 [09:42<18:29,  2.97it/s][A
 34%|████████████████████████████████████████████▉                                                                                       | 1702/5000 [09:42<18:22,  2.99it/s][A
 34%|████████████████████████████████████████████▉                                                                                       | 1703/5000 [09:43<18:20,  3.00it/s][A
 34%|████████████████████████████████████████████▉                                                                                       | 1704/5000 [09:43<18:16,  3.01it/s][A
 34%|█████████████████████████████████████████████                                                                                       | 1705/5000 [09:43<18:20,  3.00it/s][A
 34%|█████████████████████████████████████████████                                                                 

 35%|██████████████████████████████████████████████                                                                                      | 1747/5000 [09:58<17:41,  3.06it/s][A
 35%|██████████████████████████████████████████████▏                                                                                     | 1748/5000 [09:58<17:41,  3.06it/s][A
 35%|██████████████████████████████████████████████▏                                                                                     | 1749/5000 [09:58<17:41,  3.06it/s][A
 35%|██████████████████████████████████████████████▏                                                                                     | 1750/5000 [09:59<17:40,  3.06it/s][A
 35%|██████████████████████████████████████████████▏                                                                                     | 1751/5000 [09:59<17:42,  3.06it/s][A
 35%|██████████████████████████████████████████████▎                                                               

 36%|███████████████████████████████████████████████▎                                                                                    | 1793/5000 [10:13<17:13,  3.10it/s][A
 36%|███████████████████████████████████████████████▎                                                                                    | 1794/5000 [10:14<17:10,  3.11it/s][A
 36%|███████████████████████████████████████████████▍                                                                                    | 1795/5000 [10:14<17:09,  3.11it/s][A
 36%|███████████████████████████████████████████████▍                                                                                    | 1796/5000 [10:14<17:09,  3.11it/s][A
 36%|███████████████████████████████████████████████▍                                                                                    | 1797/5000 [10:15<17:10,  3.11it/s][A
 36%|███████████████████████████████████████████████▍                                                              

 37%|████████████████████████████████████████████████▌                                                                                   | 1839/5000 [10:29<17:20,  3.04it/s][A
 37%|████████████████████████████████████████████████▌                                                                                   | 1840/5000 [10:29<17:18,  3.04it/s][A
 37%|████████████████████████████████████████████████▌                                                                                   | 1841/5000 [10:30<17:14,  3.05it/s][A
 37%|████████████████████████████████████████████████▋                                                                                   | 1842/5000 [10:30<17:12,  3.06it/s][A
 37%|████████████████████████████████████████████████▋                                                                                   | 1843/5000 [10:30<17:10,  3.06it/s][A
 37%|████████████████████████████████████████████████▋                                                             

 38%|█████████████████████████████████████████████████▊                                                                                  | 1885/5000 [10:44<19:15,  2.70it/s][A
 38%|█████████████████████████████████████████████████▊                                                                                  | 1886/5000 [10:45<18:43,  2.77it/s][A
 38%|█████████████████████████████████████████████████▊                                                                                  | 1887/5000 [10:45<18:14,  2.84it/s][A
 38%|█████████████████████████████████████████████████▊                                                                                  | 1888/5000 [10:45<17:47,  2.92it/s][A
 38%|█████████████████████████████████████████████████▊                                                                                  | 1889/5000 [10:46<17:39,  2.94it/s][A
 38%|█████████████████████████████████████████████████▉                                                            

 39%|██████████████████████████████████████████████████▉                                                                                 | 1931/5000 [11:01<16:53,  3.03it/s][A
 39%|███████████████████████████████████████████████████                                                                                 | 1932/5000 [11:01<16:51,  3.03it/s][A
 39%|███████████████████████████████████████████████████                                                                                 | 1933/5000 [11:01<16:50,  3.04it/s][A
 39%|███████████████████████████████████████████████████                                                                                 | 1934/5000 [11:01<16:47,  3.04it/s][A
 39%|███████████████████████████████████████████████████                                                                                 | 1935/5000 [11:02<16:45,  3.05it/s][A
 39%|███████████████████████████████████████████████████                                                           

 40%|████████████████████████████████████████████████████▏                                                                               | 1977/5000 [11:17<19:40,  2.56it/s][A
 40%|████████████████████████████████████████████████████▏                                                                               | 1978/5000 [11:17<19:13,  2.62it/s][A
 40%|████████████████████████████████████████████████████▏                                                                               | 1979/5000 [11:17<18:15,  2.76it/s][A
 40%|████████████████████████████████████████████████████▎                                                                               | 1980/5000 [11:18<17:36,  2.86it/s][A
 40%|████████████████████████████████████████████████████▎                                                                               | 1981/5000 [11:18<17:12,  2.92it/s][A
 40%|████████████████████████████████████████████████████▎                                                         

 40%|█████████████████████████████████████████████████████▍                                                                              | 2023/5000 [11:32<16:24,  3.02it/s][A
 40%|█████████████████████████████████████████████████████▍                                                                              | 2024/5000 [11:32<16:18,  3.04it/s][A
 40%|█████████████████████████████████████████████████████▍                                                                              | 2025/5000 [11:33<16:15,  3.05it/s][A
 41%|█████████████████████████████████████████████████████▍                                                                              | 2026/5000 [11:33<16:14,  3.05it/s][A
 41%|█████████████████████████████████████████████████████▌                                                                              | 2027/5000 [11:33<16:13,  3.05it/s][A
 41%|█████████████████████████████████████████████████████▌                                                        

 41%|██████████████████████████████████████████████████████▌                                                                             | 2069/5000 [11:47<17:00,  2.87it/s][A
 41%|██████████████████████████████████████████████████████▋                                                                             | 2070/5000 [11:48<16:43,  2.92it/s][A
 41%|██████████████████████████████████████████████████████▋                                                                             | 2071/5000 [11:48<16:27,  2.97it/s][A
 41%|██████████████████████████████████████████████████████▋                                                                             | 2072/5000 [11:48<16:19,  2.99it/s][A
 41%|██████████████████████████████████████████████████████▋                                                                             | 2073/5000 [11:49<16:14,  3.00it/s][A
 41%|██████████████████████████████████████████████████████▊                                                       

 42%|███████████████████████████████████████████████████████▊                                                                            | 2115/5000 [12:02<15:34,  3.09it/s][A
 42%|███████████████████████████████████████████████████████▊                                                                            | 2116/5000 [12:03<15:36,  3.08it/s][A
 42%|███████████████████████████████████████████████████████▉                                                                            | 2117/5000 [12:03<15:35,  3.08it/s][A
 42%|███████████████████████████████████████████████████████▉                                                                            | 2118/5000 [12:03<15:35,  3.08it/s][A
 42%|███████████████████████████████████████████████████████▉                                                                            | 2119/5000 [12:04<15:38,  3.07it/s][A
 42%|███████████████████████████████████████████████████████▉                                                      

 43%|█████████████████████████████████████████████████████████                                                                           | 2161/5000 [12:17<15:18,  3.09it/s][A
 43%|█████████████████████████████████████████████████████████                                                                           | 2162/5000 [12:18<15:24,  3.07it/s][A
 43%|█████████████████████████████████████████████████████████                                                                           | 2163/5000 [12:18<15:21,  3.08it/s][A
 43%|█████████████████████████████████████████████████████████▏                                                                          | 2164/5000 [12:18<15:20,  3.08it/s][A
 43%|█████████████████████████████████████████████████████████▏                                                                          | 2165/5000 [12:19<15:20,  3.08it/s][A
 43%|█████████████████████████████████████████████████████████▏                                                    

 44%|██████████████████████████████████████████████████████████▎                                                                         | 2207/5000 [12:33<16:00,  2.91it/s][A
 44%|██████████████████████████████████████████████████████████▎                                                                         | 2208/5000 [12:33<16:32,  2.81it/s][A
 44%|██████████████████████████████████████████████████████████▎                                                                         | 2209/5000 [12:33<16:11,  2.87it/s][A
 44%|██████████████████████████████████████████████████████████▎                                                                         | 2210/5000 [12:34<15:53,  2.93it/s][A
 44%|██████████████████████████████████████████████████████████▎                                                                         | 2211/5000 [12:34<15:36,  2.98it/s][A
 44%|██████████████████████████████████████████████████████████▍                                                   

 45%|███████████████████████████████████████████████████████████▍                                                                        | 2253/5000 [12:48<14:59,  3.05it/s][A
 45%|███████████████████████████████████████████████████████████▌                                                                        | 2254/5000 [12:48<16:16,  2.81it/s][A
 45%|███████████████████████████████████████████████████████████▌                                                                        | 2255/5000 [12:48<16:00,  2.86it/s][A
 45%|███████████████████████████████████████████████████████████▌                                                                        | 2256/5000 [12:49<15:47,  2.90it/s][A
 45%|███████████████████████████████████████████████████████████▌                                                                        | 2257/5000 [12:49<16:59,  2.69it/s][A
 45%|███████████████████████████████████████████████████████████▌                                                  

 46%|████████████████████████████████████████████████████████████▋                                                                       | 2299/5000 [13:03<15:08,  2.97it/s][A
 46%|████████████████████████████████████████████████████████████▋                                                                       | 2300/5000 [13:04<15:01,  3.00it/s][A
 46%|████████████████████████████████████████████████████████████▋                                                                       | 2301/5000 [13:04<14:55,  3.01it/s][A
 46%|████████████████████████████████████████████████████████████▊                                                                       | 2302/5000 [13:04<15:02,  2.99it/s][A
 46%|████████████████████████████████████████████████████████████▊                                                                       | 2303/5000 [13:05<14:54,  3.01it/s][A
 46%|████████████████████████████████████████████████████████████▊                                                 

 47%|█████████████████████████████████████████████████████████████▉                                                                      | 2345/5000 [13:19<15:28,  2.86it/s][A
 47%|█████████████████████████████████████████████████████████████▉                                                                      | 2346/5000 [13:19<15:07,  2.93it/s][A
 47%|█████████████████████████████████████████████████████████████▉                                                                      | 2347/5000 [13:20<14:52,  2.97it/s][A
 47%|█████████████████████████████████████████████████████████████▉                                                                      | 2348/5000 [13:20<14:53,  2.97it/s][A
 47%|██████████████████████████████████████████████████████████████                                                                      | 2349/5000 [13:20<14:41,  3.01it/s][A
 47%|██████████████████████████████████████████████████████████████                                                

 48%|███████████████████████████████████████████████████████████████                                                                     | 2391/5000 [13:35<14:33,  2.99it/s][A
 48%|███████████████████████████████████████████████████████████████▏                                                                    | 2392/5000 [13:35<14:49,  2.93it/s][A
 48%|███████████████████████████████████████████████████████████████▏                                                                    | 2393/5000 [13:35<14:33,  2.99it/s][A
 48%|███████████████████████████████████████████████████████████████▏                                                                    | 2394/5000 [13:35<14:22,  3.02it/s][A
 48%|███████████████████████████████████████████████████████████████▏                                                                    | 2395/5000 [13:36<14:16,  3.04it/s][A
 48%|███████████████████████████████████████████████████████████████▎                                              

 49%|████████████████████████████████████████████████████████████████▎                                                                   | 2437/5000 [13:50<14:40,  2.91it/s][A
 49%|████████████████████████████████████████████████████████████████▎                                                                   | 2438/5000 [13:50<14:20,  2.98it/s][A
 49%|████████████████████████████████████████████████████████████████▍                                                                   | 2439/5000 [13:50<14:10,  3.01it/s][A
 49%|████████████████████████████████████████████████████████████████▍                                                                   | 2440/5000 [13:51<14:42,  2.90it/s][A
 49%|████████████████████████████████████████████████████████████████▍                                                                   | 2441/5000 [13:51<14:29,  2.94it/s][A
 49%|████████████████████████████████████████████████████████████████▍                                             

 50%|█████████████████████████████████████████████████████████████████▌                                                                  | 2483/5000 [14:05<13:42,  3.06it/s][A
 50%|█████████████████████████████████████████████████████████████████▌                                                                  | 2484/5000 [14:05<13:49,  3.03it/s][A
 50%|█████████████████████████████████████████████████████████████████▌                                                                  | 2485/5000 [14:06<13:29,  3.11it/s][A
 50%|█████████████████████████████████████████████████████████████████▋                                                                  | 2486/5000 [14:06<13:28,  3.11it/s][A
 50%|█████████████████████████████████████████████████████████████████▋                                                                  | 2487/5000 [14:06<13:30,  3.10it/s][A
 50%|█████████████████████████████████████████████████████████████████▋                                            

 51%|██████████████████████████████████████████████████████████████████▊                                                                 | 2529/5000 [14:21<15:24,  2.67it/s][A
 51%|██████████████████████████████████████████████████████████████████▊                                                                 | 2530/5000 [14:21<15:16,  2.70it/s][A
 51%|██████████████████████████████████████████████████████████████████▊                                                                 | 2531/5000 [14:22<15:29,  2.66it/s][A
 51%|██████████████████████████████████████████████████████████████████▊                                                                 | 2532/5000 [14:22<15:17,  2.69it/s][A
 51%|██████████████████████████████████████████████████████████████████▊                                                                 | 2533/5000 [14:22<14:43,  2.79it/s][A
 51%|██████████████████████████████████████████████████████████████████▉                                           

 52%|███████████████████████████████████████████████████████████████████▉                                                                | 2575/5000 [14:37<13:40,  2.96it/s][A
 52%|████████████████████████████████████████████████████████████████████                                                                | 2576/5000 [14:38<13:30,  2.99it/s][A
 52%|████████████████████████████████████████████████████████████████████                                                                | 2577/5000 [14:38<13:22,  3.02it/s][A
 52%|████████████████████████████████████████████████████████████████████                                                                | 2578/5000 [14:38<13:18,  3.03it/s][A
 52%|████████████████████████████████████████████████████████████████████                                                                | 2579/5000 [14:39<13:12,  3.05it/s][A
 52%|████████████████████████████████████████████████████████████████████                                          

 52%|█████████████████████████████████████████████████████████████████████▏                                                              | 2621/5000 [14:53<13:03,  3.04it/s][A
 52%|█████████████████████████████████████████████████████████████████████▏                                                              | 2622/5000 [14:53<13:09,  3.01it/s][A
 52%|█████████████████████████████████████████████████████████████████████▏                                                              | 2623/5000 [14:53<13:05,  3.02it/s][A
 52%|█████████████████████████████████████████████████████████████████████▎                                                              | 2624/5000 [14:54<13:03,  3.03it/s][A
 52%|█████████████████████████████████████████████████████████████████████▎                                                              | 2625/5000 [14:54<13:03,  3.03it/s][A
 53%|█████████████████████████████████████████████████████████████████████▎                                        

 53%|██████████████████████████████████████████████████████████████████████▍                                                             | 2667/5000 [15:09<12:43,  3.05it/s][A
 53%|██████████████████████████████████████████████████████████████████████▍                                                             | 2668/5000 [15:09<12:49,  3.03it/s][A
 53%|██████████████████████████████████████████████████████████████████████▍                                                             | 2669/5000 [15:09<12:55,  3.01it/s][A
 53%|██████████████████████████████████████████████████████████████████████▍                                                             | 2670/5000 [15:10<13:36,  2.85it/s][A
 53%|██████████████████████████████████████████████████████████████████████▌                                                             | 2671/5000 [15:10<14:36,  2.66it/s][A
 53%|██████████████████████████████████████████████████████████████████████▌                                       

 54%|███████████████████████████████████████████████████████████████████████▌                                                            | 2713/5000 [15:24<13:02,  2.92it/s][A
 54%|███████████████████████████████████████████████████████████████████████▋                                                            | 2714/5000 [15:25<12:50,  2.97it/s][A
 54%|███████████████████████████████████████████████████████████████████████▋                                                            | 2715/5000 [15:25<13:20,  2.86it/s][A
 54%|███████████████████████████████████████████████████████████████████████▋                                                            | 2716/5000 [15:25<13:14,  2.88it/s][A
 54%|███████████████████████████████████████████████████████████████████████▋                                                            | 2717/5000 [15:26<12:57,  2.94it/s][A
 54%|███████████████████████████████████████████████████████████████████████▊                                      

 55%|████████████████████████████████████████████████████████████████████████▊                                                           | 2759/5000 [15:40<12:10,  3.07it/s][A
 55%|████████████████████████████████████████████████████████████████████████▊                                                           | 2760/5000 [15:40<12:13,  3.05it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                                           | 2761/5000 [15:40<12:13,  3.05it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                                           | 2762/5000 [15:41<12:10,  3.07it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                                           | 2763/5000 [15:41<12:07,  3.07it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                     

 56%|██████████████████████████████████████████████████████████████████████████                                                          | 2805/5000 [15:56<13:54,  2.63it/s][A
 56%|██████████████████████████████████████████████████████████████████████████                                                          | 2806/5000 [15:56<13:14,  2.76it/s][A
 56%|██████████████████████████████████████████████████████████████████████████                                                          | 2807/5000 [15:56<12:46,  2.86it/s][A
 56%|██████████████████████████████████████████████████████████████████████████▏                                                         | 2808/5000 [15:57<12:28,  2.93it/s][A
 56%|██████████████████████████████████████████████████████████████████████████▏                                                         | 2809/5000 [15:57<12:16,  2.98it/s][A
 56%|██████████████████████████████████████████████████████████████████████████▏                                   

 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2851/5000 [16:12<11:46,  3.04it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2852/5000 [16:12<11:44,  3.05it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2853/5000 [16:12<11:41,  3.06it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2854/5000 [16:13<11:42,  3.06it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2855/5000 [16:13<11:40,  3.06it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▍                                  

 58%|████████████████████████████████████████████████████████████████████████████▍                                                       | 2897/5000 [16:27<12:31,  2.80it/s][A
 58%|████████████████████████████████████████████████████████████████████████████▌                                                       | 2898/5000 [16:28<12:21,  2.84it/s][A
 58%|████████████████████████████████████████████████████████████████████████████▌                                                       | 2899/5000 [16:28<11:59,  2.92it/s][A
 58%|████████████████████████████████████████████████████████████████████████████▌                                                       | 2900/5000 [16:28<11:43,  2.98it/s][A
 58%|████████████████████████████████████████████████████████████████████████████▌                                                       | 2901/5000 [16:29<11:33,  3.03it/s][A
 58%|████████████████████████████████████████████████████████████████████████████▌                                 

 59%|█████████████████████████████████████████████████████████████████████████████▋                                                      | 2943/5000 [16:43<10:58,  3.13it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▋                                                      | 2944/5000 [16:43<11:07,  3.08it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▋                                                      | 2945/5000 [16:44<11:28,  2.99it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▊                                                      | 2946/5000 [16:44<11:40,  2.93it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▊                                                      | 2947/5000 [16:44<11:31,  2.97it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▊                                

 60%|██████████████████████████████████████████████████████████████████████████████▉                                                     | 2989/5000 [16:58<10:53,  3.08it/s][A
 60%|██████████████████████████████████████████████████████████████████████████████▉                                                     | 2990/5000 [16:58<10:52,  3.08it/s][A
 60%|██████████████████████████████████████████████████████████████████████████████▉                                                     | 2991/5000 [16:58<10:51,  3.09it/s][A
 60%|██████████████████████████████████████████████████████████████████████████████▉                                                     | 2992/5000 [16:59<10:51,  3.08it/s][A
 60%|███████████████████████████████████████████████████████████████████████████████                                                     | 2993/5000 [16:59<10:50,  3.08it/s][A
 60%|███████████████████████████████████████████████████████████████████████████████                               

 61%|████████████████████████████████████████████████████████████████████████████████                                                    | 3035/5000 [17:13<10:59,  2.98it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▏                                                   | 3036/5000 [17:13<11:15,  2.91it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▏                                                   | 3037/5000 [17:14<11:38,  2.81it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▏                                                   | 3038/5000 [17:14<11:34,  2.82it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▏                                                   | 3039/5000 [17:14<11:18,  2.89it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▎                             

 62%|█████████████████████████████████████████████████████████████████████████████████▎                                                  | 3081/5000 [17:29<10:46,  2.97it/s][A
 62%|█████████████████████████████████████████████████████████████████████████████████▎                                                  | 3082/5000 [17:29<11:05,  2.88it/s][A
 62%|█████████████████████████████████████████████████████████████████████████████████▍                                                  | 3083/5000 [17:29<10:54,  2.93it/s][A
 62%|█████████████████████████████████████████████████████████████████████████████████▍                                                  | 3084/5000 [17:30<10:45,  2.97it/s][A
 62%|█████████████████████████████████████████████████████████████████████████████████▍                                                  | 3085/5000 [17:30<10:37,  3.01it/s][A
 62%|█████████████████████████████████████████████████████████████████████████████████▍                            

 63%|██████████████████████████████████████████████████████████████████████████████████▌                                                 | 3127/5000 [17:44<11:02,  2.83it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▌                                                 | 3128/5000 [17:45<11:05,  2.81it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▌                                                 | 3129/5000 [17:45<10:54,  2.86it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▋                                                 | 3130/5000 [17:45<10:38,  2.93it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▋                                                 | 3131/5000 [17:46<10:28,  2.97it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▋                           

 63%|███████████████████████████████████████████████████████████████████████████████████▊                                                | 3173/5000 [18:00<09:45,  3.12it/s][A
 63%|███████████████████████████████████████████████████████████████████████████████████▊                                                | 3174/5000 [18:00<09:53,  3.08it/s][A
 64%|███████████████████████████████████████████████████████████████████████████████████▊                                                | 3175/5000 [18:01<10:45,  2.83it/s][A
 64%|███████████████████████████████████████████████████████████████████████████████████▊                                                | 3176/5000 [18:01<10:27,  2.91it/s][A
 64%|███████████████████████████████████████████████████████████████████████████████████▊                                                | 3177/5000 [18:01<10:05,  3.01it/s][A
 64%|███████████████████████████████████████████████████████████████████████████████████▉                          

 64%|████████████████████████████████████████████████████████████████████████████████████▉                                               | 3219/5000 [18:16<10:03,  2.95it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3220/5000 [18:17<10:01,  2.96it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3221/5000 [18:17<09:38,  3.07it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3222/5000 [18:17<09:24,  3.15it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3223/5000 [18:18<09:27,  3.13it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                         

 65%|██████████████████████████████████████████████████████████████████████████████████████▏                                             | 3265/5000 [18:31<09:44,  2.97it/s][A
 65%|██████████████████████████████████████████████████████████████████████████████████████▏                                             | 3266/5000 [18:32<09:33,  3.02it/s][A
 65%|██████████████████████████████████████████████████████████████████████████████████████▏                                             | 3267/5000 [18:32<09:26,  3.06it/s][A
 65%|██████████████████████████████████████████████████████████████████████████████████████▎                                             | 3268/5000 [18:32<09:21,  3.09it/s][A
 65%|██████████████████████████████████████████████████████████████████████████████████████▎                                             | 3269/5000 [18:33<09:17,  3.10it/s][A
 65%|██████████████████████████████████████████████████████████████████████████████████████▎                       

 66%|███████████████████████████████████████████████████████████████████████████████████████▍                                            | 3311/5000 [18:47<09:12,  3.06it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▍                                            | 3312/5000 [18:47<09:12,  3.06it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▍                                            | 3313/5000 [18:48<09:11,  3.06it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▍                                            | 3314/5000 [18:48<09:11,  3.06it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▌                                            | 3315/5000 [18:48<09:11,  3.05it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▌                      

 67%|████████████████████████████████████████████████████████████████████████████████████████▌                                           | 3357/5000 [19:02<09:02,  3.03it/s][A
 67%|████████████████████████████████████████████████████████████████████████████████████████▋                                           | 3358/5000 [19:03<08:59,  3.04it/s][A
 67%|████████████████████████████████████████████████████████████████████████████████████████▋                                           | 3359/5000 [19:03<08:56,  3.06it/s][A
 67%|████████████████████████████████████████████████████████████████████████████████████████▋                                           | 3360/5000 [19:03<08:56,  3.06it/s][A
 67%|████████████████████████████████████████████████████████████████████████████████████████▋                                           | 3361/5000 [19:04<08:54,  3.07it/s][A
 67%|████████████████████████████████████████████████████████████████████████████████████████▊                     

 68%|█████████████████████████████████████████████████████████████████████████████████████████▊                                          | 3403/5000 [19:19<08:48,  3.02it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▊                                          | 3404/5000 [19:19<08:50,  3.01it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                                          | 3405/5000 [19:19<08:46,  3.03it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                                          | 3406/5000 [19:20<08:44,  3.04it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                                          | 3407/5000 [19:20<08:44,  3.04it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                    

 69%|███████████████████████████████████████████████████████████████████████████████████████████                                         | 3449/5000 [19:35<09:35,  2.70it/s][A
 69%|███████████████████████████████████████████████████████████████████████████████████████████                                         | 3450/5000 [19:35<09:27,  2.73it/s][A
 69%|███████████████████████████████████████████████████████████████████████████████████████████                                         | 3451/5000 [19:36<11:08,  2.32it/s][A
 69%|███████████████████████████████████████████████████████████████████████████████████████████▏                                        | 3452/5000 [19:36<12:35,  2.05it/s][A
 69%|███████████████████████████████████████████████████████████████████████████████████████████▏                                        | 3453/5000 [19:37<11:16,  2.29it/s][A
 69%|███████████████████████████████████████████████████████████████████████████████████████████▏                  

 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3495/5000 [19:51<08:39,  2.90it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3496/5000 [19:52<09:08,  2.74it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3497/5000 [19:52<08:39,  2.89it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3498/5000 [19:52<08:21,  2.99it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3499/5000 [19:53<08:24,  2.98it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▍                 

 71%|█████████████████████████████████████████████████████████████████████████████████████████████▍                                      | 3541/5000 [20:07<07:54,  3.07it/s][A
 71%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                      | 3542/5000 [20:07<07:55,  3.06it/s][A
 71%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                      | 3543/5000 [20:07<07:59,  3.04it/s][A
 71%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                      | 3544/5000 [20:08<08:02,  3.02it/s][A
 71%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                      | 3545/5000 [20:08<07:58,  3.04it/s][A
 71%|█████████████████████████████████████████████████████████████████████████████████████████████▌                

 72%|██████████████████████████████████████████████████████████████████████████████████████████████▋                                     | 3587/5000 [20:23<07:55,  2.97it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▋                                     | 3588/5000 [20:24<07:49,  3.01it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▋                                     | 3589/5000 [20:24<07:45,  3.03it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 3590/5000 [20:24<07:42,  3.05it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 3591/5000 [20:25<07:39,  3.07it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▊               

 73%|███████████████████████████████████████████████████████████████████████████████████████████████▉                                    | 3633/5000 [20:39<08:42,  2.62it/s][A
 73%|███████████████████████████████████████████████████████████████████████████████████████████████▉                                    | 3634/5000 [20:39<08:31,  2.67it/s][A
 73%|███████████████████████████████████████████████████████████████████████████████████████████████▉                                    | 3635/5000 [20:39<08:15,  2.75it/s][A
 73%|███████████████████████████████████████████████████████████████████████████████████████████████▉                                    | 3636/5000 [20:40<08:09,  2.79it/s][A
 73%|████████████████████████████████████████████████████████████████████████████████████████████████                                    | 3637/5000 [20:40<08:33,  2.65it/s][A
 73%|████████████████████████████████████████████████████████████████████████████████████████████████              

 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3679/5000 [20:54<07:15,  3.03it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3680/5000 [20:54<07:13,  3.05it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3681/5000 [20:55<07:11,  3.06it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3682/5000 [20:55<07:45,  2.83it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3683/5000 [20:55<07:48,  2.81it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▎            

 74%|██████████████████████████████████████████████████████████████████████████████████████████████████▎                                 | 3725/5000 [21:09<06:52,  3.09it/s][A
 75%|██████████████████████████████████████████████████████████████████████████████████████████████████▎                                 | 3726/5000 [21:09<06:52,  3.09it/s][A
 75%|██████████████████████████████████████████████████████████████████████████████████████████████████▍                                 | 3727/5000 [21:10<07:18,  2.90it/s][A
 75%|██████████████████████████████████████████████████████████████████████████████████████████████████▍                                 | 3728/5000 [21:10<07:55,  2.68it/s][A
 75%|██████████████████████████████████████████████████████████████████████████████████████████████████▍                                 | 3729/5000 [21:11<08:24,  2.52it/s][A
 75%|██████████████████████████████████████████████████████████████████████████████████████████████████▍           

 75%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 3771/5000 [21:25<06:45,  3.03it/s][A
 75%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 3772/5000 [21:26<06:44,  3.04it/s][A
 75%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 3773/5000 [21:26<06:42,  3.05it/s][A
 75%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 3774/5000 [21:26<06:42,  3.05it/s][A
 76%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 3775/5000 [21:27<06:43,  3.04it/s][A
 76%|███████████████████████████████████████████████████████████████████████████████████████████████████▋          

 76%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                               | 3817/5000 [21:41<06:22,  3.09it/s][A
 76%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                               | 3818/5000 [21:41<06:22,  3.09it/s][A
 76%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                               | 3819/5000 [21:41<06:22,  3.09it/s][A
 76%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                               | 3820/5000 [21:42<06:22,  3.09it/s][A
 76%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                               | 3821/5000 [21:42<06:21,  3.09it/s][A
 76%|████████████████████████████████████████████████████████████████████████████████████████████████████▉         

In [None]:
for label,(ae, opt, results) in tqdm(ae_results.items()):
    plt.figure()
    plt.plot(results['loss_train'], label='train_loss')
    plt.plot(results['loss_val'], label='val_loss')
    plt.plot(results['knn_maes'], label='knn_maes')
    plt.yscale('log')
    plt.xscale('log')
    plt.xlabel('epoch')
    knn_mae_min = round(min(results['knn_maes']),2)
    loss_val_min = round(min(results['loss_val']),2)
    plt.title(f'{label} \n knn_min: {knn_mae_min}, loss_val_min: {loss_val_min}')
    plt.legend()
    plt.show()

# Embedding

In [None]:
knn_mae_scorer = lambda *args: KNN_MAE(*args, averaging='median', weights='distance', n_neighbors=4)
scorer = lambda *args: calculate_Q_mae(*args, mae_scorer=knn_mae_scorer)

In [68]:
PERCENTILE = 95
DATA_PERCENT_THRESHOLD = 0.9

for label,Z in ae_embeddings.items():
    
    print(label)
    
    X_orig = data_orig[label]
    Q_loc, Q_glob, mae = scorer(X_orig, Z)

    d = {}

    d['method_name'] = 'ae'
    d['label'] = label
    d['intrinsic_dim'] = intrinsic_dim
    
    d['Z'] = Z
    d['Q_loc'] = Q_loc
    d['Q_glob'] = Q_glob

    d['knn_mae_loo_orig'] = mae
    
    N = X_orig.shape[0]
    X_ = X_orig.copy()
    Z_ = Z.copy() 
    
    # remove outliers in embedding
    inliers_indexes = np.arange(N)
    while True:
        scoring_list = KNN_MAE(X_, Z_, averaging=None, weights='distance') # distance brings nan!
        q = np.percentile(scoring_list, PERCENTILE)
        mask = scoring_list < q
        if mask.sum()/N < DATA_PERCENT_THRESHOLD:
            break
        X_ = X_[mask]
        Z_ = Z_[mask]
        inliers_indexes = inliers_indexes[mask] 

    outliers_indexes = np.array(list(set(np.arange(N)) - set(inliers_indexes)))
    Q_loc_, Q_glob_, mae_ = scorer(X_, Z_)
    
    d['inliers_indexes_mae'] = inliers_indexes
    d['outliers_indexes_mae'] = outliers_indexes
    d['X_'] = X_
    d['Z_'] = Z_ # final embedding
    d['Q_loc_'] = Q_loc_ 
    d['Q_glob_'] = Q_glob_ 
    d['knn_mae_loo_orig_'] = mae_ # final mae
    
    print(f'Initial metrics: mae={mae}, Q_loc={Q_loc}, Q_glob={Q_glob}') 
    print(f'After removing outliers: mae={mae_}, Q_loc={Q_loc_}, Q_glob={Q_glob_}')
    
    path = os.path.join(embeddings_root, f'{label}_ae')
    np.save(path, d)

AGP_o
Initial metrics: mae=0.062424180749489196, Q_loc=0.6481704333840366, Q_glob=0.8603879757550427
After removing outliers: mae=0.057497956807831006, Q_loc=0.6638880236819423, Q_glob=0.8687097396469763
AGP_f
Initial metrics: mae=0.20207845967933494, Q_loc=0.5718091405008845, Q_glob=0.8162748756880082
After removing outliers: mae=0.19135545217290187, Q_loc=0.5848797482621769, Q_glob=0.8209426600185157
AGP_g
Initial metrics: mae=0.22910916115806854, Q_loc=0.5886979995316357, Q_glob=0.8295949977668649
After removing outliers: mae=0.21853174739061634, Q_loc=0.5990817629108928, Q_glob=0.8337196846015225
HMP_o
Initial metrics: mae=0.11370106302181365, Q_loc=0.5962449865398572, Q_glob=0.7839634692709407
After removing outliers: mae=0.0966901854791616, Q_loc=0.6218227855677055, Q_glob=0.7986729015160193
HMP_f
Initial metrics: mae=0.27161362893210494, Q_loc=0.5826343225889166, Q_glob=0.7650346235998038
After removing outliers: mae=0.24915806413046368, Q_loc=0.5930900524307338, Q_glob=0.775309