In [1]:
import numpy as np
import pandas as pd  
import os
import glob
from tqdm import tqdm
from collections import defaultdict
import matplotlib.pyplot as plt

import torch
from torch import nn
from torch.utils.data import DataLoader

from utils import NPR,\
                  l1_normalized_error,\
                  KNN_MAE,\
                  calculate_Q_metrics,\
                  l1_normalized_error_torch

from IPython.display import clear_output
                
from sklearn.model_selection import train_test_split

In [2]:
DATA_SPECIFICATION = '' #'_pat0.4'
intrinsic_dims = np.load(f'./intrinsic_dims_pca_strict{DATA_SPECIFICATION}.npy', allow_pickle=True).item()

data_pca = {}
for dataset_name in tqdm(['AGP', 'HMP']):
    for tax in ['o', 'f', 'g']: 
        label = f'{dataset_name}_{tax}'
        data_pca[label] = np.genfromtxt(f'./results/pca{DATA_SPECIFICATION}/{label}', delimiter=';')
        
data_orig = {}
for dataset_name in tqdm(['AGP', 'HMP']):
    for tax in ['o', 'f', 'g']: 
        dataframe = pd.read_csv(f'./data_processed{DATA_SPECIFICATION}/{dataset_name}_{tax}.csv', sep=',')
        label = f'{dataset_name}_{tax}'
        data_orig[label] = dataframe.drop('Unnamed: 0', axis=1).values
        
embeddings_root = f'./results/embeddings{DATA_SPECIFICATION}/'
os.makedirs(embeddings_root, exist_ok=True)

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.12it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.60it/s]


In [3]:
# # uncomment to use synthetic data

# intrinsic_dims = np.load(f'./intrinsic_dims_pca_strict_synthetic.npy', allow_pickle=True).item()

# data_orig = {}
# for path in glob.glob('data_processed/synthetic/*'):
#     dataframe = pd.read_csv(path, index_col=0)
#     label = path.split('/')[-1].split('.')[0]
#     data_orig[label] = dataframe.values

# data_pca = {}
# for path in tqdm(glob.glob('./results/pca/synthetic/*')):
#     label = path.split('/')[-1]
#     data_pca[label] = np.genfromtxt(path, delimiter = ';')

    
# embeddings_root = 'results/embeddings_synthetic'
# os.makedirs(embeddings_root, exist_ok=True)

# Model

In [4]:
class AE(nn.Module):
    def __init__(self, input_dim, z_dim, config):
        hidden_dim = config['hidden_dim']
        dropout_rate1 = config['dropout_rate1']
        dropout_rate2 = config['dropout_rate2']
        dropout_rate3 = config['dropout_rate3']

        dropout_rate4 = config['dropout_rate4']
        dropout_rate5 = config['dropout_rate5']
        dropout_rate6 = config['dropout_rate6']
        
        super().__init__()
        self.input_dim = input_dim
        self.z_dim = z_dim
        self.encoder = nn.Sequential(nn.Linear(input_dim, hidden_dim),
                                    nn.BatchNorm1d(hidden_dim),
                                    nn.LeakyReLU(),
                                     
                                    nn.Linear(hidden_dim, hidden_dim),
                                    nn.BatchNorm1d(hidden_dim),
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate1), 
                                     
                                    nn.Linear(hidden_dim, hidden_dim//2),
                                    nn.BatchNorm1d(hidden_dim//2), 
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate2),
                                     
                                    nn.Linear(hidden_dim//2, hidden_dim//4),
                                    nn.BatchNorm1d(hidden_dim//4),
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate3), 
                                    nn.Linear(hidden_dim//4, z_dim))
        
        self.decoder = nn.Sequential(nn.Linear(z_dim, hidden_dim//4),
                                    nn.BatchNorm1d(hidden_dim//4),
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate4),
                                     
                                    nn.Linear(hidden_dim//4, hidden_dim//2),
                                    nn.BatchNorm1d(hidden_dim//2),
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate5), 
                                     
                                    nn.Linear(hidden_dim//2, hidden_dim),
                                    nn.BatchNorm1d(hidden_dim), 
                                    nn.LeakyReLU(),
                                    nn.Dropout(p=dropout_rate6),
                                     
                                    nn.Linear(hidden_dim, hidden_dim),
                                    nn.BatchNorm1d(hidden_dim),
                                    nn.LeakyReLU(),
                                    nn.Linear(hidden_dim, input_dim))
    def forward(self, X):
        Z = self.encoder(X)
        X = self.decoder(Z)
        return Z,X


In [5]:
def train_ae(ae,
             opt,
             X,
             device,
             n_epochs=6000,
             calc_npr=True, 
             npr_calc_step=100):

    X_train, X_test = train_test_split(X)
    X_tensor = torch.tensor(X, dtype=torch.float).to(device)
        
    X_train_tensor = torch.tensor(X_train, dtype=torch.float).to(device)
    X_test_tensor = torch.tensor(X_test, dtype=torch.float).to(device)
    
    torch.manual_seed(42)
    results = defaultdict(list)
    loss_val_min = np.inf

    for i in tqdm(range(n_epochs)):
        #########
        # TRAIN #
        #########
        ae.train()
        # add noise to the input
        ae_input = X_train_tensor + 1e-2*torch.randn_like(X_train_tensor).to(device) # Add noise
        embedding, data_rec = ae(ae_input)
        
        if i%npr_calc_step==0 and calc_npr:
            results['npr_train'].append(NPR(data_train, 
                                        embedding.detach().cpu().numpy()))

        opt.zero_grad()
        loss = l1_normalized_error_torch(X_train_tensor, data_rec).mean() # mean of loss
        loss.backward()
        opt.step()

        results['loss_train'].append(loss.item())

        ##############
        # VALIDATION #
        ##############
        ae.eval()
        with torch.no_grad():
            embedding_, data_rec_test = ae(X_test_tensor)
            loss_ = l1_normalized_error_torch(X_test_tensor, data_rec_test).mean()
            results['loss_val'].append(loss_.item())

            if results['loss_val'][-1] < loss_val_min:
                loss_val_min = results['loss_val'][-1]
                torch.save(ae.state_dict(), 'best_weights')
            
        if i%npr_calc_step==0 and calc_npr:
            results['npr_val'].append(NPR(data_test, 
                                      embedding_.detach().cpu().numpy()))

        # KNN MAE
        Z, _ = ae(X_tensor)
        results['knn_maes'].append(KNN_MAE(X, Z.detach().cpu().numpy(), 
                                           weights='distance', 
                                           averaging='median',
                                           n_neighbors=5))
        
    ae.load_state_dict(torch.load('best_weights'))
    Z, _ = ae(X_tensor)
    
    return Z.detach().cpu().numpy(), ae, opt, results

# Train

In [None]:
config = {'hidden_dim': 1024,
        'dropout_rate1': 0.05,#encoder
        'dropout_rate2': 0.1,#encoder
        'dropout_rate3': 0.1,#encoder
        'dropout_rate4': 0.1,#decoder
        'dropout_rate5': 0.1,#decoder
        'dropout_rate6': 0.05}#decoder

ae_results = {}
ae_embeddings = {}
device = torch.device('cuda:1')

for label,X in tqdm(data_pca.items()):
    intrinsic_dim = intrinsic_dims[label]


    ae = AE(X.shape[1],
            intrinsic_dim,
            config).to(device)

    opt = torch.optim.Adam(ae.parameters(), 
                            lr=5e-4, 
                            weight_decay=1e-5) 

    Z, ae, opt, results = train_ae(ae,
                                    opt,
                                    X,
                                    device,
                                    n_epochs=5000,
                                    calc_npr=False)
    
    ae_results[label] = [ae, opt, results]
    ae_embeddings[label] = Z
    
clear_output()

  0%|                                                                                                                                                  | 0/6 [00:00<?, ?it/s]
  0%|                                                                                                                                               | 0/5000 [00:00<?, ?it/s][A
  0%|                                                                                                                                       | 1/5000 [00:00<59:01,  1.41it/s][A
  0%|                                                                                                                                       | 2/5000 [00:01<40:07,  2.08it/s][A
  0%|                                                                                                                                       | 3/5000 [00:01<27:43,  3.00it/s][A
  0%|                                                                                                                 

  2%|██▍                                                                                                                                   | 92/5000 [00:22<12:44,  6.42it/s][A
  2%|██▍                                                                                                                                   | 93/5000 [00:22<12:16,  6.66it/s][A
  2%|██▌                                                                                                                                   | 94/5000 [00:22<11:58,  6.82it/s][A
  2%|██▌                                                                                                                                   | 95/5000 [00:22<11:47,  6.93it/s][A
  2%|██▌                                                                                                                                   | 96/5000 [00:22<11:39,  7.01it/s][A
  2%|██▌                                                                                                           

  4%|████▉                                                                                                                                | 184/5000 [00:37<13:42,  5.85it/s][A
  4%|████▉                                                                                                                                | 185/5000 [00:38<13:23,  5.99it/s][A
  4%|████▉                                                                                                                                | 186/5000 [00:38<13:08,  6.10it/s][A
  4%|████▉                                                                                                                                | 187/5000 [00:38<16:59,  4.72it/s][A
  4%|█████                                                                                                                                | 188/5000 [00:38<15:43,  5.10it/s][A
  4%|█████                                                                                                         

  6%|███████▎                                                                                                                             | 276/5000 [00:55<14:26,  5.45it/s][A
  6%|███████▎                                                                                                                             | 277/5000 [00:56<17:54,  4.39it/s][A
  6%|███████▍                                                                                                                             | 278/5000 [00:56<16:46,  4.69it/s][A
  6%|███████▍                                                                                                                             | 279/5000 [00:56<15:57,  4.93it/s][A
  6%|███████▍                                                                                                                             | 280/5000 [00:56<15:24,  5.10it/s][A
  6%|███████▍                                                                                                      

  7%|█████████▊                                                                                                                           | 368/5000 [01:15<15:23,  5.01it/s][A
  7%|█████████▊                                                                                                                           | 369/5000 [01:15<15:08,  5.10it/s][A
  7%|█████████▊                                                                                                                           | 370/5000 [01:15<15:00,  5.14it/s][A
  7%|█████████▊                                                                                                                           | 371/5000 [01:15<14:56,  5.17it/s][A
  7%|█████████▉                                                                                                                           | 372/5000 [01:15<14:49,  5.20it/s][A
  7%|█████████▉                                                                                                    

  9%|████████████▏                                                                                                                        | 460/5000 [01:36<17:50,  4.24it/s][A
  9%|████████████▎                                                                                                                        | 461/5000 [01:36<17:22,  4.35it/s][A
  9%|████████████▎                                                                                                                        | 462/5000 [01:36<17:01,  4.44it/s][A
  9%|████████████▎                                                                                                                        | 463/5000 [01:36<16:52,  4.48it/s][A
  9%|████████████▎                                                                                                                        | 464/5000 [01:36<16:47,  4.50it/s][A
  9%|████████████▎                                                                                                 

 11%|██████████████▋                                                                                                                      | 552/5000 [01:57<17:43,  4.18it/s][A
 11%|██████████████▋                                                                                                                      | 553/5000 [01:58<17:24,  4.26it/s][A
 11%|██████████████▋                                                                                                                      | 554/5000 [01:58<20:37,  3.59it/s][A
 11%|██████████████▊                                                                                                                      | 555/5000 [01:58<22:53,  3.24it/s][A
 11%|██████████████▊                                                                                                                      | 556/5000 [01:59<21:05,  3.51it/s][A
 11%|██████████████▊                                                                                               

 13%|█████████████████▏                                                                                                                   | 644/5000 [02:20<16:44,  4.34it/s][A
 13%|█████████████████▏                                                                                                                   | 645/5000 [02:20<16:45,  4.33it/s][A
 13%|█████████████████▏                                                                                                                   | 646/5000 [02:20<16:44,  4.34it/s][A
 13%|█████████████████▏                                                                                                                   | 647/5000 [02:20<16:39,  4.36it/s][A
 13%|█████████████████▏                                                                                                                   | 648/5000 [02:21<16:34,  4.38it/s][A
 13%|█████████████████▎                                                                                            

 15%|███████████████████▌                                                                                                                 | 736/5000 [02:41<16:09,  4.40it/s][A
 15%|███████████████████▌                                                                                                                 | 737/5000 [02:41<16:08,  4.40it/s][A
 15%|███████████████████▋                                                                                                                 | 738/5000 [02:42<16:10,  4.39it/s][A
 15%|███████████████████▋                                                                                                                 | 739/5000 [02:42<16:07,  4.40it/s][A
 15%|███████████████████▋                                                                                                                 | 740/5000 [02:42<16:10,  4.39it/s][A
 15%|███████████████████▋                                                                                          

 17%|██████████████████████                                                                                                               | 828/5000 [03:03<17:01,  4.09it/s][A
 17%|██████████████████████                                                                                                               | 829/5000 [03:03<16:46,  4.15it/s][A
 17%|██████████████████████                                                                                                               | 830/5000 [03:04<16:32,  4.20it/s][A
 17%|██████████████████████                                                                                                               | 831/5000 [03:04<16:24,  4.24it/s][A
 17%|██████████████████████▏                                                                                                              | 832/5000 [03:04<19:30,  3.56it/s][A
 17%|██████████████████████▏                                                                                       

 18%|████████████████████████▍                                                                                                            | 920/5000 [03:26<15:43,  4.32it/s][A
 18%|████████████████████████▍                                                                                                            | 921/5000 [03:26<15:43,  4.32it/s][A
 18%|████████████████████████▌                                                                                                            | 922/5000 [03:26<15:42,  4.33it/s][A
 18%|████████████████████████▌                                                                                                            | 923/5000 [03:26<15:40,  4.34it/s][A
 18%|████████████████████████▌                                                                                                            | 924/5000 [03:26<15:41,  4.33it/s][A
 18%|████████████████████████▌                                                                                     

 20%|██████████████████████████▋                                                                                                         | 1012/5000 [03:47<15:23,  4.32it/s][A
 20%|██████████████████████████▋                                                                                                         | 1013/5000 [03:47<15:22,  4.32it/s][A
 20%|██████████████████████████▊                                                                                                         | 1014/5000 [03:48<15:20,  4.33it/s][A
 20%|██████████████████████████▊                                                                                                         | 1015/5000 [03:48<15:20,  4.33it/s][A
 20%|██████████████████████████▊                                                                                                         | 1016/5000 [03:48<15:22,  4.32it/s][A
 20%|██████████████████████████▊                                                                                   

 22%|█████████████████████████████▏                                                                                                      | 1104/5000 [04:09<15:01,  4.32it/s][A
 22%|█████████████████████████████▏                                                                                                      | 1105/5000 [04:09<15:03,  4.31it/s][A
 22%|█████████████████████████████▏                                                                                                      | 1106/5000 [04:09<15:03,  4.31it/s][A
 22%|█████████████████████████████▏                                                                                                      | 1107/5000 [04:09<15:01,  4.32it/s][A
 22%|█████████████████████████████▎                                                                                                      | 1108/5000 [04:10<15:04,  4.30it/s][A
 22%|█████████████████████████████▎                                                                                

 24%|███████████████████████████████▌                                                                                                    | 1196/5000 [04:30<14:40,  4.32it/s][A
 24%|███████████████████████████████▌                                                                                                    | 1197/5000 [04:30<14:40,  4.32it/s][A
 24%|███████████████████████████████▋                                                                                                    | 1198/5000 [04:31<14:40,  4.32it/s][A
 24%|███████████████████████████████▋                                                                                                    | 1199/5000 [04:31<14:40,  4.32it/s][A
 24%|███████████████████████████████▋                                                                                                    | 1200/5000 [04:31<14:43,  4.30it/s][A
 24%|███████████████████████████████▋                                                                              

 26%|██████████████████████████████████                                                                                                  | 1288/5000 [04:53<14:20,  4.31it/s][A
 26%|██████████████████████████████████                                                                                                  | 1289/5000 [04:53<14:17,  4.33it/s][A
 26%|██████████████████████████████████                                                                                                  | 1290/5000 [04:53<14:18,  4.32it/s][A
 26%|██████████████████████████████████                                                                                                  | 1291/5000 [04:53<14:18,  4.32it/s][A
 26%|██████████████████████████████████                                                                                                  | 1292/5000 [04:53<14:18,  4.32it/s][A
 26%|██████████████████████████████████▏                                                                           

 28%|████████████████████████████████████▍                                                                                               | 1380/5000 [05:14<14:04,  4.29it/s][A
 28%|████████████████████████████████████▍                                                                                               | 1381/5000 [05:14<14:02,  4.29it/s][A
 28%|████████████████████████████████████▍                                                                                               | 1382/5000 [05:15<14:01,  4.30it/s][A
 28%|████████████████████████████████████▌                                                                                               | 1383/5000 [05:15<14:01,  4.30it/s][A
 28%|████████████████████████████████████▌                                                                                               | 1384/5000 [05:15<14:03,  4.29it/s][A
 28%|████████████████████████████████████▌                                                                         

 29%|██████████████████████████████████████▊                                                                                             | 1472/5000 [05:36<13:38,  4.31it/s][A
 29%|██████████████████████████████████████▉                                                                                             | 1473/5000 [05:36<13:38,  4.31it/s][A
 29%|██████████████████████████████████████▉                                                                                             | 1474/5000 [05:36<13:41,  4.29it/s][A
 30%|██████████████████████████████████████▉                                                                                             | 1475/5000 [05:36<13:40,  4.30it/s][A
 30%|██████████████████████████████████████▉                                                                                             | 1476/5000 [05:37<13:41,  4.29it/s][A
 30%|██████████████████████████████████████▉                                                                       

 31%|█████████████████████████████████████████▎                                                                                          | 1564/5000 [05:57<13:22,  4.28it/s][A
 31%|█████████████████████████████████████████▎                                                                                          | 1565/5000 [05:58<13:20,  4.29it/s][A
 31%|█████████████████████████████████████████▎                                                                                          | 1566/5000 [05:58<13:15,  4.32it/s][A
 31%|█████████████████████████████████████████▎                                                                                          | 1567/5000 [05:58<13:15,  4.32it/s][A
 31%|█████████████████████████████████████████▍                                                                                          | 1568/5000 [05:58<13:17,  4.31it/s][A
 31%|█████████████████████████████████████████▍                                                                    

 33%|███████████████████████████████████████████▋                                                                                        | 1656/5000 [06:19<12:58,  4.29it/s][A
 33%|███████████████████████████████████████████▋                                                                                        | 1657/5000 [06:19<12:57,  4.30it/s][A
 33%|███████████████████████████████████████████▊                                                                                        | 1658/5000 [06:19<12:54,  4.31it/s][A
 33%|███████████████████████████████████████████▊                                                                                        | 1659/5000 [06:20<12:55,  4.31it/s][A
 33%|███████████████████████████████████████████▊                                                                                        | 1660/5000 [06:20<12:58,  4.29it/s][A
 33%|███████████████████████████████████████████▊                                                                  

 35%|██████████████████████████████████████████████▏                                                                                     | 1748/5000 [06:40<12:42,  4.26it/s][A
 35%|██████████████████████████████████████████████▏                                                                                     | 1749/5000 [06:40<12:42,  4.27it/s][A
 35%|██████████████████████████████████████████████▏                                                                                     | 1750/5000 [06:40<12:38,  4.28it/s][A
 35%|██████████████████████████████████████████████▏                                                                                     | 1751/5000 [06:40<12:39,  4.28it/s][A
 35%|██████████████████████████████████████████████▎                                                                                     | 1752/5000 [06:41<12:42,  4.26it/s][A
 35%|██████████████████████████████████████████████▎                                                               

 37%|████████████████████████████████████████████████▌                                                                                   | 1840/5000 [07:01<12:16,  4.29it/s][A
 37%|████████████████████████████████████████████████▌                                                                                   | 1841/5000 [07:02<12:15,  4.30it/s][A
 37%|████████████████████████████████████████████████▋                                                                                   | 1842/5000 [07:02<12:15,  4.29it/s][A
 37%|████████████████████████████████████████████████▋                                                                                   | 1843/5000 [07:02<12:15,  4.29it/s][A
 37%|████████████████████████████████████████████████▋                                                                                   | 1844/5000 [07:02<12:17,  4.28it/s][A
 37%|████████████████████████████████████████████████▋                                                             

 39%|███████████████████████████████████████████████████                                                                                 | 1932/5000 [07:23<12:00,  4.26it/s][A
 39%|███████████████████████████████████████████████████                                                                                 | 1933/5000 [07:23<11:57,  4.27it/s][A
 39%|███████████████████████████████████████████████████                                                                                 | 1934/5000 [07:23<11:58,  4.27it/s][A
 39%|███████████████████████████████████████████████████                                                                                 | 1935/5000 [07:24<11:57,  4.27it/s][A
 39%|███████████████████████████████████████████████████                                                                                 | 1936/5000 [07:24<11:58,  4.27it/s][A
 39%|███████████████████████████████████████████████████▏                                                          

 40%|█████████████████████████████████████████████████████▍                                                                              | 2024/5000 [07:45<11:45,  4.22it/s][A
 40%|█████████████████████████████████████████████████████▍                                                                              | 2025/5000 [07:45<11:44,  4.23it/s][A
 41%|█████████████████████████████████████████████████████▍                                                                              | 2026/5000 [07:45<11:44,  4.22it/s][A
 41%|█████████████████████████████████████████████████████▌                                                                              | 2027/5000 [07:45<11:45,  4.22it/s][A
 41%|█████████████████████████████████████████████████████▌                                                                              | 2028/5000 [07:46<11:41,  4.24it/s][A
 41%|█████████████████████████████████████████████████████▌                                                        

 42%|███████████████████████████████████████████████████████▊                                                                            | 2116/5000 [08:07<11:13,  4.28it/s][A
 42%|███████████████████████████████████████████████████████▉                                                                            | 2117/5000 [08:07<11:14,  4.27it/s][A
 42%|███████████████████████████████████████████████████████▉                                                                            | 2118/5000 [08:08<11:12,  4.29it/s][A
 42%|███████████████████████████████████████████████████████▉                                                                            | 2119/5000 [08:08<11:11,  4.29it/s][A
 42%|███████████████████████████████████████████████████████▉                                                                            | 2120/5000 [08:08<11:14,  4.27it/s][A
 42%|███████████████████████████████████████████████████████▉                                                      

 44%|██████████████████████████████████████████████████████████▎                                                                         | 2208/5000 [08:29<10:54,  4.27it/s][A
 44%|██████████████████████████████████████████████████████████▎                                                                         | 2209/5000 [08:29<10:54,  4.26it/s][A
 44%|██████████████████████████████████████████████████████████▎                                                                         | 2210/5000 [08:29<10:55,  4.26it/s][A
 44%|██████████████████████████████████████████████████████████▎                                                                         | 2211/5000 [08:29<10:53,  4.27it/s][A
 44%|██████████████████████████████████████████████████████████▍                                                                         | 2212/5000 [08:30<10:56,  4.24it/s][A
 44%|██████████████████████████████████████████████████████████▍                                                   

 46%|████████████████████████████████████████████████████████████▋                                                                       | 2300/5000 [08:48<07:28,  6.02it/s][A
 46%|████████████████████████████████████████████████████████████▋                                                                       | 2301/5000 [08:48<07:21,  6.11it/s][A
 46%|████████████████████████████████████████████████████████████▊                                                                       | 2302/5000 [08:48<07:18,  6.15it/s][A
 46%|████████████████████████████████████████████████████████████▊                                                                       | 2303/5000 [08:48<07:17,  6.16it/s][A
 46%|████████████████████████████████████████████████████████████▊                                                                       | 2304/5000 [08:48<07:16,  6.18it/s][A
 46%|████████████████████████████████████████████████████████████▊                                                 

 48%|███████████████████████████████████████████████████████████████▏                                                                    | 2392/5000 [09:03<07:15,  5.99it/s][A
 48%|███████████████████████████████████████████████████████████████▏                                                                    | 2393/5000 [09:03<07:13,  6.01it/s][A
 48%|███████████████████████████████████████████████████████████████▏                                                                    | 2394/5000 [09:03<07:08,  6.08it/s][A
 48%|███████████████████████████████████████████████████████████████▏                                                                    | 2395/5000 [09:03<07:04,  6.14it/s][A
 48%|███████████████████████████████████████████████████████████████▎                                                                    | 2396/5000 [09:03<07:02,  6.17it/s][A
 48%|███████████████████████████████████████████████████████████████▎                                              

 50%|█████████████████████████████████████████████████████████████████▌                                                                  | 2484/5000 [09:17<06:43,  6.23it/s][A
 50%|█████████████████████████████████████████████████████████████████▌                                                                  | 2485/5000 [09:18<06:44,  6.22it/s][A
 50%|█████████████████████████████████████████████████████████████████▋                                                                  | 2486/5000 [09:18<06:45,  6.20it/s][A
 50%|█████████████████████████████████████████████████████████████████▋                                                                  | 2487/5000 [09:18<06:47,  6.17it/s][A
 50%|█████████████████████████████████████████████████████████████████▋                                                                  | 2488/5000 [09:18<06:45,  6.19it/s][A
 50%|█████████████████████████████████████████████████████████████████▋                                            

 52%|████████████████████████████████████████████████████████████████████                                                                | 2576/5000 [09:32<06:32,  6.17it/s][A
 52%|████████████████████████████████████████████████████████████████████                                                                | 2577/5000 [09:33<06:32,  6.17it/s][A
 52%|████████████████████████████████████████████████████████████████████                                                                | 2578/5000 [09:33<06:32,  6.16it/s][A
 52%|████████████████████████████████████████████████████████████████████                                                                | 2579/5000 [09:33<06:33,  6.15it/s][A
 52%|████████████████████████████████████████████████████████████████████                                                                | 2580/5000 [09:33<06:33,  6.15it/s][A
 52%|████████████████████████████████████████████████████████████████████▏                                         

 53%|██████████████████████████████████████████████████████████████████████▍                                                             | 2668/5000 [09:48<06:17,  6.18it/s][A
 53%|██████████████████████████████████████████████████████████████████████▍                                                             | 2669/5000 [09:48<06:15,  6.20it/s][A
 53%|██████████████████████████████████████████████████████████████████████▍                                                             | 2670/5000 [09:48<06:13,  6.24it/s][A
 53%|██████████████████████████████████████████████████████████████████████▌                                                             | 2671/5000 [09:48<06:13,  6.23it/s][A
 53%|██████████████████████████████████████████████████████████████████████▌                                                             | 2672/5000 [09:48<06:15,  6.21it/s][A
 53%|██████████████████████████████████████████████████████████████████████▌                                       

 55%|████████████████████████████████████████████████████████████████████████▊                                                           | 2760/5000 [10:03<05:59,  6.23it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                                           | 2761/5000 [10:03<06:00,  6.21it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                                           | 2762/5000 [10:03<06:00,  6.22it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                                           | 2763/5000 [10:03<06:00,  6.21it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                                           | 2764/5000 [10:03<06:00,  6.20it/s][A
 55%|████████████████████████████████████████████████████████████████████████▉                                     

 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2852/5000 [10:18<05:50,  6.12it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2853/5000 [10:18<05:50,  6.13it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2854/5000 [10:18<05:49,  6.13it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▎                                                        | 2855/5000 [10:18<05:49,  6.13it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▍                                                        | 2856/5000 [10:18<05:51,  6.10it/s][A
 57%|███████████████████████████████████████████████████████████████████████████▍                                  

 59%|█████████████████████████████████████████████████████████████████████████████▋                                                      | 2944/5000 [10:33<05:39,  6.05it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▋                                                      | 2945/5000 [10:33<05:38,  6.06it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▊                                                      | 2946/5000 [10:33<05:39,  6.06it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▊                                                      | 2947/5000 [10:33<05:38,  6.06it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▊                                                      | 2948/5000 [10:33<05:38,  6.06it/s][A
 59%|█████████████████████████████████████████████████████████████████████████████▊                                

 61%|████████████████████████████████████████████████████████████████████████████████▏                                                   | 3036/5000 [10:48<05:28,  5.98it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▏                                                   | 3037/5000 [10:48<05:28,  5.98it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▏                                                   | 3038/5000 [10:48<05:28,  5.98it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▏                                                   | 3039/5000 [10:49<05:28,  5.98it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▎                                                   | 3040/5000 [10:49<05:28,  5.96it/s][A
 61%|████████████████████████████████████████████████████████████████████████████████▎                             

 63%|██████████████████████████████████████████████████████████████████████████████████▌                                                 | 3128/5000 [11:03<05:07,  6.09it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▌                                                 | 3129/5000 [11:03<05:14,  5.94it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▋                                                 | 3130/5000 [11:03<05:12,  5.98it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▋                                                 | 3131/5000 [11:04<05:11,  6.00it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▋                                                 | 3132/5000 [11:04<05:12,  5.97it/s][A
 63%|██████████████████████████████████████████████████████████████████████████████████▋                           

 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3220/5000 [11:19<06:10,  4.81it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3221/5000 [11:19<05:48,  5.11it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3222/5000 [11:19<05:32,  5.35it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3223/5000 [11:19<05:20,  5.54it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████                                               | 3224/5000 [11:20<05:20,  5.54it/s][A
 64%|█████████████████████████████████████████████████████████████████████████████████████▏                        

 66%|███████████████████████████████████████████████████████████████████████████████████████▍                                            | 3312/5000 [11:34<04:34,  6.14it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▍                                            | 3313/5000 [11:34<04:35,  6.12it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▍                                            | 3314/5000 [11:34<04:36,  6.11it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▌                                            | 3315/5000 [11:35<04:41,  5.99it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▌                                            | 3316/5000 [11:35<04:39,  6.02it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████▌                      

 68%|█████████████████████████████████████████████████████████████████████████████████████████▊                                          | 3404/5000 [11:49<04:19,  6.15it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                                          | 3405/5000 [11:50<04:18,  6.16it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                                          | 3406/5000 [11:50<04:18,  6.17it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                                          | 3407/5000 [11:50<04:19,  6.13it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                                          | 3408/5000 [11:50<04:19,  6.13it/s][A
 68%|█████████████████████████████████████████████████████████████████████████████████████████▉                    

 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3496/5000 [12:04<04:04,  6.15it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3497/5000 [12:05<04:03,  6.16it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3498/5000 [12:05<04:03,  6.16it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 3499/5000 [12:05<04:02,  6.19it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▍                                       | 3500/5000 [12:05<04:02,  6.18it/s][A
 70%|████████████████████████████████████████████████████████████████████████████████████████████▍                 

 72%|██████████████████████████████████████████████████████████████████████████████████████████████▋                                     | 3588/5000 [12:19<03:46,  6.23it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▋                                     | 3589/5000 [12:20<03:46,  6.24it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 3590/5000 [12:20<03:47,  6.21it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 3591/5000 [12:20<03:47,  6.19it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 3592/5000 [12:20<03:47,  6.18it/s][A
 72%|██████████████████████████████████████████████████████████████████████████████████████████████▊               

 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3680/5000 [12:35<03:37,  6.08it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3681/5000 [12:35<03:37,  6.06it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3682/5000 [12:35<04:07,  5.33it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 3683/5000 [12:35<04:25,  4.95it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▎                                  | 3684/5000 [12:35<04:10,  5.26it/s][A
 74%|█████████████████████████████████████████████████████████████████████████████████████████████████▎            

 75%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 3772/5000 [12:50<03:24,  6.01it/s][A
 75%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 3773/5000 [12:50<03:23,  6.03it/s][A
 75%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 3774/5000 [12:50<03:24,  6.01it/s][A
 76%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 3775/5000 [12:50<03:23,  6.01it/s][A
 76%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 3776/5000 [12:50<03:23,  6.01it/s][A
 76%|███████████████████████████████████████████████████████████████████████████████████████████████████▋          

 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████                              | 3864/5000 [13:05<03:18,  5.72it/s][A
 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████                              | 3865/5000 [13:05<03:23,  5.57it/s][A
 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████                              | 3866/5000 [13:05<03:17,  5.73it/s][A
 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████                              | 3867/5000 [13:06<03:14,  5.83it/s][A
 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████                              | 3868/5000 [13:06<03:19,  5.68it/s][A
 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████▏       

 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 3956/5000 [13:20<02:48,  6.20it/s][A
 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 3957/5000 [13:20<02:47,  6.21it/s][A
 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 3958/5000 [13:20<02:47,  6.21it/s][A
 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████▌                           | 3959/5000 [13:21<02:47,  6.21it/s][A
 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████▌                           | 3960/5000 [13:21<02:47,  6.20it/s][A
 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████▌     

 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▊                         | 4048/5000 [13:35<02:36,  6.10it/s][A
 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉                         | 4049/5000 [13:35<02:35,  6.12it/s][A
 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉                         | 4050/5000 [13:36<02:35,  6.12it/s][A
 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉                         | 4051/5000 [13:36<02:35,  6.12it/s][A
 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉                         | 4052/5000 [13:36<02:34,  6.14it/s][A
 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉   

 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                      | 4140/5000 [13:50<02:21,  6.10it/s][A
 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                      | 4141/5000 [13:51<02:21,  6.09it/s][A
 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                      | 4142/5000 [13:51<02:20,  6.10it/s][A
 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                      | 4143/5000 [13:51<02:19,  6.14it/s][A
 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                      | 4144/5000 [13:51<02:19,  6.14it/s][A
 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍

 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 4232/5000 [14:05<02:04,  6.14it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 4233/5000 [14:06<02:04,  6.15it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 4234/5000 [14:06<02:04,  6.17it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 4235/5000 [14:06<02:03,  6.18it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 4236/5000 [14:06<02:03,  6.18it/s][A
 85%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                 | 4324/5000 [14:21<01:49,  6.15it/s][A
 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                 | 4325/5000 [14:21<01:49,  6.15it/s][A
 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                 | 4326/5000 [14:21<01:49,  6.14it/s][A
 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                 | 4327/5000 [14:21<01:48,  6.18it/s][A
 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                 | 4328/5000 [14:21<01:49,  6.16it/s][A
 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌               | 4416/5000 [14:36<01:34,  6.15it/s][A
 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌               | 4417/5000 [14:36<01:34,  6.17it/s][A
 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋               | 4418/5000 [14:36<01:34,  6.13it/s][A
 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋               | 4419/5000 [14:36<01:35,  6.11it/s][A
 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋               | 4420/5000 [14:36<01:34,  6.12it/s][A
 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████             | 4508/5000 [14:51<01:20,  6.09it/s][A
 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████             | 4509/5000 [14:51<01:20,  6.11it/s][A
 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████             | 4510/5000 [14:51<01:20,  6.12it/s][A
 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████             | 4511/5000 [14:51<01:19,  6.14it/s][A
 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████             | 4512/5000 [14:51<01:19,  6.14it/s][A
 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍          | 4600/5000 [15:06<01:05,  6.09it/s][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍          | 4601/5000 [15:06<01:05,  6.10it/s][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍          | 4602/5000 [15:06<01:05,  6.12it/s][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌          | 4603/5000 [15:06<01:04,  6.15it/s][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌          | 4604/5000 [15:06<01:04,  6.16it/s][A
 92%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊        | 4692/5000 [15:21<00:49,  6.22it/s][A
 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉        | 4693/5000 [15:21<00:49,  6.19it/s][A
 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉        | 4694/5000 [15:21<00:49,  6.18it/s][A
 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉        | 4695/5000 [15:21<00:49,  6.17it/s][A
 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉        | 4696/5000 [15:21<00:49,  6.19it/s][A
 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎     | 4784/5000 [15:36<00:35,  6.10it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎     | 4785/5000 [15:36<00:35,  6.07it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎     | 4786/5000 [15:36<00:35,  6.05it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍     | 4787/5000 [15:36<00:35,  6.02it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍     | 4788/5000 [15:36<00:35,  6.02it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋   | 4876/5000 [15:51<00:19,  6.22it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊   | 4877/5000 [15:51<00:19,  6.19it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊   | 4878/5000 [15:51<00:19,  6.19it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊   | 4879/5000 [15:51<00:20,  6.02it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊   | 4880/5000 [15:52<00:19,  6.07it/s][A
 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏| 4968/5000 [16:06<00:05,  6.21it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏| 4969/5000 [16:06<00:04,  6.22it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏| 4970/5000 [16:06<00:04,  6.21it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏| 4971/5000 [16:06<00:04,  6.20it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 4972/5000 [16:06<00:04,  6.20it/s][A
 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████

  1%|█▌                                                                                                                                    | 58/5000 [00:19<29:15,  2.82it/s][A
  1%|█▌                                                                                                                                    | 59/5000 [00:19<29:12,  2.82it/s][A
  1%|█▌                                                                                                                                    | 60/5000 [00:19<29:06,  2.83it/s][A
  1%|█▋                                                                                                                                    | 61/5000 [00:20<28:58,  2.84it/s][A
  1%|█▋                                                                                                                                    | 62/5000 [00:20<29:04,  2.83it/s][A
  1%|█▋                                                                                                            

  3%|███▉                                                                                                                                 | 150/5000 [00:51<24:27,  3.30it/s][A
  3%|████                                                                                                                                 | 151/5000 [00:51<23:50,  3.39it/s][A
  3%|████                                                                                                                                 | 152/5000 [00:51<23:37,  3.42it/s][A
  3%|████                                                                                                                                 | 153/5000 [00:52<23:28,  3.44it/s][A
  3%|████                                                                                                                                 | 154/5000 [00:52<23:18,  3.47it/s][A
  3%|████                                                                                                          

  5%|██████▍                                                                                                                              | 242/5000 [01:21<24:11,  3.28it/s][A
  5%|██████▍                                                                                                                              | 243/5000 [01:21<27:24,  2.89it/s][A
  5%|██████▍                                                                                                                              | 244/5000 [01:21<26:13,  3.02it/s][A
  5%|██████▌                                                                                                                              | 245/5000 [01:22<25:25,  3.12it/s][A
  5%|██████▌                                                                                                                              | 246/5000 [01:22<24:52,  3.19it/s][A
  5%|██████▌                                                                                                       

  7%|████████▉                                                                                                                            | 334/5000 [01:53<31:39,  2.46it/s][A
  7%|████████▉                                                                                                                            | 335/5000 [01:53<33:15,  2.34it/s][A
  7%|████████▉                                                                                                                            | 336/5000 [01:54<31:01,  2.51it/s][A
  7%|████████▉                                                                                                                            | 337/5000 [01:54<32:58,  2.36it/s][A
  7%|████████▉                                                                                                                            | 338/5000 [01:55<34:13,  2.27it/s][A
  7%|█████████                                                                                                     

  9%|███████████▎                                                                                                                         | 426/5000 [02:28<28:31,  2.67it/s][A
  9%|███████████▎                                                                                                                         | 427/5000 [02:29<28:17,  2.69it/s][A
  9%|███████████▍                                                                                                                         | 428/5000 [02:29<28:13,  2.70it/s][A
  9%|███████████▍                                                                                                                         | 429/5000 [02:29<28:11,  2.70it/s][A
  9%|███████████▍                                                                                                                         | 430/5000 [02:30<28:08,  2.71it/s][A
  9%|███████████▍                                                                                                  

 10%|█████████████▊                                                                                                                       | 518/5000 [03:04<28:59,  2.58it/s][A
 10%|█████████████▊                                                                                                                       | 519/5000 [03:04<28:57,  2.58it/s][A
 10%|█████████████▊                                                                                                                       | 520/5000 [03:05<28:47,  2.59it/s][A
 10%|█████████████▊                                                                                                                       | 521/5000 [03:05<28:48,  2.59it/s][A
 10%|█████████████▉                                                                                                                       | 522/5000 [03:05<28:49,  2.59it/s][A
 10%|█████████████▉                                                                                                

 12%|████████████████▏                                                                                                                    | 610/5000 [03:41<32:11,  2.27it/s][A
 12%|████████████████▎                                                                                                                    | 611/5000 [03:42<34:30,  2.12it/s][A
 12%|████████████████▎                                                                                                                    | 612/5000 [03:42<32:50,  2.23it/s][A
 12%|████████████████▎                                                                                                                    | 613/5000 [03:43<35:11,  2.08it/s][A
 12%|████████████████▎                                                                                                                    | 614/5000 [03:43<33:50,  2.16it/s][A
 12%|████████████████▎                                                                                             

 14%|██████████████████▋                                                                                                                  | 702/5000 [04:19<29:34,  2.42it/s][A
 14%|██████████████████▋                                                                                                                  | 703/5000 [04:20<29:29,  2.43it/s][A
 14%|██████████████████▋                                                                                                                  | 704/5000 [04:20<29:23,  2.44it/s][A
 14%|██████████████████▊                                                                                                                  | 705/5000 [04:20<29:17,  2.44it/s][A
 14%|██████████████████▊                                                                                                                  | 706/5000 [04:21<29:17,  2.44it/s][A
 14%|██████████████████▊                                                                                           

 16%|█████████████████████                                                                                                                | 794/5000 [04:57<28:52,  2.43it/s][A
 16%|█████████████████████▏                                                                                                               | 795/5000 [04:58<28:51,  2.43it/s][A
 16%|█████████████████████▏                                                                                                               | 796/5000 [04:58<28:46,  2.44it/s][A
 16%|█████████████████████▏                                                                                                               | 797/5000 [04:59<28:47,  2.43it/s][A
 16%|█████████████████████▏                                                                                                               | 798/5000 [04:59<28:46,  2.43it/s][A
 16%|█████████████████████▎                                                                                        

 18%|███████████████████████▌                                                                                                             | 886/5000 [05:37<28:44,  2.39it/s][A
 18%|███████████████████████▌                                                                                                             | 887/5000 [05:37<28:52,  2.37it/s][A
 18%|███████████████████████▌                                                                                                             | 888/5000 [05:37<28:51,  2.38it/s][A
 18%|███████████████████████▋                                                                                                             | 889/5000 [05:38<28:50,  2.38it/s][A
 18%|███████████████████████▋                                                                                                             | 890/5000 [05:38<29:06,  2.35it/s][A
 18%|███████████████████████▋                                                                                      

 20%|██████████████████████████                                                                                                           | 978/5000 [06:16<28:45,  2.33it/s][A
 20%|██████████████████████████                                                                                                           | 979/5000 [06:17<28:36,  2.34it/s][A
 20%|██████████████████████████                                                                                                           | 980/5000 [06:17<28:32,  2.35it/s][A
 20%|██████████████████████████                                                                                                           | 981/5000 [06:18<28:30,  2.35it/s][A
 20%|██████████████████████████                                                                                                           | 982/5000 [06:18<28:25,  2.36it/s][A
 20%|██████████████████████████▏                                                                                   

 21%|████████████████████████████▏                                                                                                       | 1070/5000 [06:56<33:10,  1.97it/s][A
 21%|████████████████████████████▎                                                                                                       | 1071/5000 [06:57<33:07,  1.98it/s][A
 21%|████████████████████████████▎                                                                                                       | 1072/5000 [06:57<33:15,  1.97it/s][A
 21%|████████████████████████████▎                                                                                                       | 1073/5000 [06:58<33:17,  1.97it/s][A
 21%|████████████████████████████▎                                                                                                       | 1074/5000 [06:58<33:40,  1.94it/s][A
 22%|████████████████████████████▍                                                                                 

 23%|██████████████████████████████▋                                                                                                     | 1162/5000 [07:36<26:00,  2.46it/s][A
 23%|██████████████████████████████▋                                                                                                     | 1163/5000 [07:36<25:50,  2.47it/s][A
 23%|██████████████████████████████▋                                                                                                     | 1164/5000 [07:37<25:44,  2.48it/s][A
 23%|██████████████████████████████▊                                                                                                     | 1165/5000 [07:37<25:45,  2.48it/s][A
 23%|██████████████████████████████▊                                                                                                     | 1166/5000 [07:38<25:46,  2.48it/s][A
 23%|██████████████████████████████▊                                                                               

 25%|█████████████████████████████████                                                                                                   | 1254/5000 [08:16<25:33,  2.44it/s][A
 25%|█████████████████████████████████▏                                                                                                  | 1255/5000 [08:17<25:37,  2.44it/s][A
 25%|█████████████████████████████████▏                                                                                                  | 1256/5000 [08:17<25:30,  2.45it/s][A
 25%|█████████████████████████████████▏                                                                                                  | 1257/5000 [08:17<25:27,  2.45it/s][A
 25%|█████████████████████████████████▏                                                                                                  | 1258/5000 [08:18<25:29,  2.45it/s][A
 25%|█████████████████████████████████▏                                                                            

 27%|███████████████████████████████████▌                                                                                                | 1346/5000 [08:54<25:01,  2.43it/s][A
 27%|███████████████████████████████████▌                                                                                                | 1347/5000 [08:55<25:11,  2.42it/s][A
 27%|███████████████████████████████████▌                                                                                                | 1348/5000 [08:55<25:10,  2.42it/s][A
 27%|███████████████████████████████████▌                                                                                                | 1349/5000 [08:55<25:09,  2.42it/s][A
 27%|███████████████████████████████████▋                                                                                                | 1350/5000 [08:56<25:17,  2.41it/s][A
 27%|███████████████████████████████████▋                                                                          

 29%|█████████████████████████████████████▉                                                                                              | 1438/5000 [09:48<39:43,  1.49it/s][A
 29%|█████████████████████████████████████▉                                                                                              | 1439/5000 [09:49<39:52,  1.49it/s][A
 29%|██████████████████████████████████████                                                                                              | 1440/5000 [09:49<39:52,  1.49it/s][A
 29%|██████████████████████████████████████                                                                                              | 1441/5000 [09:50<39:52,  1.49it/s][A
 29%|██████████████████████████████████████                                                                                              | 1442/5000 [09:51<39:51,  1.49it/s][A
 29%|██████████████████████████████████████                                                                        

 31%|████████████████████████████████████████▍                                                                                           | 1530/5000 [10:50<39:03,  1.48it/s][A
 31%|████████████████████████████████████████▍                                                                                           | 1531/5000 [10:51<38:51,  1.49it/s][A
 31%|████████████████████████████████████████▍                                                                                           | 1532/5000 [10:51<38:56,  1.48it/s][A
 31%|████████████████████████████████████████▍                                                                                           | 1533/5000 [10:52<38:51,  1.49it/s][A
 31%|████████████████████████████████████████▍                                                                                           | 1534/5000 [10:53<39:00,  1.48it/s][A
 31%|████████████████████████████████████████▌                                                                     

In [None]:
for label,(ae, opt, results) in tqdm(ae_results.items()):
    plt.figure()
    plt.plot(results['loss_train'], label='train_loss')
    plt.plot(results['loss_val'], label='val_loss')
    plt.plot(results['knn_maes'], label='knn_maes')
    plt.yscale('log')
    plt.xscale('log')
    plt.xlabel('epoch')
    knn_mae_min = round(min(results['knn_maes']),2)
    loss_val_min = round(min(results['loss_val']),2)
    plt.title(f'{label} \n knn_min: {knn_mae_min}, loss_val_min: {loss_val_min}')
    plt.legend()
    plt.show()

# Embedding

In [None]:
knn_mae_scorer = lambda *args: KNN_MAE(*args, averaging='median', weights='distance', n_neighbors=5)
PERCENTILE = 95
DATA_PERCENT_THRESHOLD = 0.9

for label,Z in ae_embeddings.items():
    
    print(label)
    
    X_orig = data_orig[label]

    mae = knn_mae_scorer(X_orig, Z)
    baseline_mae = knn_mae_scorer(X_orig, X_orig)
    Q_loc, Q_glob = calculate_Q_metrics(X_orig, Z)
    
    d = {}
    
    d['Q_loc'] = Q_loc
    d['Q_glob'] = Q_glob
    d['knn_mae'] = mae
    d['knn_mae_base'] = baseline_mae 

    N = X_orig.shape[0]
    X_ = X_orig.copy()
    Z_ = Z.copy() 

    inliers_indexes = np.arange(N)
    # iteratively choosing subset of high-mae outliers
    maxiter = 20
    for _ in range(maxiter):
        scoring_list = KNN_MAE(X_, Z_, averaging=None, weights='distance', n_neighbors=5) 
        q = np.percentile(scoring_list, PERCENTILE)
        mask = scoring_list < q
        if mask.sum()/N < DATA_PERCENT_THRESHOLD:
            break
        X_ = X_[mask]
        Z_ = Z_[mask]
        inliers_indexes = inliers_indexes[mask]

    outliers_indexes = set(np.arange(N)) - set(inliers_indexes)
    # cast set to np.array
    outliers_indexes = np.array(list(outliers_indexes))

    mae_ = knn_mae_scorer(X_, Z_)
    baseline_mae_ = knn_mae_scorer(X_, X_)
    Q_loc_, Q_glob_ = calculate_Q_metrics(X_, Z_)

    d['inliers_indexes_mae'] = inliers_indexes
    d['outliers_indexes_mae'] = outliers_indexes
    d['X_'] = X_
    d['Z_'] = Z_ # final embedding
    d['Q_loc_'] = Q_loc_ 
    d['Q_glob_'] = Q_glob_ 
    d['knn_mae_'] = mae_ # final mae
    d['knn_mae_base_'] = baseline_mae_ 

    print(f'Initial metrics: mae={mae}, Q_loc={Q_loc}, Q_glob={Q_glob}, baseline_error: {baseline_mae}') 
    print(f'After removing outliers: mae={mae_}, Q_loc={Q_loc_}, Q_glob={Q_glob_}, baseline_error: {baseline_mae_}')
    print('-----------------------------------------------------------','\n')
    
    path = os.path.join(embeddings_root, f'{label}_ae')
    np.save(path, d)

In [11]:
ls -la ./results/embeddings/

total 146804
drwxr-xr-x  2 ibulygin users    4096 апр 13 02:26 [0m[01;34m.[0m/
drwxr-xr-x 19 ibulygin users    4096 апр 13 00:49 [01;34m..[0m/
-rw-r--r--  1 ibulygin users 5089532 апр 13 02:24 AGP_f_ae.npy
-rw-r--r--  1 ibulygin users 5972901 апр 12 17:24 AGP_f_isomap.npy
-rw-r--r--  1 ibulygin users 5972901 апр 12 17:09 AGP_f_lle.npy
-rw-r--r--  1 ibulygin users 5972901 апр 12 18:26 AGP_f_spectral.npy
-rw-r--r--  1 ibulygin users 5393934 апр 12 18:24 AGP_f_tsne.npy
-rw-r--r--  1 ibulygin users 5393934 апр 12 17:07 AGP_f_umap.npy
-rw-r--r--  1 ibulygin users 7767428 апр 13 02:25 AGP_g_ae.npy
-rw-r--r--  1 ibulygin users 8650797 апр 12 21:56 AGP_g_isomap.npy
-rw-r--r--  1 ibulygin users 8650797 апр 12 17:20 AGP_g_lle.npy
-rw-r--r--  1 ibulygin users 8650797 апр 12 23:42 AGP_g_spectral.npy
-rw-r--r--  1 ibulygin users 8071830 апр 12 23:41 AGP_g_tsne.npy
-rw-r--r--  1 ibulygin users 8071830 апр 12 17:18 AGP_g_umap.npy
-rw-r--r--  1 ibulygin users 2960948 апр 13 02:23 A