In [1]:
import os
import sys

os.environ["CUDA_VISIBLE_DEVICES"] = "7"
sys.path.append('../') 

In [None]:
import rdkit
from rdkit import Chem
from rdkit.Chem import AllChem
import numpy as np

import random
from demo.ConfSeq import get_ConfSeq_pair_from_mol,get_mol_from_ConfSeq_pair,randomize_mol
import copy
from tqdm import tqdm
from rdkit.Chem import rdmolops, rdchem
from tqdm.contrib.concurrent import process_map  

from torch.utils.data import Dataset, DataLoader
from torch.nn.utils.rnn import pad_sequence

from transformers import BartForConditionalGeneration, BartConfig
from collections import OrderedDict
import torch
from torch import nn

import numpy as np
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt

from rdkit.ML.Scoring import Scoring
import pandas as pd

  from .autonotebook import tqdm as notebook_tqdm


In [None]:
vocab = [chr(i) for i in range(33, 127)] 

for i in range(-180,180):
    vocab.append('<'+str(i)+'>')

vocab.append('<mask>')
vocab.append('<unk>')
vocab.append('<sos>')
vocab.append('<eos>')
vocab.append('<pad>')


config = BartConfig()

config.pad_token_id = vocab.index('<pad>')
config.eos_token_id = vocab.index('<eos>')
config.sos_token_id = vocab.index('<sos>')
config.forced_eos_token_id = None
config.encoder_layers = 6
config.encoder_attention_heads = 8
config.decoder_layers = 0
config.decoder_attention_heads = 0
config.d_model = 256
# config.share_embeddings = True
config.vocab_size = len(vocab)


vocab_dict = {char: idx for idx, char in enumerate(vocab)}
bart = BartForConditionalGeneration(config = config )


class CustomBartEncoder(nn.Module):
    def __init__(self, bart):
        super().__init__()
    
        self.bart_model = bart 
        
    def forward(self, input_ids, attention_mask=None):
        outputs = self.bart_model.model.encoder(input_ids=input_ids, attention_mask=attention_mask)
        return outputs.last_hidden_state

bart_encoder_model  = CustomBartEncoder(bart)

In [None]:
def rm_invalid_chirality(mol):
    mol = copy.deepcopy(mol)
    rings = rdmolops.GetSymmSSSR(mol)

    atom_in_rings_count = {}

    for ring in rings:
        for atom_idx in ring:
            if atom_idx not in atom_in_rings_count:
                atom_in_rings_count[atom_idx] = 0
            atom_in_rings_count[atom_idx] += 1

    atoms_in_3_rings = [atom for atom, count in atom_in_rings_count.items() if count == 3]

    for atom_idx in atoms_in_3_rings:
        atom = mol.GetAtomWithIdx(atom_idx)
        atom.SetChiralTag(rdchem.ChiralType.CHI_UNSPECIFIED)

    return mol

In [5]:
def get_ConfSeq(query_mol):

    if query_mol != None:
        try:
            query_mol = rm_invalid_chirality(query_mol)
            query_mol = randomize_mol(query_mol)
            Chem.MolToSmiles(query_mol)    
            query_mol = Chem.RenumberAtoms(query_mol, eval(query_mol.GetProp('_smilesAtomOutputOrder'))) 
            Chem.MolToSmiles(query_mol,canonical = False)
            query_mol = Chem.RenumberAtoms(query_mol, eval(query_mol.GetProp('_smilesAtomOutputOrder'))) 
            in_smiles,TD_smiles = get_ConfSeq_pair_from_mol(query_mol)
            TD_smiles = TD_smiles.replace('<180>','<-180>')
            
        except:
            in_smiles,TD_smiles = '',''            
    else:
        in_smiles,TD_smiles = '',''
        
    return TD_smiles

In [6]:
def get_embedding_for_seq(i):
    int = [vocab_dict[i] for i in i.split(' ')] 
    int = torch.Tensor([int]).long()
    embed = bart_encoder_model(int).mean(dim=1).tolist()[0]
    return embed

In [None]:
class TensorDataset(Dataset):
    def __init__(self, data):
        self.data = data

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        return torch.Tensor(self.data[idx]).long()

def collate_fn(batch):
    data = batch  
    padded_data = pad_sequence(data, batch_first=True, padding_value = vocab.index('<pad>'))  
    return padded_data


def mean_pooling(last_hidden_state, attention_mask):

    attention_mask = attention_mask.unsqueeze(-1).expand(last_hidden_state.size())

    sum_embeddings = (last_hidden_state * attention_mask).sum(dim=1)
    sum_mask = attention_mask.sum(dim=1)

    pooled_output = sum_embeddings / (sum_mask + 1e-8)  
    return pooled_output

In [8]:
device = torch.device('cuda')

In [None]:
checkpoint = torch.load('./checkpoints/model_epoch_1.pth', map_location='cpu')   


new_state_dict = OrderedDict()
for k, v in checkpoint.items():
    if k.startswith('module.'):
        new_state_dict[k[7:]] = v
    else:
        new_state_dict[k] = v

bart_encoder_model.load_state_dict(new_state_dict)

bart_encoder_model.eval()



lis = os.listdir('./data/DUDE/all/')
lis = [i for i in lis if '.txt' not in i]

for name in lis[:]:
    os.makedirs('./data/DUDE/all_result/{}/'.format(name), exist_ok=True)
    
    query_mol = Chem.MolFromMolFile('./data/DUDE/all/{}/crystal_ligand.sdf'.format(name))
    query_mol_atom_num = query_mol.GetNumAtoms()
    
    suppl = Chem.SDMolSupplier('./data/DUDE/all/{}/actives.sdf'.format(name))

    actives_mols = [mol for mol in suppl if mol is not None]
    actives_names = [i.GetProp('_Name') for i in actives_mols]
    actives_mols_atom_num = [i.GetNumAtoms() for i in actives_mols]
    
    suppl = Chem.SDMolSupplier('./data/DUDE/all/{}/decoys.sdf'.format(name))

    decoys_mols = [mol for mol in suppl if mol is not None]
    decoys_names = [i.GetProp('_Name') for i in decoys_mols]
    decoys_mols_atom_num = [i.GetNumAtoms() for i in decoys_mols]
    


    actives_seqs = process_map(get_ConfSeq, tqdm(actives_mols), max_workers = 32)
    print('actives_seqs length:',len(actives_seqs))
    
    decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
    print('decoys_seqs length:',len(decoys_seqs))

    with open('./data/DUDE/all_result/{}/actives_seqs.txt'.format(name),'w+') as f:
        f.write('\n'.join(actives_seqs))

    with open('./data/DUDE/all_result/{}/decoys_seqs.txt'.format(name),'w+') as f:
        f.write('\n'.join(decoys_seqs))


    with open('./data/DUDE/all_result/{}/actives_seqs.txt'.format(name),'r') as f:
        content = f.read()
    active_seqs = content.split('\n')   
    active_seqs = [i if i != '' else '*' for i in actives_seqs]
    
    
    with open('./data/DUDE/all_result/{}/decoys_seqs.txt'.format(name),'r') as f:
        content = f.read()
    decoys_seqs = content.split('\n') 
    decoys_seqs = [i if i != '' else '*' for i in decoys_seqs]
    bart_encoder_model.eval()
    

    device = torch.device('cuda')
    bart_encoder_model = bart_encoder_model.to(device)

    active_ints = [[vocab_dict[i] for i in seq.split(' ')] for seq in actives_seqs]
    active_dataset = TensorDataset(active_ints)
    active_dataloader = DataLoader(active_dataset, batch_size=32,collate_fn=collate_fn,shuffle = False)
    active_embeds = []
    
    with torch.no_grad():  
    
        for input_ids in active_dataloader:
            input_ids = input_ids.to(device)
            attention_mask = (input_ids != vocab.index('<pad>')).long() 
            
            output = bart_encoder_model(input_ids,attention_mask)
            pooled_output = mean_pooling(output, attention_mask)
            active_embeds.append(pooled_output)
    
    active_embeds = torch.cat(tuple(active_embeds), dim=0).to('cpu')

    inactive_ints = [[vocab_dict[i] for i in seq.split(' ')] for seq in decoys_seqs]
    inactive_dataset = TensorDataset(inactive_ints)
    inactive_dataloader = DataLoader(inactive_dataset, batch_size=32,collate_fn=collate_fn,shuffle = False)
    inactive_embeds = []
    
    with torch.no_grad():  
    
        for input_ids in inactive_dataloader:
            input_ids = input_ids.to(device)
            attention_mask = (input_ids != vocab.index('<pad>')).long() 
   
            output = bart_encoder_model(input_ids,attention_mask)
            pooled_output = mean_pooling(output, attention_mask)
            inactive_embeds.append(pooled_output)
    
    inactive_embeds = torch.cat(tuple(inactive_embeds), dim=0).to('cpu')


    fingerprints = np.vstack([active_embeds,inactive_embeds])
    labels = np.array([1] * len(active_embeds) + [0] * len(inactive_embeds))  

    mols_atom_num = actives_mols_atom_num + decoys_mols_atom_num
    
    
    bart_encoder_model.to(torch.device('cpu'))
    query_embeds = get_embedding_for_seq(get_ConfSeq(query_mol))
    query_embeds = torch.Tensor(query_embeds)
    euclidean_distance = torch.sqrt(torch.sum((query_embeds - fingerprints ) ** 2,dim = -1))
    similarity_score = 1 / (1 + euclidean_distance)

    mols_atom_num = np.array(mols_atom_num)
    factor = 2 * mols_atom_num/ (query_mol_atom_num + mols_atom_num)
    similarity_score = similarity_score * factor

    

    df = pd.DataFrame({"Name": actives_names + decoys_names,
                       "Score": similarity_score.tolist(),
                       "label": labels.tolist()})
    df.to_csv('./data/DUDE/all_result/{}/my_model_result.csv'.format(name), index=False)

    if torch.is_tensor(similarity_score):
        similarity_score_np = similarity_score.cpu().numpy()
    else:
        similarity_score_np = similarity_score

    sort_idx = np.argsort(-similarity_score_np)
    sorted_scores = similarity_score_np[sort_idx]
    sorted_labels = labels[sort_idx]

    sorted_labels_bool = sorted_labels.astype(bool)

    score_data = np.column_stack((sorted_scores, sorted_labels_bool))

    auc_rdkit = Scoring.CalcAUC(score_data, col=1)

    bedroc_rdkit = Scoring.CalcBEDROC(score_data, col=1, alpha=80.5)

    ef_1 = Scoring.CalcEnrichment(score_data, col=1, fractions=[0.01])[0]
    ef_5 = Scoring.CalcEnrichment(score_data, col=1, fractions=[0.05])[0]
    

    row = {
        "Name": name,
        "AUC": round(auc_rdkit, 4),
        "BEDROC": round(bedroc_rdkit, 4),
        "EF5%": round(ef_5, 4),
        "EF1%": round(ef_1, 4)
    }
    

    csv_path = './DUDE_evaluation_result.csv'
    if not os.path.exists(csv_path):
        df = pd.DataFrame([row])
        df.to_csv(csv_path, index=False)
    else:
        df = pd.DataFrame([row])
        df.to_csv(csv_path, mode='a', index=False, header=False)

100%|██████████████████████████████████████████| 485/485 [00:00<00:00, 925.48it/s]
100%|█████████████████████████████████████████| 485/485 [00:00<00:00, 1462.78it/s]


actives_seqs length: 485


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 18219/18219 [00:01<00:00, 11001.86it/s]
100%|█████████████████████████████████████| 18219/18219 [00:07<00:00, 2320.81it/s]


decoys_seqs length: 18219


100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 240.48it/s]
100%|█████████████████████████████████████████| 185/185 [00:00<00:00, 1211.22it/s]


actives_seqs length: 185


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6298/6298 [00:01<00:00, 5006.68it/s]
100%|███████████████████████████████████████| 6298/6298 [00:02<00:00, 2373.69it/s]


decoys_seqs length: 6298


100%|██████████████████████████████████████████| 251/251 [00:00<00:00, 302.30it/s]
100%|█████████████████████████████████████████| 251/251 [00:00<00:00, 1117.96it/s]


actives_seqs length: 251


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 10094/10094 [00:01<00:00, 6323.70it/s]
100%|█████████████████████████████████████| 10094/10094 [00:04<00:00, 2147.99it/s]


decoys_seqs length: 10094


100%|██████████████████████████████████████████| 742/742 [00:00<00:00, 827.88it/s]
100%|█████████████████████████████████████████| 742/742 [00:00<00:00, 1870.38it/s]


actives_seqs length: 742


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 30401/30401 [00:02<00:00, 12481.63it/s]
100%|█████████████████████████████████████| 30401/30401 [00:11<00:00, 2650.68it/s]


decoys_seqs length: 30401


100%|██████████████████████████████████████████| 201/201 [00:00<00:00, 224.71it/s]
100%|█████████████████████████████████████████| 201/201 [00:00<00:00, 1371.64it/s]


actives_seqs length: 201


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 2723/2723 [00:01<00:00, 2521.17it/s]
100%|███████████████████████████████████████| 2723/2723 [00:01<00:00, 2524.88it/s]


decoys_seqs length: 2723


100%|██████████████████████████████████████████| 443/443 [00:00<00:00, 459.71it/s]
100%|█████████████████████████████████████████| 443/443 [00:00<00:00, 1568.49it/s]


actives_seqs length: 443


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 15807/15807 [00:01<00:00, 8017.31it/s]
100%|█████████████████████████████████████| 15807/15807 [00:05<00:00, 2708.80it/s]


decoys_seqs length: 15807


100%|██████████████████████████████████████████| 251/251 [00:00<00:00, 280.13it/s]
100%|█████████████████████████████████████████| 251/251 [00:00<00:00, 1743.83it/s]


actives_seqs length: 251


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 10934/10934 [00:01<00:00, 6518.85it/s]
100%|█████████████████████████████████████| 10934/10934 [00:04<00:00, 2586.78it/s]


decoys_seqs length: 10934


100%|██████████████████████████████████████████| 132/132 [00:00<00:00, 148.70it/s]
100%|█████████████████████████████████████████| 132/132 [00:00<00:00, 1256.37it/s]


actives_seqs length: 132


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 2865/2865 [00:01<00:00, 2344.32it/s]
100%|███████████████████████████████████████| 2865/2865 [00:01<00:00, 2297.21it/s]


decoys_seqs length: 2865


100%|██████████████████████████████████████████| 832/832 [00:00<00:00, 843.60it/s]
100%|█████████████████████████████████████████| 832/832 [00:00<00:00, 1583.76it/s]


actives_seqs length: 832


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 35424/35424 [00:02<00:00, 12429.97it/s]
100%|█████████████████████████████████████| 35424/35424 [00:15<00:00, 2267.05it/s]


decoys_seqs length: 35424


  actives_seqs = process_map(get_ConfSeq, tqdm(actives_mols), max_workers = 32)
100%|████████████████████████████████████████| 1038/1038 [00:01<00:00, 752.90it/s]
100%|███████████████████████████████████████| 1038/1038 [00:00<00:00, 1776.95it/s]


actives_seqs length: 1038


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 37980/37980 [00:03<00:00, 12181.92it/s]
100%|█████████████████████████████████████| 37980/37980 [00:15<00:00, 2421.09it/s]


decoys_seqs length: 37980


100%|███████████████████████████████████████████| 127/127 [00:01<00:00, 93.07it/s]
100%|█████████████████████████████████████████| 127/127 [00:00<00:00, 1124.68it/s]


actives_seqs length: 127


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 4803/4803 [00:01<00:00, 3149.21it/s]
100%|███████████████████████████████████████| 4803/4803 [00:02<00:00, 2126.11it/s]


decoys_seqs length: 4803


100%|██████████████████████████████████████████| 226/226 [00:01<00:00, 173.01it/s]
100%|██████████████████████████████████████████| 226/226 [00:00<00:00, 939.76it/s]


actives_seqs length: 226


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 9406/9406 [00:02<00:00, 4587.72it/s]
100%|███████████████████████████████████████| 9406/9406 [00:04<00:00, 1977.89it/s]


decoys_seqs length: 9406


100%|██████████████████████████████████████████| 683/683 [00:01<00:00, 519.23it/s]
100%|█████████████████████████████████████████| 683/683 [00:00<00:00, 1343.12it/s]


actives_seqs length: 683


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 27840/27840 [00:02<00:00, 9709.16it/s]
100%|█████████████████████████████████████| 27840/27840 [00:13<00:00, 2124.69it/s]


decoys_seqs length: 27840


100%|██████████████████████████████████████████| 202/202 [00:01<00:00, 157.58it/s]
100%|█████████████████████████████████████████| 202/202 [00:00<00:00, 1354.22it/s]


actives_seqs length: 202


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6372/6372 [00:01<00:00, 3403.76it/s]
100%|███████████████████████████████████████| 6372/6372 [00:02<00:00, 2807.81it/s]


decoys_seqs length: 6372


100%|██████████████████████████████████████████| 620/620 [00:01<00:00, 477.02it/s]
100%|█████████████████████████████████████████| 620/620 [00:00<00:00, 1354.22it/s]


actives_seqs length: 620


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 25260/25260 [00:02<00:00, 9608.09it/s]
100%|█████████████████████████████████████| 25260/25260 [00:10<00:00, 2314.57it/s]


decoys_seqs length: 25260


100%|██████████████████████████████████████████| 273/273 [00:01<00:00, 208.12it/s]
100%|█████████████████████████████████████████| 273/273 [00:00<00:00, 1278.80it/s]


actives_seqs length: 273


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 5832/5832 [00:01<00:00, 3289.64it/s]
100%|███████████████████████████████████████| 5832/5832 [00:02<00:00, 2239.14it/s]


decoys_seqs length: 5832


100%|██████████████████████████████████████████| 242/242 [00:01<00:00, 180.96it/s]
100%|█████████████████████████████████████████| 242/242 [00:00<00:00, 1223.64it/s]


actives_seqs length: 242


100%|██████████████████████████████████████████| 494/494 [00:01<00:00, 376.51it/s]
100%|█████████████████████████████████████████| 494/494 [00:00<00:00, 1387.54it/s]


decoys_seqs length: 494


100%|██████████████████████████████████████████| 161/161 [00:01<00:00, 119.69it/s]
100%|█████████████████████████████████████████| 161/161 [00:00<00:00, 1568.88it/s]


actives_seqs length: 161


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 5737/5737 [00:01<00:00, 3263.70it/s]
100%|███████████████████████████████████████| 5737/5737 [00:02<00:00, 2707.42it/s]


decoys_seqs length: 5737


100%|██████████████████████████████████████████| 234/234 [00:01<00:00, 182.51it/s]
100%|█████████████████████████████████████████| 234/234 [00:00<00:00, 1650.42it/s]


actives_seqs length: 234


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 8065/8065 [00:01<00:00, 4462.79it/s]
100%|███████████████████████████████████████| 8065/8065 [00:02<00:00, 2841.86it/s]


decoys_seqs length: 8065


100%|███████████████████████████████████████████| 127/127 [00:01<00:00, 94.83it/s]
100%|█████████████████████████████████████████| 127/127 [00:00<00:00, 1165.39it/s]


actives_seqs length: 127


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 5214/5214 [00:01<00:00, 3463.45it/s]
100%|███████████████████████████████████████| 5214/5214 [00:02<00:00, 2312.45it/s]


decoys_seqs length: 5214


100%|█████████████████████████████████████████████| 86/86 [00:01<00:00, 65.67it/s]
100%|███████████████████████████████████████████| 86/86 [00:00<00:00, 1324.98it/s]


actives_seqs length: 86


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 3924/3924 [00:01<00:00, 2476.90it/s]
100%|███████████████████████████████████████| 3924/3924 [00:01<00:00, 2715.29it/s]


decoys_seqs length: 3924


100%|██████████████████████████████████████████| 297/297 [00:01<00:00, 226.71it/s]
100%|█████████████████████████████████████████| 297/297 [00:00<00:00, 1716.54it/s]


actives_seqs length: 297


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 12054/12054 [00:02<00:00, 5523.34it/s]
100%|█████████████████████████████████████| 12054/12054 [00:04<00:00, 2874.93it/s]


decoys_seqs length: 12054


100%|██████████████████████████████████████████| 624/624 [00:01<00:00, 473.50it/s]
100%|█████████████████████████████████████████| 624/624 [00:00<00:00, 1489.00it/s]


actives_seqs length: 624


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 20803/20803 [00:02<00:00, 7780.42it/s]
100%|█████████████████████████████████████| 20803/20803 [00:08<00:00, 2378.25it/s]


decoys_seqs length: 20803


100%|██████████████████████████████████████████| 311/311 [00:01<00:00, 240.26it/s]
100%|█████████████████████████████████████████| 311/311 [00:00<00:00, 1393.62it/s]


actives_seqs length: 311


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6878/6878 [00:01<00:00, 3821.09it/s]
100%|███████████████████████████████████████| 6878/6878 [00:02<00:00, 2311.57it/s]


decoys_seqs length: 6878


100%|██████████████████████████████████████████| 387/387 [00:01<00:00, 299.01it/s]
100%|█████████████████████████████████████████| 387/387 [00:00<00:00, 1284.43it/s]


actives_seqs length: 387


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6984/6984 [00:01<00:00, 3659.74it/s]
100%|███████████████████████████████████████| 6984/6984 [00:03<00:00, 2176.84it/s]


decoys_seqs length: 6984


100%|█████████████████████████████████████████████| 62/62 [00:01<00:00, 46.41it/s]
100%|███████████████████████████████████████████| 62/62 [00:00<00:00, 1086.71it/s]


actives_seqs length: 62


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 2901/2901 [00:01<00:00, 1774.52it/s]
100%|███████████████████████████████████████| 2901/2901 [00:00<00:00, 3028.25it/s]


decoys_seqs length: 2901


100%|██████████████████████████████████████████| 281/281 [00:01<00:00, 199.01it/s]
100%|█████████████████████████████████████████| 281/281 [00:00<00:00, 1269.74it/s]


actives_seqs length: 281


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 8666/8666 [00:02<00:00, 4268.06it/s]
100%|███████████████████████████████████████| 8666/8666 [00:03<00:00, 2510.25it/s]


decoys_seqs length: 8666


100%|██████████████████████████████████████████| 206/206 [00:01<00:00, 135.13it/s]
100%|█████████████████████████████████████████| 206/206 [00:00<00:00, 1287.65it/s]


actives_seqs length: 206


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6239/6239 [00:01<00:00, 3376.69it/s]
100%|███████████████████████████████████████| 6239/6239 [00:02<00:00, 2528.92it/s]


decoys_seqs length: 6239


  actives_seqs = process_map(get_ConfSeq, tqdm(actives_mols), max_workers = 32)
100%|████████████████████████████████████████| 1395/1395 [00:01<00:00, 964.34it/s]
100%|███████████████████████████████████████| 1395/1395 [00:00<00:00, 1533.69it/s]


actives_seqs length: 1395


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 36268/36268 [00:03<00:00, 11711.95it/s]
100%|█████████████████████████████████████| 36268/36268 [00:15<00:00, 2302.36it/s]


decoys_seqs length: 36268


100%|██████████████████████████████████████████| 350/350 [00:01<00:00, 214.15it/s]
100%|█████████████████████████████████████████| 350/350 [00:00<00:00, 1464.93it/s]


actives_seqs length: 350


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 10817/10817 [00:02<00:00, 3747.06it/s]
100%|█████████████████████████████████████| 10817/10817 [00:04<00:00, 2337.96it/s]


decoys_seqs length: 10817


100%|███████████████████████████████████████████| 129/129 [00:01<00:00, 79.93it/s]
100%|██████████████████████████████████████████| 129/129 [00:00<00:00, 924.14it/s]


actives_seqs length: 129


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 5213/5213 [00:02<00:00, 2518.16it/s]
100%|███████████████████████████████████████| 5213/5213 [00:02<00:00, 2153.25it/s]


decoys_seqs length: 5213


100%|██████████████████████████████████████████| 808/808 [00:01<00:00, 515.61it/s]
100%|█████████████████████████████████████████| 808/808 [00:00<00:00, 1931.56it/s]


actives_seqs length: 808


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 17135/17135 [00:02<00:00, 6041.85it/s]
100%|█████████████████████████████████████| 17135/17135 [00:06<00:00, 2666.17it/s]


decoys_seqs length: 17135


  actives_seqs = process_map(get_ConfSeq, tqdm(actives_mols), max_workers = 32)
100%|████████████████████████████████████████| 1078/1078 [00:01<00:00, 704.60it/s]
100%|███████████████████████████████████████| 1078/1078 [00:00<00:00, 2033.68it/s]


actives_seqs length: 1078


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 41339/41339 [00:03<00:00, 11928.08it/s]
100%|█████████████████████████████████████| 41339/41339 [00:15<00:00, 2584.17it/s]


decoys_seqs length: 41339


100%|██████████████████████████████████████████| 153/153 [00:01<00:00, 107.55it/s]
100%|█████████████████████████████████████████| 153/153 [00:00<00:00, 1036.10it/s]


actives_seqs length: 153


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6585/6585 [00:02<00:00, 2962.28it/s]
100%|███████████████████████████████████████| 6585/6585 [00:03<00:00, 2123.44it/s]


decoys_seqs length: 6585


100%|██████████████████████████████████████████| 562/562 [00:01<00:00, 394.63it/s]
100%|█████████████████████████████████████████| 562/562 [00:00<00:00, 1237.11it/s]


actives_seqs length: 562


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 15176/15176 [00:02<00:00, 6417.98it/s]
100%|█████████████████████████████████████| 15176/15176 [00:06<00:00, 2471.01it/s]


decoys_seqs length: 15176


100%|██████████████████████████████████████████| 519/519 [00:01<00:00, 317.90it/s]
100%|█████████████████████████████████████████| 519/519 [00:00<00:00, 1532.01it/s]


actives_seqs length: 519


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 19606/19606 [00:02<00:00, 7938.41it/s]
100%|█████████████████████████████████████| 19606/19606 [00:08<00:00, 2390.74it/s]


decoys_seqs length: 19606


100%|██████████████████████████████████████████| 798/798 [00:01<00:00, 576.72it/s]
100%|█████████████████████████████████████████| 798/798 [00:00<00:00, 1674.94it/s]


actives_seqs length: 798


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 28312/28312 [00:03<00:00, 9144.45it/s]
100%|█████████████████████████████████████| 28312/28312 [00:11<00:00, 2473.10it/s]


decoys_seqs length: 28312


100%|██████████████████████████████████████████| 313/313 [00:01<00:00, 229.17it/s]
100%|█████████████████████████████████████████| 313/313 [00:00<00:00, 1734.15it/s]


actives_seqs length: 313


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 3837/3837 [00:01<00:00, 2552.78it/s]
100%|███████████████████████████████████████| 3837/3837 [00:01<00:00, 2645.56it/s]


decoys_seqs length: 3837


100%|█████████████████████████████████████████████| 71/71 [00:01<00:00, 50.84it/s]
100%|████████████████████████████████████████████| 71/71 [00:00<00:00, 923.75it/s]


actives_seqs length: 71


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 2318/2318 [00:01<00:00, 1551.80it/s]
100%|███████████████████████████████████████| 2318/2318 [00:01<00:00, 2194.61it/s]


decoys_seqs length: 2318


100%|███████████████████████████████████████████| 134/134 [00:01<00:00, 96.87it/s]
100%|█████████████████████████████████████████| 134/134 [00:00<00:00, 1162.69it/s]


actives_seqs length: 134


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6645/6645 [00:01<00:00, 3862.07it/s]
100%|███████████████████████████████████████| 6645/6645 [00:02<00:00, 2405.40it/s]


decoys_seqs length: 6645


100%|██████████████████████████████████████████| 566/566 [00:01<00:00, 283.70it/s]
100%|█████████████████████████████████████████| 566/566 [00:00<00:00, 1899.42it/s]


actives_seqs length: 566


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 17375/17375 [00:02<00:00, 6875.28it/s]
100%|█████████████████████████████████████| 17375/17375 [00:06<00:00, 2815.95it/s]


decoys_seqs length: 17375


100%|██████████████████████████████████████████| 706/706 [00:01<00:00, 417.89it/s]
100%|█████████████████████████████████████████| 706/706 [00:00<00:00, 1399.43it/s]


actives_seqs length: 706


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 27790/27790 [00:03<00:00, 7349.83it/s]
100%|█████████████████████████████████████| 27790/27790 [00:12<00:00, 2276.92it/s]


decoys_seqs length: 27790


100%|██████████████████████████████████████████| 244/244 [00:01<00:00, 156.50it/s]
100%|█████████████████████████████████████████| 244/244 [00:00<00:00, 1107.56it/s]


actives_seqs length: 244


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 11423/11423 [00:02<00:00, 5086.03it/s]
100%|█████████████████████████████████████| 11423/11423 [00:05<00:00, 1906.60it/s]


decoys_seqs length: 11423


100%|██████████████████████████████████████████| 247/247 [00:01<00:00, 157.97it/s]
100%|██████████████████████████████████████████| 247/247 [00:00<00:00, 933.43it/s]


actives_seqs length: 247


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 8830/8830 [00:02<00:00, 3602.02it/s]
100%|███████████████████████████████████████| 8830/8830 [00:04<00:00, 2053.36it/s]


decoys_seqs length: 8830


100%|██████████████████████████████████████████| 522/522 [00:01<00:00, 332.94it/s]
100%|█████████████████████████████████████████| 522/522 [00:00<00:00, 1614.92it/s]


actives_seqs length: 522


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 14488/14488 [00:02<00:00, 5796.89it/s]
100%|█████████████████████████████████████| 14488/14488 [00:05<00:00, 2680.14it/s]


decoys_seqs length: 14488


100%|██████████████████████████████████████████| 190/190 [00:01<00:00, 125.98it/s]
100%|██████████████████████████████████████████| 190/190 [00:00<00:00, 902.11it/s]


actives_seqs length: 190


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6950/6950 [00:02<00:00, 3333.77it/s]
100%|███████████████████████████████████████| 6950/6950 [00:03<00:00, 2107.48it/s]


decoys_seqs length: 6950


100%|██████████████████████████████████████████| 758/758 [00:01<00:00, 493.96it/s]
100%|█████████████████████████████████████████| 758/758 [00:00<00:00, 1550.03it/s]


actives_seqs length: 758


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 26208/26208 [00:02<00:00, 8920.24it/s]
100%|█████████████████████████████████████| 26208/26208 [00:10<00:00, 2383.06it/s]


decoys_seqs length: 26208


100%|██████████████████████████████████████████| 168/168 [00:01<00:00, 111.97it/s]
100%|█████████████████████████████████████████| 168/168 [00:00<00:00, 1869.57it/s]


actives_seqs length: 168


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6919/6919 [00:02<00:00, 3213.87it/s]
100%|███████████████████████████████████████| 6919/6919 [00:02<00:00, 3135.21it/s]


decoys_seqs length: 6919


100%|██████████████████████████████████████████| 288/288 [00:01<00:00, 181.40it/s]
100%|█████████████████████████████████████████| 288/288 [00:00<00:00, 1277.80it/s]


actives_seqs length: 288


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 13232/13232 [00:02<00:00, 5494.48it/s]
100%|█████████████████████████████████████| 13232/13232 [00:06<00:00, 2131.23it/s]


decoys_seqs length: 13232


100%|██████████████████████████████████████████| 225/225 [00:01<00:00, 154.76it/s]
100%|█████████████████████████████████████████| 225/225 [00:00<00:00, 1085.00it/s]


actives_seqs length: 225


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 7430/7430 [00:02<00:00, 3444.53it/s]
100%|███████████████████████████████████████| 7430/7430 [00:03<00:00, 2143.10it/s]


decoys_seqs length: 7430


100%|██████████████████████████████████████████| 458/458 [00:01<00:00, 305.20it/s]
100%|█████████████████████████████████████████| 458/458 [00:00<00:00, 1563.91it/s]


actives_seqs length: 458


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 15952/15952 [00:02<00:00, 6339.44it/s]
100%|█████████████████████████████████████| 15952/15952 [00:06<00:00, 2497.11it/s]


decoys_seqs length: 15952


100%|██████████████████████████████████████████| 168/168 [00:01<00:00, 111.90it/s]
100%|█████████████████████████████████████████| 168/168 [00:00<00:00, 1199.31it/s]


actives_seqs length: 168


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 7651/7651 [00:02<00:00, 3715.06it/s]
100%|███████████████████████████████████████| 7651/7651 [00:03<00:00, 2016.85it/s]


decoys_seqs length: 7651


100%|███████████████████████████████████████████| 152/152 [00:01<00:00, 99.93it/s]
100%|█████████████████████████████████████████| 152/152 [00:00<00:00, 1678.29it/s]


actives_seqs length: 152


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6614/6614 [00:02<00:00, 3215.44it/s]
100%|███████████████████████████████████████| 6614/6614 [00:02<00:00, 3063.91it/s]


decoys_seqs length: 6614


100%|██████████████████████████████████████████| 244/244 [00:01<00:00, 161.27it/s]
100%|█████████████████████████████████████████| 244/244 [00:00<00:00, 1441.10it/s]


actives_seqs length: 244


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 9472/9472 [00:02<00:00, 4326.20it/s]
100%|███████████████████████████████████████| 9472/9472 [00:03<00:00, 2766.57it/s]


decoys_seqs length: 9472


100%|██████████████████████████████████████████| 664/664 [00:01<00:00, 442.32it/s]
100%|█████████████████████████████████████████| 664/664 [00:00<00:00, 1455.47it/s]


actives_seqs length: 664


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 26342/26342 [00:03<00:00, 8765.28it/s]
100%|█████████████████████████████████████| 26342/26342 [00:11<00:00, 2333.17it/s]


decoys_seqs length: 26342


100%|██████████████████████████████████████████| 238/238 [00:01<00:00, 159.30it/s]
100%|█████████████████████████████████████████| 238/238 [00:00<00:00, 1301.02it/s]


actives_seqs length: 238


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 10365/10365 [00:02<00:00, 4713.25it/s]
100%|█████████████████████████████████████| 10365/10365 [00:03<00:00, 2631.67it/s]


decoys_seqs length: 10365


100%|██████████████████████████████████████████| 286/286 [00:01<00:00, 191.57it/s]
100%|█████████████████████████████████████████| 286/286 [00:00<00:00, 1191.44it/s]


actives_seqs length: 286


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 12420/12420 [00:02<00:00, 5577.84it/s]
100%|█████████████████████████████████████| 12420/12420 [00:05<00:00, 2215.60it/s]


decoys_seqs length: 12420


100%|██████████████████████████████████████████| 183/183 [00:01<00:00, 122.56it/s]
100%|█████████████████████████████████████████| 183/183 [00:00<00:00, 1197.53it/s]


actives_seqs length: 183


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 7570/7570 [00:02<00:00, 3435.76it/s]
100%|███████████████████████████████████████| 7570/7570 [00:04<00:00, 1867.32it/s]


decoys_seqs length: 7570


100%|██████████████████████████████████████████| 792/792 [00:01<00:00, 519.32it/s]
100%|█████████████████████████████████████████| 792/792 [00:00<00:00, 1320.53it/s]


actives_seqs length: 792


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 20403/20403 [00:02<00:00, 7888.49it/s]
100%|█████████████████████████████████████| 20403/20403 [00:09<00:00, 2040.85it/s]


decoys_seqs length: 20403


100%|██████████████████████████████████████████| 531/531 [00:01<00:00, 354.39it/s]
100%|█████████████████████████████████████████| 531/531 [00:00<00:00, 1958.60it/s]


actives_seqs length: 531


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 23384/23384 [00:02<00:00, 8390.38it/s]
100%|█████████████████████████████████████| 23384/23384 [00:09<00:00, 2555.02it/s]


decoys_seqs length: 23384


100%|██████████████████████████████████████████| 222/222 [00:01<00:00, 150.75it/s]
100%|█████████████████████████████████████████| 222/222 [00:00<00:00, 1778.40it/s]


actives_seqs length: 222


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6222/6222 [00:01<00:00, 3757.44it/s]
100%|███████████████████████████████████████| 6222/6222 [00:02<00:00, 2863.48it/s]


decoys_seqs length: 6222


100%|██████████████████████████████████████████| 234/234 [00:01<00:00, 155.27it/s]
100%|█████████████████████████████████████████| 234/234 [00:00<00:00, 1475.22it/s]


actives_seqs length: 234


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 10510/10510 [00:02<00:00, 4528.29it/s]
100%|█████████████████████████████████████| 10510/10510 [00:03<00:00, 2705.04it/s]


decoys_seqs length: 10510


100%|██████████████████████████████████████████| 295/295 [00:01<00:00, 196.56it/s]
100%|█████████████████████████████████████████| 295/295 [00:00<00:00, 1074.64it/s]


actives_seqs length: 295


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 10878/10878 [00:02<00:00, 5051.89it/s]
100%|█████████████████████████████████████| 10878/10878 [00:05<00:00, 2040.55it/s]


decoys_seqs length: 10878


100%|██████████████████████████████████████████| 831/831 [00:01<00:00, 552.25it/s]
100%|█████████████████████████████████████████| 831/831 [00:00<00:00, 1465.08it/s]


actives_seqs length: 831


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 34945/34945 [00:03<00:00, 10806.25it/s]
100%|█████████████████████████████████████| 34945/34945 [00:16<00:00, 2143.96it/s]


decoys_seqs length: 34945


100%|██████████████████████████████████████████| 877/877 [00:01<00:00, 633.79it/s]
100%|█████████████████████████████████████████| 877/877 [00:00<00:00, 1644.43it/s]


actives_seqs length: 877


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 34171/34171 [00:03<00:00, 10834.84it/s]
100%|█████████████████████████████████████| 34171/34171 [00:14<00:00, 2433.96it/s]


decoys_seqs length: 34171


100%|██████████████████████████████████████████| 162/162 [00:01<00:00, 114.40it/s]
100%|█████████████████████████████████████████| 162/162 [00:00<00:00, 1150.72it/s]


actives_seqs length: 162


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 7707/7707 [00:01<00:00, 3958.46it/s]
100%|███████████████████████████████████████| 7707/7707 [00:03<00:00, 2252.01it/s]


decoys_seqs length: 7707


100%|██████████████████████████████████████████| 242/242 [00:01<00:00, 160.86it/s]
100%|█████████████████████████████████████████| 242/242 [00:00<00:00, 1167.61it/s]


actives_seqs length: 242


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 8235/8235 [00:02<00:00, 4030.35it/s]
100%|███████████████████████████████████████| 8235/8235 [00:03<00:00, 2076.58it/s]


decoys_seqs length: 8235


100%|███████████████████████████████████████████| 114/114 [00:01<00:00, 82.37it/s]
100%|██████████████████████████████████████████| 114/114 [00:00<00:00, 978.97it/s]


actives_seqs length: 114


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 5399/5399 [00:01<00:00, 2770.68it/s]
100%|███████████████████████████████████████| 5399/5399 [00:02<00:00, 2192.91it/s]


decoys_seqs length: 5399


100%|███████████████████████████████████████████| 122/122 [00:01<00:00, 82.28it/s]
100%|█████████████████████████████████████████| 122/122 [00:00<00:00, 1140.59it/s]


actives_seqs length: 122


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 3412/3412 [00:01<00:00, 2088.49it/s]
100%|███████████████████████████████████████| 3412/3412 [00:01<00:00, 2511.58it/s]


decoys_seqs length: 3412


100%|██████████████████████████████████████████| 211/211 [00:01<00:00, 140.64it/s]
100%|█████████████████████████████████████████| 211/211 [00:00<00:00, 1520.48it/s]


actives_seqs length: 211


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6752/6752 [00:01<00:00, 3411.66it/s]
100%|███████████████████████████████████████| 6752/6752 [00:02<00:00, 2583.27it/s]


decoys_seqs length: 6752


100%|██████████████████████████████████████████| 220/220 [00:01<00:00, 138.01it/s]
100%|█████████████████████████████████████████| 220/220 [00:00<00:00, 1511.78it/s]


actives_seqs length: 220


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 9128/9128 [00:02<00:00, 3693.92it/s]
100%|███████████████████████████████████████| 9128/9128 [00:03<00:00, 3032.85it/s]


decoys_seqs length: 9128


100%|██████████████████████████████████████████| 959/959 [00:01<00:00, 669.31it/s]
100%|█████████████████████████████████████████| 959/959 [00:00<00:00, 1598.52it/s]


actives_seqs length: 959


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 36626/36626 [00:03<00:00, 11360.25it/s]
100%|█████████████████████████████████████| 36626/36626 [00:15<00:00, 2377.65it/s]


decoys_seqs length: 36626


100%|██████████████████████████████████████████| 249/249 [00:01<00:00, 176.12it/s]
100%|█████████████████████████████████████████| 249/249 [00:00<00:00, 1811.07it/s]


actives_seqs length: 249


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 5471/5471 [00:01<00:00, 2808.05it/s]
100%|███████████████████████████████████████| 5471/5471 [00:01<00:00, 3146.78it/s]


decoys_seqs length: 5471


100%|██████████████████████████████████████████| 233/233 [00:01<00:00, 163.21it/s]
100%|█████████████████████████████████████████| 233/233 [00:00<00:00, 1021.51it/s]


actives_seqs length: 233


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 8687/8687 [00:02<00:00, 3971.55it/s]
100%|███████████████████████████████████████| 8687/8687 [00:04<00:00, 1828.31it/s]


decoys_seqs length: 8687


100%|██████████████████████████████████████████| 423/423 [00:01<00:00, 291.19it/s]
100%|█████████████████████████████████████████| 423/423 [00:00<00:00, 1197.86it/s]


actives_seqs length: 423


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 16572/16572 [00:02<00:00, 7312.88it/s]
100%|█████████████████████████████████████| 16572/16572 [00:07<00:00, 2295.06it/s]


decoys_seqs length: 16572


100%|██████████████████████████████████████████| 190/190 [00:01<00:00, 134.20it/s]
100%|█████████████████████████████████████████| 190/190 [00:00<00:00, 1763.53it/s]


actives_seqs length: 190


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 3483/3483 [00:01<00:00, 1881.60it/s]
100%|███████████████████████████████████████| 3483/3483 [00:01<00:00, 2993.71it/s]


decoys_seqs length: 3483


100%|██████████████████████████████████████████| 233/233 [00:01<00:00, 156.93it/s]
100%|█████████████████████████████████████████| 233/233 [00:00<00:00, 1723.89it/s]


actives_seqs length: 233


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 7015/7015 [00:02<00:00, 3452.29it/s]
100%|███████████████████████████████████████| 7015/7015 [00:01<00:00, 3626.66it/s]


decoys_seqs length: 7015


100%|██████████████████████████████████████████| 171/171 [00:01<00:00, 119.18it/s]
100%|██████████████████████████████████████████| 171/171 [00:00<00:00, 993.64it/s]


actives_seqs length: 171


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 7706/7706 [00:01<00:00, 3928.65it/s]
100%|███████████████████████████████████████| 7706/7706 [00:03<00:00, 2185.12it/s]


decoys_seqs length: 7706


100%|███████████████████████████████████████████| 137/137 [00:01<00:00, 95.71it/s]
100%|██████████████████████████████████████████| 137/137 [00:00<00:00, 849.53it/s]


actives_seqs length: 137


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6231/6231 [00:01<00:00, 3240.94it/s]
100%|███████████████████████████████████████| 6231/6231 [00:03<00:00, 1968.03it/s]


decoys_seqs length: 6231


100%|██████████████████████████████████████████| 197/197 [00:01<00:00, 135.43it/s]
100%|█████████████████████████████████████████| 197/197 [00:00<00:00, 1235.78it/s]


actives_seqs length: 197


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6908/6908 [00:01<00:00, 3732.12it/s]
100%|███████████████████████████████████████| 6908/6908 [00:02<00:00, 2364.89it/s]


decoys_seqs length: 6908


100%|██████████████████████████████████████████| 213/213 [00:01<00:00, 144.32it/s]
100%|█████████████████████████████████████████| 213/213 [00:00<00:00, 2233.44it/s]


actives_seqs length: 213


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 9010/9010 [00:02<00:00, 4007.84it/s]
100%|███████████████████████████████████████| 9010/9010 [00:02<00:00, 3285.25it/s]


decoys_seqs length: 9010


100%|██████████████████████████████████████████| 252/252 [00:01<00:00, 177.19it/s]
100%|█████████████████████████████████████████| 252/252 [00:00<00:00, 1101.32it/s]


actives_seqs length: 252


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 10600/10600 [00:01<00:00, 5308.93it/s]
100%|█████████████████████████████████████| 10600/10600 [00:04<00:00, 2156.00it/s]


decoys_seqs length: 10600


100%|██████████████████████████████████████████| 915/915 [00:01<00:00, 624.24it/s]
100%|██████████████████████████████████████████| 915/915 [00:01<00:00, 754.12it/s]


actives_seqs length: 915


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 36420/36420 [00:03<00:00, 10359.74it/s]
100%|█████████████████████████████████████| 36420/36420 [00:16<00:00, 2169.53it/s]


decoys_seqs length: 36420


100%|███████████████████████████████████████████| 114/114 [00:01<00:00, 79.99it/s]
100%|█████████████████████████████████████████| 114/114 [00:00<00:00, 1199.58it/s]


actives_seqs length: 114


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 4045/4045 [00:01<00:00, 2470.76it/s]
100%|███████████████████████████████████████| 4045/4045 [00:01<00:00, 2204.34it/s]


decoys_seqs length: 4045


100%|██████████████████████████████████████████| 637/637 [00:01<00:00, 433.78it/s]
100%|█████████████████████████████████████████| 637/637 [00:00<00:00, 1970.84it/s]


actives_seqs length: 637


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 19119/19119 [00:02<00:00, 7209.21it/s]
100%|█████████████████████████████████████| 19119/19119 [00:07<00:00, 2656.82it/s]


decoys_seqs length: 19119


100%|███████████████████████████████████████████| 121/121 [00:01<00:00, 84.92it/s]
100%|█████████████████████████████████████████| 121/121 [00:00<00:00, 1106.29it/s]


actives_seqs length: 121


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 4940/4940 [00:01<00:00, 2861.08it/s]
100%|███████████████████████████████████████| 4940/4940 [00:02<00:00, 2119.88it/s]


decoys_seqs length: 4940


100%|██████████████████████████████████████████| 186/186 [00:01<00:00, 135.68it/s]
100%|█████████████████████████████████████████| 186/186 [00:00<00:00, 1172.60it/s]


actives_seqs length: 186


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6708/6708 [00:02<00:00, 3337.89it/s]
100%|███████████████████████████████████████| 6708/6708 [00:02<00:00, 2260.22it/s]


decoys_seqs length: 6708


100%|██████████████████████████████████████████| 592/592 [00:01<00:00, 419.07it/s]
100%|█████████████████████████████████████████| 592/592 [00:00<00:00, 1409.96it/s]


actives_seqs length: 592


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 20302/20302 [00:02<00:00, 7555.91it/s]
100%|█████████████████████████████████████| 20302/20302 [00:08<00:00, 2450.92it/s]


decoys_seqs length: 20302


100%|██████████████████████████████████████████| 835/835 [00:01<00:00, 524.45it/s]
100%|█████████████████████████████████████████| 835/835 [00:00<00:00, 1848.98it/s]


actives_seqs length: 835


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 31699/31699 [00:03<00:00, 10434.83it/s]
100%|█████████████████████████████████████| 31699/31699 [00:12<00:00, 2491.90it/s]


decoys_seqs length: 31699


100%|██████████████████████████████████████████| 299/299 [00:01<00:00, 212.54it/s]
100%|█████████████████████████████████████████| 299/299 [00:00<00:00, 1309.45it/s]


actives_seqs length: 299


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 8877/8877 [00:02<00:00, 4364.40it/s]
100%|███████████████████████████████████████| 8877/8877 [00:04<00:00, 2098.58it/s]


decoys_seqs length: 8877


100%|██████████████████████████████████████████| 363/363 [00:01<00:00, 253.19it/s]
100%|█████████████████████████████████████████| 363/363 [00:00<00:00, 1344.61it/s]


actives_seqs length: 363


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 11931/11931 [00:02<00:00, 5260.48it/s]
100%|█████████████████████████████████████| 11931/11931 [00:05<00:00, 2179.97it/s]


decoys_seqs length: 11931


100%|██████████████████████████████████████████| 306/306 [00:01<00:00, 203.42it/s]
100%|█████████████████████████████████████████| 306/306 [00:00<00:00, 1388.69it/s]


actives_seqs length: 306


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 9928/9928 [00:02<00:00, 4602.99it/s]
100%|███████████████████████████████████████| 9928/9928 [00:04<00:00, 2377.35it/s]


decoys_seqs length: 9928


  actives_seqs = process_map(get_ConfSeq, tqdm(actives_mols), max_workers = 32)
100%|███████████████████████████████████████| 1692/1692 [00:01<00:00, 1163.06it/s]
100%|███████████████████████████████████████| 1692/1692 [00:01<00:00, 1468.17it/s]


actives_seqs length: 1692


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 51993/51993 [00:03<00:00, 13606.22it/s]
100%|█████████████████████████████████████| 51993/51993 [00:22<00:00, 2271.36it/s]


decoys_seqs length: 51993


100%|█████████████████████████████████████████████| 57/57 [00:01<00:00, 39.56it/s]
100%|████████████████████████████████████████████| 57/57 [00:00<00:00, 751.91it/s]


actives_seqs length: 57


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 2854/2854 [00:01<00:00, 1542.29it/s]
100%|███████████████████████████████████████| 2854/2854 [00:01<00:00, 2095.62it/s]


decoys_seqs length: 2854


100%|██████████████████████████████████████████| 544/544 [00:01<00:00, 344.37it/s]
100%|█████████████████████████████████████████| 544/544 [00:00<00:00, 1456.44it/s]


actives_seqs length: 544


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 19830/19830 [00:02<00:00, 7532.49it/s]
100%|█████████████████████████████████████| 19830/19830 [00:08<00:00, 2273.64it/s]


decoys_seqs length: 19830


100%|██████████████████████████████████████████| 192/192 [00:01<00:00, 136.13it/s]
100%|█████████████████████████████████████████| 192/192 [00:00<00:00, 1099.33it/s]


actives_seqs length: 192


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 5239/5239 [00:01<00:00, 3035.82it/s]
100%|███████████████████████████████████████| 5239/5239 [00:02<00:00, 2401.99it/s]


decoys_seqs length: 5239


100%|██████████████████████████████████████████| 723/723 [00:01<00:00, 462.96it/s]
100%|█████████████████████████████████████████| 723/723 [00:00<00:00, 1516.17it/s]


actives_seqs length: 723


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 25861/25861 [00:02<00:00, 8901.22it/s]
100%|█████████████████████████████████████| 25861/25861 [00:10<00:00, 2415.56it/s]


decoys_seqs length: 25861


100%|██████████████████████████████████████████| 155/155 [00:01<00:00, 109.82it/s]
100%|██████████████████████████████████████████| 155/155 [00:00<00:00, 944.93it/s]


actives_seqs length: 155


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 6877/6877 [00:01<00:00, 3602.66it/s]
100%|███████████████████████████████████████| 6877/6877 [00:03<00:00, 1970.42it/s]


decoys_seqs length: 6877


100%|██████████████████████████████████████████| 447/447 [00:01<00:00, 320.88it/s]
100%|█████████████████████████████████████████| 447/447 [00:00<00:00, 1390.11it/s]


actives_seqs length: 447


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 15248/15248 [00:02<00:00, 6044.61it/s]
100%|█████████████████████████████████████| 15248/15248 [00:06<00:00, 2420.94it/s]


decoys_seqs length: 15248


100%|██████████████████████████████████████████| 861/861 [00:01<00:00, 589.18it/s]
100%|█████████████████████████████████████████| 861/861 [00:00<00:00, 1490.13it/s]


actives_seqs length: 861


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|█████████████████████████████████████| 27311/27311 [00:02<00:00, 9245.66it/s]
100%|█████████████████████████████████████| 27311/27311 [00:11<00:00, 2447.97it/s]


decoys_seqs length: 27311


100%|███████████████████████████████████████████| 139/139 [00:01<00:00, 93.96it/s]
100%|█████████████████████████████████████████| 139/139 [00:00<00:00, 1038.56it/s]


actives_seqs length: 139


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|███████████████████████████████████████| 4626/4626 [00:01<00:00, 2426.80it/s]
100%|███████████████████████████████████████| 4626/4626 [00:02<00:00, 2158.34it/s]


decoys_seqs length: 4626


100%|██████████████████████████████████████████| 844/844 [00:01<00:00, 550.83it/s]
100%|█████████████████████████████████████████| 844/844 [00:00<00:00, 1482.67it/s]


actives_seqs length: 844


  decoys_seqs = process_map(get_ConfSeq, tqdm(decoys_mols), max_workers = 32)
100%|████████████████████████████████████| 32015/32015 [00:03<00:00, 10036.99it/s]
100%|█████████████████████████████████████| 32015/32015 [00:13<00:00, 2424.28it/s]


decoys_seqs length: 32015
