# Add molecule data (do this before activity data)

In [None]:
import sys
sys.path.append('/code')
from sqlalchemy import create_engine
from sqlalchemy.orm import scoped_session
from sqlalchemy.orm import sessionmaker
import os
from database.models import Molecule

import pandas as pd
from rdkit import Chem
from razi.rdkit_postgresql.functions import morganbv_fp
import json
import gc
from tqdm import tqdm


from datetime import datetime

def get_db_session():
    engine = create_engine(
        'postgresql://postgres:postgres@10.8.1.25:5432/papyrus', convert_unicode=True,
        pool_recycle=3600, pool_size=10)
    db_session = scoped_session(sessionmaker(
        autocommit=False, autoflush=False, bind=engine))
    
    return db_session

class TypeDecoder(json.JSONDecoder):
    """Custom json decoder to support types as values."""

    def __init__(self, *args, **kwargs):
        """Simple json decoder handling types as values."""
        json.JSONDecoder.__init__(self, object_hook=self.object_hook, *args, **kwargs)

    def object_hook(self, obj):
        """Handle types."""
        if '__type__' not in obj:
            return obj
        module = obj['__type__']['module']
        type_ = obj['__type__']['type']
        if module == 'builtins':
            return getattr(__builtins__, type_)
        loaded_module = importlib.import_module(module)
        return getattr(loaded_module, type_)

dtype_file = '../.data/papyrus/05.5/data_types.json'
activity_data = '../.data/papyrus/05.5/05.5_combined_set_without_stereochemistry.tsv.xz'

with open(dtype_file, 'r') as jsonfile:
        dtypes = json.load(jsonfile, cls=TypeDecoder)['papyrus']


smi_mol_fp = lambda smiles: (Chem.CanonSmiles(smiles))
cid_arr = lambda cids: (cids.split(';'))
source_arr = lambda sources: (sources.split(';'))

mol_cols = ['SMILES', 'InChI', 'CID', 'InChIKey', 'connectivity', 'InChI_AuxInfo', 'source']
converters = {
    'SMILES': smi_mol_fp,
    'CID': cid_arr,
    'source': source_arr
}

molecule_reader = pd.read_csv(activity_data, 
                     sep='\t', 
                     compression='xz', 
                     chunksize = 100000, 
                     iterator=True, 
                     dtype=dtypes,
                     converters=converters,
                     usecols=mol_cols
                    )

# mol_dfs = []

committed = []
smiles_cids = {}


for i,df in enumerate(molecule_reader):
    
    print(i)
    now = datetime.now()
    current_time = now.strftime("%H:%M:%S")
    print("Start Time =", current_time)
#     mol_dfs.append(df)
    
    idx_dict = {}

    print('getting unique combos')
    for i, row in tqdm(df.iterrows()):
        smi = row['SMILES']
        aux_info = row['InChI_AuxInfo']
        combo = f'{smi}_{aux_info}'
        if not combo in idx_dict.keys():
            idx_dict[combo] = [i]
        else:
            idx_dict[combo].append(i)

    mol_dicts = []

    print('creating mol dicts')
    for key in tqdm(idx_dict.keys()):
        if key in committed:
            continue
        rows = [df.loc[i] for i in idx_dict[key]]
        unique_auxinfos = list(set([series['InChI_AuxInfo'] for series in rows]))
        if len(unique_auxinfos)==1:
            all_cid_sources = []
            cid_sources = [list(zip(series['CID'], series['source'])) for series in rows]
            [all_cid_sources.extend(x) for x in cid_sources]
            unique_cid_sources = list(set(all_cid_sources))
            smiles_cids[key] = unique_cid_sources
            r = rows[0]
            md = {
                'smiles':r['SMILES'],
                'mol':'',
                'fp':'',
                'connectivity':r['connectivity'],
                'inchi_key':r['InChIKey'],
                'inchi':r['InChI'],
                'inchi_auxinfo':r['InChI_AuxInfo']
            }
            mol_dicts.append(md)
        else:
            print('something wrong')
            
    fdf = pd.DataFrame(mol_dicts)
    molobj = lambda smiles: (Chem.MolFromSmiles(smiles))
    fpobj = lambda smiles: (morganbv_fp(smiles))

    fdf['fp'] = fdf['smiles'].map(fpobj)
    fdf['mol'] = fdf['smiles'].map(molobj)

    table_dicts = fdf.to_dict('records')
    mols = [Molecule(**d) for d in table_dicts]

    sesh = get_db_session()
    sesh.add_all(mols)
    sesh.commit()
    sesh.close()
    sesh.remove()
    
    committed.extend(idx_dict.keys())

    now = datetime.now()        
    current_time = now.strftime("%H:%M:%S")
    print("End Time =", current_time)
        



  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


0
Start Time = 19:01:42
getting unique combos


100000it [00:04, 24393.21it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36125/36125 [00:07<00:00, 5000.74it/s]
  mols = [Molecule(**d) for d in table_dicts]
  mols = [Molecule(**d) for d in table_dicts]
  mols = [Molecule(**d) for d in table_dicts]
  mols = [Molecule(**d) for d in table_dicts]
  engine = create_engine(


End Time = 19:02:49


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


1
Start Time = 19:03:16
getting unique combos


100000it [00:04, 24219.24it/s]


creating mol dicts


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35528/35528 [00:43<00:00, 811.91it/s]
  engine = create_engine(


End Time = 19:05:02


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


2
Start Time = 19:05:29
getting unique combos


100000it [00:04, 21235.33it/s]


creating mol dicts


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36448/36448 [01:52<00:00, 323.28it/s]
  engine = create_engine(


End Time = 19:08:24


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


3
Start Time = 19:08:51
getting unique combos


100000it [00:03, 25036.34it/s]


creating mol dicts


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35958/35958 [04:01<00:00, 149.14it/s]
  engine = create_engine(


End Time = 19:13:55


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


4
Start Time = 19:14:22
getting unique combos


100000it [00:04, 24013.83it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36436/36436 [06:25<00:00, 94.44it/s]
  engine = create_engine(


End Time = 19:21:51


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


5
Start Time = 19:22:17
getting unique combos


100000it [00:04, 23830.56it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36591/36591 [08:47<00:00, 69.33it/s]
  engine = create_engine(


End Time = 19:32:08


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


6
Start Time = 19:32:35
getting unique combos


100000it [00:04, 24236.31it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36104/36104 [10:56<00:00, 55.03it/s]
  engine = create_engine(


End Time = 19:44:36


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


7
Start Time = 19:45:03
getting unique combos


100000it [00:04, 23900.08it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35521/35521 [12:15<00:00, 48.26it/s]
  engine = create_engine(


End Time = 19:58:20


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


8
Start Time = 19:58:49
getting unique combos


100000it [00:04, 24758.84it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35738/35738 [14:15<00:00, 41.77it/s]
  engine = create_engine(


End Time = 20:14:07


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


9
Start Time = 20:14:34
getting unique combos


100000it [00:04, 24471.61it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35790/35790 [16:04<00:00, 37.10it/s]
  engine = create_engine(


End Time = 20:31:42


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


10
Start Time = 20:32:11
getting unique combos


100000it [00:04, 24083.48it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35027/35027 [16:51<00:00, 34.64it/s]
  engine = create_engine(


End Time = 20:50:03


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


11
Start Time = 20:50:30
getting unique combos


100000it [00:04, 23821.08it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36292/36292 [19:17<00:00, 31.35it/s]
  engine = create_engine(


End Time = 21:10:50


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


12
Start Time = 21:11:18
getting unique combos


100000it [00:04, 24126.66it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35664/35664 [21:04<00:00, 28.20it/s]
  engine = create_engine(


End Time = 21:33:24


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


13
Start Time = 21:33:51
getting unique combos


100000it [00:05, 18981.68it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36108/36108 [22:55<00:00, 26.25it/s]
  engine = create_engine(


End Time = 21:57:53


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


14
Start Time = 21:58:21
getting unique combos


100000it [00:05, 19086.89it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36144/36144 [25:02<00:00, 24.05it/s]
  engine = create_engine(


End Time = 22:24:25


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


15
Start Time = 22:24:53
getting unique combos


100000it [00:03, 25351.60it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36028/36028 [26:16<00:00, 22.86it/s]
  engine = create_engine(


End Time = 22:52:10


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


16
Start Time = 22:52:37
getting unique combos


100000it [00:04, 24880.68it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35048/35048 [27:19<00:00, 21.37it/s]
  engine = create_engine(


End Time = 23:21:01


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


17
Start Time = 23:21:29
getting unique combos


100000it [00:04, 24423.90it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35807/35807 [29:25<00:00, 20.28it/s]
  engine = create_engine(


End Time = 23:51:58


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


18
Start Time = 23:52:27
getting unique combos


100000it [00:05, 18430.62it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35943/35943 [31:33<00:00, 18.98it/s]
  engine = create_engine(


End Time = 00:25:06


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


19
Start Time = 00:25:34
getting unique combos


100000it [00:04, 24335.22it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35314/35314 [32:50<00:00, 17.92it/s]
  engine = create_engine(


End Time = 00:59:27


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


20
Start Time = 00:59:56
getting unique combos


100000it [00:04, 24274.38it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36641/36641 [35:33<00:00, 17.18it/s]
  engine = create_engine(


End Time = 01:36:33


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


21
Start Time = 01:37:01
getting unique combos


100000it [00:03, 25242.96it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 37016/37016 [37:42<00:00, 16.36it/s]
  engine = create_engine(


End Time = 02:15:47


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


22
Start Time = 02:16:18
getting unique combos


100000it [00:04, 24409.69it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35599/35599 [38:03<00:00, 15.59it/s]
  engine = create_engine(


End Time = 02:55:24


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


23
Start Time = 02:55:53
getting unique combos


100000it [00:03, 25590.14it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35957/35957 [40:17<00:00, 14.87it/s]
  engine = create_engine(


End Time = 03:37:11


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


24
Start Time = 03:37:40
getting unique combos


100000it [00:04, 24821.49it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36671/36671 [42:56<00:00, 14.23it/s]
  engine = create_engine(


End Time = 04:21:44


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


25
Start Time = 04:22:14
getting unique combos


100000it [00:04, 24488.92it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35431/35431 [43:07<00:00, 13.69it/s]
  engine = create_engine(


End Time = 05:06:25


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


26
Start Time = 05:06:55
getting unique combos


100000it [00:03, 25956.98it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35306/35306 [44:44<00:00, 13.15it/s]
  engine = create_engine(


End Time = 05:52:39


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


27
Start Time = 05:53:08
getting unique combos


100000it [00:04, 24629.70it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 36486/36486 [47:51<00:00, 12.70it/s]
  engine = create_engine(


End Time = 06:42:03


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


28
Start Time = 06:42:35
getting unique combos


100000it [00:04, 24918.06it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 35450/35450 [48:29<00:00, 12.18it/s]
  engine = create_engine(


End Time = 07:32:07


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


29
Start Time = 07:32:33
getting unique combos


100000it [00:04, 24840.04it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 19003/19003 [26:34<00:00, 11.92it/s]
  engine = create_engine(


End Time = 07:59:43


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


30
Start Time = 08:00:10
getting unique combos


100000it [00:03, 26349.30it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 944/944 [00:56<00:00, 16.73it/s]
  engine = create_engine(


End Time = 08:01:12


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


31
Start Time = 08:01:39
getting unique combos


100000it [00:03, 25391.57it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 988/988 [01:00<00:00, 16.40it/s]
  engine = create_engine(


End Time = 08:02:44


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


32
Start Time = 08:03:12
getting unique combos


100000it [00:04, 24931.25it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 971/971 [01:02<00:00, 15.64it/s]
  engine = create_engine(


End Time = 08:04:19


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


33
Start Time = 08:04:43
getting unique combos


100000it [00:04, 24688.59it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 990/990 [01:01<00:00, 16.05it/s]
  engine = create_engine(


End Time = 08:05:50


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


34
Start Time = 08:06:16
getting unique combos


100000it [00:04, 24742.91it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 955/955 [00:54<00:00, 17.56it/s]
  engine = create_engine(


End Time = 08:07:15


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


35
Start Time = 08:07:39
getting unique combos


100000it [00:04, 24411.25it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 995/995 [01:00<00:00, 16.38it/s]
  engine = create_engine(


End Time = 08:08:45


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


36
Start Time = 08:09:10
getting unique combos


100000it [00:03, 25339.96it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 985/985 [00:59<00:00, 16.46it/s]
  engine = create_engine(


End Time = 08:10:15


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


37
Start Time = 08:10:39
getting unique combos


100000it [00:03, 25768.78it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 952/952 [00:59<00:00, 16.06it/s]
  engine = create_engine(


End Time = 08:11:43


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


38
Start Time = 08:12:08
getting unique combos


100000it [00:03, 25536.88it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 988/988 [01:00<00:00, 16.26it/s]
  engine = create_engine(


End Time = 08:13:14


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


39
Start Time = 08:13:39
getting unique combos


100000it [00:03, 25549.24it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 945/945 [00:56<00:00, 16.79it/s]
  engine = create_engine(


End Time = 08:14:41


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


40
Start Time = 08:15:05
getting unique combos


100000it [00:03, 26230.38it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 987/987 [01:02<00:00, 15.84it/s]
  engine = create_engine(


End Time = 08:16:13


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


41
Start Time = 08:16:38
getting unique combos


100000it [00:03, 25792.06it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 981/981 [00:58<00:00, 16.66it/s]
  engine = create_engine(


End Time = 08:17:42


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


42
Start Time = 08:18:06
getting unique combos


100000it [00:04, 24549.52it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 992/992 [01:03<00:00, 15.52it/s]
  engine = create_engine(


End Time = 08:19:15


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


43
Start Time = 08:19:41
getting unique combos


100000it [00:04, 24498.68it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 977/977 [01:05<00:00, 14.94it/s]
  engine = create_engine(


End Time = 08:20:51


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


44
Start Time = 08:21:16
getting unique combos


100000it [00:03, 26182.49it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1008/1008 [01:04<00:00, 15.66it/s]
  engine = create_engine(


End Time = 08:22:26


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


45
Start Time = 08:22:50
getting unique combos


100000it [00:03, 25212.24it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1026/1026 [01:03<00:00, 16.03it/s]
  engine = create_engine(


End Time = 08:23:59


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


46
Start Time = 08:24:23
getting unique combos


100000it [00:03, 25221.54it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1011/1011 [01:04<00:00, 15.78it/s]
  engine = create_engine(


End Time = 08:25:32


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


47
Start Time = 08:25:56
getting unique combos


100000it [00:03, 25552.60it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 963/963 [01:00<00:00, 15.94it/s]
  engine = create_engine(


End Time = 08:27:02


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


48
Start Time = 08:27:26
getting unique combos


100000it [00:03, 25977.80it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 949/949 [00:56<00:00, 16.73it/s]
  engine = create_engine(


End Time = 08:28:28


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


49
Start Time = 08:28:52
getting unique combos


100000it [00:03, 25086.56it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [01:04<00:00, 15.61it/s]
  engine = create_engine(


End Time = 08:30:02


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


50
Start Time = 08:30:26
getting unique combos


100000it [00:04, 24898.79it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1030/1030 [01:06<00:00, 15.59it/s]
  engine = create_engine(


End Time = 08:31:37


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


51
Start Time = 08:32:02
getting unique combos


100000it [00:03, 26279.04it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [00:57<00:00, 16.37it/s]
  engine = create_engine(


End Time = 08:33:05


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


52
Start Time = 08:33:29
getting unique combos


100000it [00:03, 25033.88it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 990/990 [01:04<00:00, 15.29it/s]
  engine = create_engine(


End Time = 08:34:38


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


53
Start Time = 08:35:05
getting unique combos


100000it [00:04, 24408.42it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1011/1011 [01:04<00:00, 15.62it/s]
  engine = create_engine(


End Time = 08:36:15


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


54
Start Time = 08:36:39
getting unique combos


100000it [00:03, 25924.62it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 985/985 [01:01<00:00, 16.04it/s]
  engine = create_engine(


End Time = 08:37:46


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


55
Start Time = 08:38:11
getting unique combos


100000it [00:04, 24681.28it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 999/999 [01:06<00:00, 15.05it/s]
  engine = create_engine(


End Time = 08:39:23


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


56
Start Time = 08:39:47
getting unique combos


100000it [00:05, 19054.61it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 986/986 [01:00<00:00, 16.36it/s]
  engine = create_engine(


End Time = 08:40:54


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


57
Start Time = 08:41:19
getting unique combos


100000it [00:04, 24903.96it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 964/964 [01:01<00:00, 15.61it/s]
  engine = create_engine(


End Time = 08:42:25


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


58
Start Time = 08:42:50
getting unique combos


100000it [00:03, 26023.66it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 989/989 [01:03<00:00, 15.56it/s]
  engine = create_engine(


End Time = 08:43:59


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


59
Start Time = 08:44:24
getting unique combos


100000it [00:03, 26220.98it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [01:05<00:00, 15.46it/s]
  engine = create_engine(


End Time = 08:45:34


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


60
Start Time = 08:45:59
getting unique combos


100000it [00:04, 24703.78it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1042/1042 [01:06<00:00, 15.66it/s]
  engine = create_engine(


End Time = 08:47:10


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


61
Start Time = 08:47:35
getting unique combos


100000it [00:03, 26126.23it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 978/978 [01:01<00:00, 15.86it/s]
  engine = create_engine(


End Time = 08:48:42


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


62
Start Time = 08:49:07
getting unique combos


100000it [00:03, 25674.93it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1003/1003 [01:06<00:00, 15.00it/s]
  engine = create_engine(


End Time = 08:50:18


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


63
Start Time = 08:50:43
getting unique combos


100000it [00:04, 24692.38it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 979/979 [01:02<00:00, 15.61it/s]
  engine = create_engine(


End Time = 08:51:51


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


64
Start Time = 08:52:16
getting unique combos


100000it [00:03, 25468.78it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 976/976 [01:17<00:00, 12.54it/s]
  engine = create_engine(


End Time = 08:53:38


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


65
Start Time = 08:54:02
getting unique combos


100000it [00:04, 24843.14it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 989/989 [01:16<00:00, 12.99it/s]
  engine = create_engine(


End Time = 08:55:24


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


66
Start Time = 08:55:50
getting unique combos


100000it [00:03, 25527.29it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 972/972 [01:08<00:00, 14.16it/s]
  engine = create_engine(


End Time = 08:57:03


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


67
Start Time = 08:57:28
getting unique combos


100000it [00:03, 25297.81it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [01:08<00:00, 14.60it/s]
  engine = create_engine(


End Time = 08:58:42


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


68
Start Time = 08:59:07
getting unique combos


100000it [00:03, 26179.27it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [01:08<00:00, 14.65it/s]
  engine = create_engine(


End Time = 09:00:20


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


69
Start Time = 09:00:45
getting unique combos


100000it [00:03, 25317.57it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 938/938 [01:05<00:00, 14.22it/s]
  engine = create_engine(


End Time = 09:01:56


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


70
Start Time = 09:02:21
getting unique combos


100000it [00:03, 25092.29it/s]


creating mol dicts


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1011/1011 [01:10<00:00, 14.32it/s]
  engine = create_engine(


End Time = 09:03:37


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


71
Start Time = 09:04:02
getting unique combos


100000it [00:03, 25277.87it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 944/944 [01:05<00:00, 14.31it/s]
  engine = create_engine(


End Time = 09:05:13


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):


72
Start Time = 09:05:38
getting unique combos


100000it [00:04, 24917.06it/s]


creating mol dicts


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 976/976 [01:07<00:00, 14.52it/s]
  engine = create_engine(


End Time = 09:06:50


  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
  for i,df in enumerate(molecule_reader):
