In [2]:
!pip install dgl-cu101

Collecting dgl-cu101
  Downloading dgl_cu101-0.6.1-cp39-cp39-win_amd64.whl (35.2 MB)
     --------------------------------------- 35.2/35.2 MB 10.7 MB/s eta 0:00:00
Collecting networkx>=2.1
  Downloading networkx-2.7.1-py3-none-any.whl (2.0 MB)
     ---------------------------------------- 2.0/2.0 MB 10.6 MB/s eta 0:00:00
Installing collected packages: networkx, dgl-cu101
Successfully installed dgl-cu101-0.6.1 networkx-2.7.1


### Команды для установки deepchem в jupyter notebook

conda install -y -c conda-forge nb_conda_kernels matplotlib

pip install tensorflow

pip install --pre deepchem

### Команды для установки rdkit

conda create -c conda-forge -n my-rdkit-env rdkit

conda activate my-rdkit-env

### Комманда для установки dgl

!pip install dgl-cu101

!pip install -U ogb

In [4]:
!pip install torch

Collecting torch
  Downloading torch-1.11.0-cp39-cp39-win_amd64.whl (157.9 MB)
     -------------------------------------- 157.9/157.9 MB 5.2 MB/s eta 0:00:00
Installing collected packages: torch
Successfully installed torch-1.11.0


In [6]:
!pip install dgl

Collecting dgl
  Downloading dgl-0.6.1-cp39-cp39-win_amd64.whl (3.1 MB)
     ---------------------------------------- 3.1/3.1 MB 9.0 MB/s eta 0:00:00
Installing collected packages: dgl
Successfully installed dgl-0.6.1


### DATASET

Датасеты со smiles строками: https://lifesci.dgl.ai/api/data.html

In [1]:
import dgllife

Using backend: pytorch


In [10]:
import os
import rdkit
import numpy as np
import pandas as pd
import tqdm

from rdkit.Chem import Draw
from rdkit.Chem import AllChem
from rdkit import Chem
from dgllife.data import * 
from dgllife.utils import smiles_to_bigraph, CanonicalAtomFeaturizer

Using backend: pytorch


In [8]:
datasets = [Tox21, ESOL, FreeSolv, Lipophilicity, PCBA, MUV, HIV, BACE, BBBP, ToxCast, SIDER, ClinTox]
str_datasets = ['Tox21', 'ESOL', 'FreeSolv', 'Lipophilicity', 'PCBA', 'MUV', 'HIV', 'BACE', 'BBBP', 'ToxCast', 'SIDER', 'ClinTox']

In [10]:
datasets_pair = zip(str_datasets, datasets)

In [24]:
def load_dataset(name, dataset):
    loaded_dataset = dataset(smiles_to_bigraph, CanonicalAtomFeaturizer(), load=True, n_jobs=2)
    smiles = [] 
    mols = []
    targets = []
    mask = []
    for item in loaded_dataset:
        smiles.append(item[0])
        mols.append(Chem.MolFromSmiles(item[0]))
        targets.append(item[2].numpy())
        if len(item) >= 4:
            mask.append(item[3].numpy())
    
    loaded_dataset = None
    
    if name not in os.listdir('dataset'):
        os.mkdir(os.path.join('dataset', name))
    
    folder = os.path.join('dataset', name)
    
    if 'data.sdf' not in os.listdir(folder):
        with Chem.SDWriter(os.path.join(folder, 'data.sdf')) as w:
            for m in mols:
                w.write(m)

    if 'smiles.csv' not in os.listdir(folder):
        pd.DataFrame(smiles).to_csv(os.path.join(folder, 'smiles.csv'), header=None, index=False)
    
    if 'targets.csv' not in os.listdir(folder):
        pd.DataFrame(targets).to_csv(os.path.join(folder, 'targets.csv'), header=None, index=False)
    
    if len(mask) > 0 and 'mask.csv' not in os.listdir(folder):
        pd.DataFrame(mask).to_csv(os.path.join(folder, 'mask.csv'), header=None, index=False)

In [None]:
for name, dataset in datasets_pair:
    load_dataset(name, dataset)

Processing dgl graphs from scratch...
Processing molecule 1000/7831
Processing molecule 2000/7831
Processing molecule 3000/7831
Processing molecule 4000/7831
Processing molecule 5000/7831
Processing molecule 6000/7831
Processing molecule 7000/7831
Downloading C:\Users\Logge\.dgl/ESOL.zip from https://data.dgl.ai/dataset/ESOL.zip...
Extracting file to C:\Users\Logge\.dgl/ESOL
Processing dgl graphs from scratch...
Processing molecule 1000/1128
Downloading C:\Users\Logge\.dgl/FreeSolv.zip from https://data.dgl.ai/dataset/FreeSolv.zip...
Extracting file to C:\Users\Logge\.dgl/FreeSolv
Processing dgl graphs from scratch...
Downloading C:\Users\Logge\.dgl/lipophilicity.zip from https://data.dgl.ai/dataset/lipophilicity.zip...
Extracting file to C:\Users\Logge\.dgl/lipophilicity
Processing dgl graphs from scratch...
Processing molecule 1000/4200
Processing molecule 2000/4200
Processing molecule 3000/4200
Processing molecule 4000/4200
Downloading C:\Users\Logge\.dgl/pcba.zip from https://data.

Processing molecule 213000/437929
Processing molecule 214000/437929
Processing molecule 215000/437929
Processing molecule 216000/437929
Processing molecule 217000/437929
Processing molecule 218000/437929
Processing molecule 219000/437929
Processing molecule 220000/437929
Processing molecule 221000/437929
Processing molecule 222000/437929
Processing molecule 223000/437929
Processing molecule 224000/437929
Processing molecule 225000/437929
Processing molecule 226000/437929
Processing molecule 227000/437929
Processing molecule 228000/437929
Processing molecule 229000/437929
Processing molecule 230000/437929
Processing molecule 231000/437929
Processing molecule 232000/437929
Processing molecule 233000/437929
Processing molecule 234000/437929
Processing molecule 235000/437929
Processing molecule 236000/437929
Processing molecule 237000/437929
Processing molecule 238000/437929
Processing molecule 239000/437929
Processing molecule 240000/437929
Processing molecule 241000/437929
Processing mol

In [25]:
for name, dataset in zip(str_datasets[5:], datasets[5:]):
    load_dataset(name, dataset)

Loading previously saved dgl graphs...
Downloading C:\Users\Logge\.dgl/hiv.zip from https://data.dgl.ai/dataset/hiv.zip...
Extracting file to C:\Users\Logge\.dgl/hiv
Processing dgl graphs from scratch...


[Parallel(n_jobs=2)]: Using backend LokyBackend with 2 concurrent workers.
[Parallel(n_jobs=2)]: Done 336 tasks      | elapsed:    8.9s
[Parallel(n_jobs=2)]: Done 5136 tasks      | elapsed:   22.4s
[Parallel(n_jobs=2)]: Done 13136 tasks      | elapsed:   47.7s
[Parallel(n_jobs=2)]: Done 24336 tasks      | elapsed:  1.3min
[Parallel(n_jobs=2)]: Done 38736 tasks      | elapsed:  2.1min
[Parallel(n_jobs=2)]: Done 41127 out of 41127 | elapsed:  2.2min finished


Downloading C:\Users\Logge\.dgl/bace.zip from https://data.dgl.ai/dataset/bace.zip...
Extracting file to C:\Users\Logge\.dgl/bace
Processing dgl graphs from scratch...


[Parallel(n_jobs=2)]: Using backend LokyBackend with 2 concurrent workers.
[Parallel(n_jobs=2)]: Done 956 tasks      | elapsed:    3.8s
[Parallel(n_jobs=2)]: Done 1510 out of 1513 | elapsed:    5.8s remaining:    0.0s
[Parallel(n_jobs=2)]: Done 1513 out of 1513 | elapsed:    5.8s finished


Downloading C:\Users\Logge\.dgl/bbbp.zip from https://data.dgl.ai/dataset/bbbp.zip...
Extracting file to C:\Users\Logge\.dgl/bbbp
Processing dgl graphs from scratch...


[Parallel(n_jobs=2)]: Using backend LokyBackend with 2 concurrent workers.
[Parallel(n_jobs=2)]: Done 956 tasks      | elapsed:    2.6s
[Parallel(n_jobs=2)]: Done 2050 out of 2050 | elapsed:    5.0s finished


Downloading C:\Users\Logge\.dgl/toxcast.zip from https://data.dgl.ai/dataset/toxcast.zip...
Extracting file to C:\Users\Logge\.dgl/toxcast
Processing dgl graphs from scratch...


[Parallel(n_jobs=2)]: Using backend LokyBackend with 2 concurrent workers.
[Parallel(n_jobs=2)]: Done 956 tasks      | elapsed:    2.1s
[Parallel(n_jobs=2)]: Done 5756 tasks      | elapsed:   12.9s
[Parallel(n_jobs=2)]: Done 8597 out of 8597 | elapsed:   19.4s finished


Downloading C:\Users\Logge\.dgl/sider.zip from https://data.dgl.ai/dataset/sider.zip...
Extracting file to C:\Users\Logge\.dgl/sider
Processing dgl graphs from scratch...


[Parallel(n_jobs=2)]: Using backend LokyBackend with 2 concurrent workers.
[Parallel(n_jobs=2)]: Done 1345 tasks      | elapsed:    3.3s
[Parallel(n_jobs=2)]: Done 1427 out of 1427 | elapsed:    3.5s finished


Downloading C:\Users\Logge\.dgl/clintox.zip from https://data.dgl.ai/dataset/clintox.zip...
Extracting file to C:\Users\Logge\.dgl/clintox
Processing dgl graphs from scratch...


[Parallel(n_jobs=2)]: Using backend LokyBackend with 2 concurrent workers.
[Parallel(n_jobs=2)]: Done 1360 tasks      | elapsed:    4.2s
[Parallel(n_jobs=2)]: Done 1484 out of 1484 | elapsed:    4.4s finished


In [26]:
load_dataset(str_datasets[4], datasets[4])

Loading previously saved dgl graphs...


### DeepChem QM Dataset

In [27]:
from deepchem.molnet.load_function.qm9_datasets import load_qm9
from deepchem.molnet.load_function.qm7_datasets import load_qm7

In [58]:
def process_qm_dataset(ind):
    folder = os.path.join('dataset', f'QM{ind}')

    qm7 = pd.read_csv(os.path.join(folder, f'qm{ind}.csv'))

    qm7['smiles'].to_csv(os.path.join(folder, 'smiles.csv'), header=None, index=False)

    qm7.iloc[:, 1:].to_csv(os.path.join(folder, 'targets.csv'), header=None, index=False)

    mols = []
    for smile in qm7['smiles']:
        mols.append(Chem.MolFromSmiles(smile))

    with Chem.SDWriter(os.path.join(folder, 'data.sdf')) as w:
        for m in mols:
            w.write(m)

In [59]:
process_qm_dataset(8)

In [60]:
process_qm_dataset(9)

In [61]:
data = pd.DataFrame({})
analize_sdf_file(data, 'dataset/QM9/data.sdf', '     RDKit          2D\n', chain_num=1, neighbors=True, connections=True)
data = data.fillna(0)
s = sorted(data.columns)
data = data[sorted(s, key = lambda name: len(name))]

133885 133885


100%|██████████████████████████████████████████████████████████| 133885/133885 [34:40<00:00, 64.34it/s]


### SDF Parser

In [15]:
#анализируем .sdf файл


def conn_type_big(comm, atom, connections):
    num_of_double = 0
    num_of_triple = 0
    if connections == False:
        return '*'
    for row in comm:
        if row[0] == atom or row[1] == atom:
            if row[2] == 2:
                num_of_double += 1
            elif row[2] == 3:
                num_of_triple += 1
    if num_of_double == 0 and num_of_triple == 0:
        return 's'
    elif num_of_double == 1 and num_of_triple == 0:
        return 'd'
    elif num_of_double >= 2 and num_of_triple == 0:
        return 'w'
    elif num_of_triple > 0:
        return 't'
    else:
        print('WHAT')
        return '?'


def analize_sdf_file(mols, file, key, chain_num, neighbors=True, connections=True):
    with open(file) as f:
        #lines = f.readlines()
        begin = []
        end = []
        lines = []
        i = 0

        for line in f.readlines():
            if line.startswith("M") and not line.startswith("M  END"):
                continue
            
            if line.startswith(key):
                begin.append(i)
                
            if line == 'M  END\n':
                end.append(i)
                
            lines.append(line)
            i +=1 

        print(len(begin), len(end))
        assert len(begin) == len(end)
        
        for molecula in tqdm.tqdm(range(len(begin))):
            num_of_atoms = int(lines[begin[molecula]+2][:3])
            num_of_edges = int(lines[begin[molecula]+2][3:6])
            
            #num_of_atoms = int(list(lines[begin[molecula]+2].split())[0])
            #num_of_edges = int(list(lines[begin[molecula]+2].split())[1])
            beg = num_of_atoms + begin[molecula] + 3
            connect = []
            nums_to_names = dict()
            nums_to_names2 = dict()
            nums_to_names3 = dict()
            for i in range(end[molecula]-beg):
                #print(lines[beg+i])
                id_1 = int(lines[beg+i][:3])
                id_2 = int(lines[beg+i][3:6])
                type_1_2 = int(lines[beg+i][6:].split()[0])
                
                #print(list(lines[beg+i].split())[0:3])
                connect.append([id_1, id_2, type_1_2])
            
            # 1-цепочки
            for atom in range(1, num_of_atoms+1):
                #print(begin[molecula]+2+atom, lines[begin[molecula]+2+atom])
                
                #NN = lines[begin[molecula]+2+atom][6:].split()[0]#.split()[3]
                NN = lines[begin[molecula]+2+atom].split()[3]
                if len(NN) == 1:
                    NN = NN + '_'
                num_of_neighbors = 0
                for row in connect:
                    if atom == row[0] or atom == row[1]:
                        num_of_neighbors += 1
                num_of_neighbors = str(num_of_neighbors)
                type_of_connection = conn_type_big(connect, atom, connections)
                name = NN
                if neighbors == True:
                    name += num_of_neighbors
                else:
                    name += '*'
                name += type_of_connection + '*'
#                 name = NN + num_of_neighbors + type_of_connection + '*'
                nums_to_names[atom] = name
                if molecula in mols.index:
                    if name in mols.columns:
                        if np.isnan(mols[name][molecula]):
                            mols.loc[molecula, name] = 1
                        else:
                            mols.loc[molecula, name] += 1
                    else:
                        mols.loc[molecula, name] = 1
                else:
                    mols.loc[molecula, name] = 1
                    
            # 2-цепочки
            if chain_num > 1:
                for atom in range(1, num_of_atoms+1):
                    for row in connect:
                        if (row[0] == atom and row[1] > atom) or (row[1] == atom and row[0] > atom):
                            NNmas = sorted([nums_to_names[row[0]], nums_to_names[row[1]]])
                            NN = NNmas[0] + NNmas[1]
                            name = NN
    #                         if row[2] == 1:
    #                             name = NN + '_s'
    #                         elif row[2] == 2:
    #                             name = NN + '_d'
    #                         elif row[2] == 3:
    #                             name == NN + '_t'
    #                         else:
    #                             name == NN + '_?'
                            nums_to_names2[tuple(sorted((row[0], row[1])))] = name
                            if molecula in mols.index:
                                if name in mols.columns:
                                    if np.isnan(mols[name][molecula]):
                                        mols.loc[molecula, name] = 1
                                    else:
                                        mols.loc[molecula, name] += 1
                                else:
                                    mols.loc[molecula, name] = 1
                            else:
                                mols.loc[molecula, name] = 1
            # 3-цепочки
            if chain_num > 2:
                for pair in nums_to_names2.keys():
                    for row in connect:
                        if (row[0] == pair[0] and row[1] > pair[1]) or (row[0] == pair[1] and row[1] > pair[0]):
                            if nums_to_names3.get(tuple(sorted([pair[0], pair[1], row[1]])), -1) == -1:                          
                                NNmas = sorted([nums_to_names2[pair], nums_to_names[row[1]]])
                                name = NNmas[0] + NNmas[1]
                                nums_to_names3[tuple(sorted([pair[0], pair[1], row[1]]))] = name
                        if (row[1] == pair[0] and row[0] > pair[1]) or (row[1] == pair[1] and row[0] > pair[0]):
                            if nums_to_names3.get(tuple(sorted([pair[0], pair[1], row[0]])), -1) == -1:                          
                                NNmas = sorted([nums_to_names2[pair], nums_to_names[row[0]]])
                                name = NNmas[0] + NNmas[1]
                                nums_to_names3[tuple(sorted([pair[0], pair[1], row[0]]))] = name
                        if molecula in mols.index:
                            if name in mols.columns:
                                if np.isnan(mols[name][molecula]):
                                    mols.loc[molecula, name] = 1
                                else:
                                    mols.loc[molecula, name] += 1
                            else:
                                mols.loc[molecula, name] = 1
                        else:
                            mols.loc[molecula, name] = 1

### Process Matrices

In [5]:
from sklearn.model_selection import ParameterGrid

In [6]:
def process_sdf_file(folder, args):
    key = '     RDKit          2D\n'
    filename = os.path.join(folder, 'data.sdf')
    
    data = pd.DataFrame({})
    analize_sdf_file(data, filename, key, **args)
    data = data.fillna(0)
    s = sorted(data.columns)
    data = data[sorted(s, key = lambda name: len(name))]

    markers = {}
    markers['d'] = '_' if args['neighbors'] == False else 'd'
    markers['b'] = '_' if args['connections'] == False else 'b'

    output_filename = 'matrix_alphabet_NN'
    output_filename +=  markers['d'] +  markers['b']
    output_filename += f"_{args['chain_num']}chains.csv"

    data.to_csv(os.path.join(folder, output_filename), sep=',', header=True, index=False)
    
    return (folder, args)

In [7]:
param_grid = ParameterGrid({'chain_num' : [1, 2], 'neighbors' : [True, False], 'connections' : [True, False]})

In [143]:
process_sdf_file('dataset/tox21', param_grid)

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7831/7831 [01:26<00:00, 90.86it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7831/7831 [01:28<00:00, 88.61it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7831/7831 [01:08<00:00, 114.83it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7831/7831 [00:58<00:00, 134.71it/s]
100%|███████████████████████████████████████████████

### Multiprocess Processing

In [8]:
str_datasets = ['QM7', 'QM8', 'QM9', 'ESOL', 'FreeSolv', 'Lipophilicity', 'MUV', 'HIV', 'BACE', 'BBBP', 'ToxCast', 'SIDER', 'ClinTox', 'PCBA']

In [11]:
pool_args = []
for folder in str_datasets:
    for args in param_grid:
        pool_args.append((os.path.join('dataset', folder), args))

In [12]:
pool_args[:2]

[('dataset\\QM7', {'chain_num': 1, 'connections': True, 'neighbors': True}),
 ('dataset\\QM7', {'chain_num': 1, 'connections': True, 'neighbors': False})]

In [13]:
import multiprocessing
from multiprocessing import Pool

In [None]:
with Pool(5) as pool:
    for res in pool.starmap(process_sdf_file, pool_args[:2]):
        print(res)

In [None]:
for args in pool_args:
    process_sdf_file(*args)

6834 6834


100%|█████████████████████████████████████████████████████████████| 6834/6834 [00:07<00:00, 962.64it/s]


6834 6834


100%|████████████████████████████████████████████████████████████| 6834/6834 [00:06<00:00, 1014.00it/s]


6834 6834


100%|█████████████████████████████████████████████████████████████| 6834/6834 [00:06<00:00, 983.99it/s]


6834 6834


100%|█████████████████████████████████████████████████████████████| 6834/6834 [00:07<00:00, 872.06it/s]


6834 6834


100%|█████████████████████████████████████████████████████████████| 6834/6834 [00:26<00:00, 260.04it/s]


6834 6834


100%|█████████████████████████████████████████████████████████████| 6834/6834 [00:17<00:00, 383.40it/s]


6834 6834


100%|█████████████████████████████████████████████████████████████| 6834/6834 [00:17<00:00, 390.35it/s]


6834 6834


100%|█████████████████████████████████████████████████████████████| 6834/6834 [00:13<00:00, 489.28it/s]


21786 21786


100%|███████████████████████████████████████████████████████████| 21786/21786 [00:48<00:00, 453.38it/s]


21786 21786


100%|███████████████████████████████████████████████████████████| 21786/21786 [00:37<00:00, 586.68it/s]


21786 21786


100%|███████████████████████████████████████████████████████████| 21786/21786 [00:41<00:00, 529.05it/s]


21786 21786


100%|███████████████████████████████████████████████████████████| 21786/21786 [00:32<00:00, 675.47it/s]


21786 21786


100%|███████████████████████████████████████████████████████████| 21786/21786 [02:38<00:00, 137.72it/s]


21786 21786


100%|███████████████████████████████████████████████████████████| 21786/21786 [01:23<00:00, 259.84it/s]


21786 21786


100%|███████████████████████████████████████████████████████████| 21786/21786 [01:43<00:00, 210.99it/s]


21786 21786


100%|███████████████████████████████████████████████████████████| 21786/21786 [01:06<00:00, 328.63it/s]


133885 133885


100%|██████████████████████████████████████████████████████████| 133885/133885 [25:48<00:00, 86.44it/s]


133885 133885


100%|█████████████████████████████████████████████████████████| 133885/133885 [16:56<00:00, 131.67it/s]


133885 133885


100%|█████████████████████████████████████████████████████████| 133885/133885 [18:58<00:00, 117.61it/s]


133885 133885


100%|█████████████████████████████████████████████████████████| 133885/133885 [12:22<00:00, 180.29it/s]


133885 133885


100%|████████████████████████████████████████████████████████| 133885/133885 [1:27:53<00:00, 25.39it/s]


133885 133885


100%|██████████████████████████████████████████████████████████| 133885/133885 [33:54<00:00, 65.79it/s]


133885 133885


100%|██████████████████████████████████████████████████████████| 133885/133885 [49:07<00:00, 45.42it/s]


133885 133885


100%|█████████████████████████████████████████████████████████| 133885/133885 [19:57<00:00, 111.78it/s]


1128 1128


100%|█████████████████████████████████████████████████████████████| 1128/1128 [00:02<00:00, 415.79it/s]


1128 1128


100%|█████████████████████████████████████████████████████████████| 1128/1128 [00:02<00:00, 413.54it/s]


1128 1128


100%|█████████████████████████████████████████████████████████████| 1128/1128 [00:02<00:00, 426.51it/s]


1128 1128


100%|█████████████████████████████████████████████████████████████| 1128/1128 [00:02<00:00, 425.51it/s]


1128 1128


100%|█████████████████████████████████████████████████████████████| 1128/1128 [00:05<00:00, 204.77it/s]


1128 1128


100%|█████████████████████████████████████████████████████████████| 1128/1128 [00:05<00:00, 218.50it/s]


1128 1128


100%|█████████████████████████████████████████████████████████████| 1128/1128 [00:05<00:00, 218.08it/s]


1128 1128


100%|█████████████████████████████████████████████████████████████| 1128/1128 [00:05<00:00, 220.79it/s]


642 642


100%|███████████████████████████████████████████████████████████████| 642/642 [00:01<00:00, 603.30it/s]


642 642


100%|███████████████████████████████████████████████████████████████| 642/642 [00:01<00:00, 624.93it/s]


642 642


100%|███████████████████████████████████████████████████████████████| 642/642 [00:01<00:00, 612.17it/s]


642 642


100%|███████████████████████████████████████████████████████████████| 642/642 [00:01<00:00, 617.51it/s]


642 642


100%|███████████████████████████████████████████████████████████████| 642/642 [00:01<00:00, 322.58it/s]


642 642


100%|███████████████████████████████████████████████████████████████| 642/642 [00:02<00:00, 292.64it/s]


642 642


100%|███████████████████████████████████████████████████████████████| 642/642 [00:02<00:00, 285.93it/s]


642 642


100%|███████████████████████████████████████████████████████████████| 642/642 [00:02<00:00, 304.25it/s]


4200 4200


100%|█████████████████████████████████████████████████████████████| 4200/4200 [00:21<00:00, 194.37it/s]


4200 4200


100%|█████████████████████████████████████████████████████████████| 4200/4200 [00:21<00:00, 199.76it/s]


4200 4200


100%|█████████████████████████████████████████████████████████████| 4200/4200 [00:21<00:00, 196.91it/s]


4200 4200


100%|█████████████████████████████████████████████████████████████| 4200/4200 [00:20<00:00, 203.16it/s]


4200 4200


100%|██████████████████████████████████████████████████████████████| 4200/4200 [00:50<00:00, 83.62it/s]


4200 4200


100%|██████████████████████████████████████████████████████████████| 4200/4200 [00:44<00:00, 94.89it/s]


4200 4200


100%|██████████████████████████████████████████████████████████████| 4200/4200 [00:46<00:00, 90.54it/s]


4200 4200


100%|██████████████████████████████████████████████████████████████| 4200/4200 [00:43<00:00, 95.50it/s]


93087 93087


100%|████████████████████████████████████████████████████████████| 93087/93087 [20:34<00:00, 75.38it/s]


93087 93087


100%|███████████████████████████████████████████████████████████| 93087/93087 [15:04<00:00, 102.89it/s]


93087 93087


100%|███████████████████████████████████████████████████████████| 93087/93087 [14:58<00:00, 103.62it/s]


93087 93087


100%|███████████████████████████████████████████████████████████| 93087/93087 [11:51<00:00, 130.84it/s]


93087 93087


100%|██████████████████████████████████████████████████████████| 93087/93087 [1:37:02<00:00, 15.99it/s]


93087 93087


100%|████████████████████████████████████████████████████████████| 93087/93087 [44:48<00:00, 34.63it/s]


93087 93087


100%|████████████████████████████████████████████████████████████| 93087/93087 [47:09<00:00, 32.90it/s]


93087 93087


100%|████████████████████████████████████████████████████████████| 93087/93087 [22:39<00:00, 68.45it/s]


41127 41127


100%|████████████████████████████████████████████████████████████| 41127/41127 [15:30<00:00, 44.22it/s]


41127 41127


100%|████████████████████████████████████████████████████████████| 41127/41127 [08:28<00:00, 80.84it/s]


41127 41127


100%|████████████████████████████████████████████████████████████| 41127/41127 [13:20<00:00, 51.36it/s]


41127 41127


100%|████████████████████████████████████████████████████████████| 41127/41127 [06:55<00:00, 99.04it/s]


41127 41127


100%|██████████████████████████████████████████████████████████| 41127/41127 [1:15:44<00:00,  9.05it/s]


41127 41127


100%|████████████████████████████████████████████████████████████| 41127/41127 [35:45<00:00, 19.17it/s]


41127 41127


100%|████████████████████████████████████████████████████████████| 41127/41127 [54:40<00:00, 12.54it/s]


41127 41127


100%|████████████████████████████████████████████████████████████| 41127/41127 [23:31<00:00, 29.14it/s]


1513 1513


100%|█████████████████████████████████████████████████████████████| 1513/1513 [00:10<00:00, 142.19it/s]


1513 1513


100%|█████████████████████████████████████████████████████████████| 1513/1513 [00:09<00:00, 160.01it/s]


1513 1513


100%|█████████████████████████████████████████████████████████████| 1513/1513 [00:09<00:00, 164.62it/s]


1513 1513


100%|█████████████████████████████████████████████████████████████| 1513/1513 [00:09<00:00, 164.74it/s]


1513 1513


100%|██████████████████████████████████████████████████████████████| 1513/1513 [00:19<00:00, 78.48it/s]


1513 1513


100%|██████████████████████████████████████████████████████████████| 1513/1513 [00:19<00:00, 75.89it/s]


1513 1513


100%|██████████████████████████████████████████████████████████████| 1513/1513 [00:18<00:00, 82.34it/s]


1513 1513


100%|██████████████████████████████████████████████████████████████| 1513/1513 [00:18<00:00, 81.03it/s]


2039 2039


100%|█████████████████████████████████████████████████████████████| 2039/2039 [00:09<00:00, 213.80it/s]


2039 2039


100%|█████████████████████████████████████████████████████████████| 2039/2039 [00:14<00:00, 136.68it/s]


2039 2039


100%|█████████████████████████████████████████████████████████████| 2039/2039 [00:09<00:00, 220.06it/s]


2039 2039


100%|█████████████████████████████████████████████████████████████| 2039/2039 [00:08<00:00, 232.49it/s]


2039 2039


100%|█████████████████████████████████████████████████████████████| 2039/2039 [00:19<00:00, 104.60it/s]


2039 2039


100%|█████████████████████████████████████████████████████████████| 2039/2039 [00:18<00:00, 108.57it/s]


2039 2039


100%|█████████████████████████████████████████████████████████████| 2039/2039 [00:19<00:00, 104.34it/s]


2039 2039


100%|█████████████████████████████████████████████████████████████| 2039/2039 [00:18<00:00, 111.86it/s]


8576 8576


100%|█████████████████████████████████████████████████████████████| 8576/8576 [00:53<00:00, 161.18it/s]


8576 8576


100%|█████████████████████████████████████████████████████████████| 8576/8576 [00:44<00:00, 192.05it/s]


8576 8576


100%|█████████████████████████████████████████████████████████████| 8576/8576 [00:47<00:00, 181.14it/s]


8576 8576


100%|█████████████████████████████████████████████████████████████| 8576/8576 [00:39<00:00, 218.84it/s]


8576 8576


100%|██████████████████████████████████████████████████████████████| 8576/8576 [02:13<00:00, 64.13it/s]


8576 8576


100%|██████████████████████████████████████████████████████████████| 8576/8576 [01:40<00:00, 85.28it/s]


8576 8576


100%|██████████████████████████████████████████████████████████████| 8576/8576 [01:52<00:00, 75.91it/s]


8576 8576


100%|██████████████████████████████████████████████████████████████| 8576/8576 [01:25<00:00, 99.85it/s]


1427 1427


100%|█████████████████████████████████████████████████████████████| 1427/1427 [00:10<00:00, 139.80it/s]


1427 1427


100%|█████████████████████████████████████████████████████████████| 1427/1427 [00:11<00:00, 129.39it/s]


1427 1427


100%|█████████████████████████████████████████████████████████████| 1427/1427 [00:09<00:00, 154.84it/s]


1427 1427


100%|█████████████████████████████████████████████████████████████| 1427/1427 [00:09<00:00, 156.69it/s]


1427 1427


100%|██████████████████████████████████████████████████████████████| 1427/1427 [00:20<00:00, 70.69it/s]


1427 1427


100%|██████████████████████████████████████████████████████████████| 1427/1427 [00:19<00:00, 72.60it/s]


1427 1427


100%|██████████████████████████████████████████████████████████████| 1427/1427 [00:18<00:00, 75.11it/s]


1427 1427


100%|██████████████████████████████████████████████████████████████| 1427/1427 [00:18<00:00, 78.99it/s]


1478 1478


100%|█████████████████████████████████████████████████████████████| 1478/1478 [00:07<00:00, 203.24it/s]


1478 1478


100%|█████████████████████████████████████████████████████████████| 1478/1478 [00:08<00:00, 184.44it/s]


1478 1478


100%|█████████████████████████████████████████████████████████████| 1478/1478 [00:06<00:00, 214.70it/s]


1478 1478


100%|█████████████████████████████████████████████████████████████| 1478/1478 [00:06<00:00, 211.43it/s]


1478 1478


100%|█████████████████████████████████████████████████████████████| 1478/1478 [00:14<00:00, 100.08it/s]


1478 1478


100%|█████████████████████████████████████████████████████████████| 1478/1478 [00:13<00:00, 106.85it/s]


1478 1478


100%|█████████████████████████████████████████████████████████████| 1478/1478 [00:14<00:00, 103.87it/s]


1478 1478


100%|█████████████████████████████████████████████████████████████| 1478/1478 [00:14<00:00, 102.48it/s]


437929 437929


100%|███████████████████████████████████████████████████████| 437929/437929 [15:09:56<00:00,  8.02it/s]


437929 437929


100%|████████████████████████████████████████████████████████| 437929/437929 [9:34:35<00:00, 12.70it/s]


437929 437929


 75%|████████████████████████████████████████▎             | 327326/437929 [5:59:51<4:42:31,  6.52it/s]