In [3]:
import torch

import subprocess as sp

from tqdm.auto import tqdm
from glob import glob
from collections import defaultdict

from rdkit import Chem
from rdkit import RDLogger 
RDLogger.DisableLog('rdApp.*')

from utils import load_obj, save_obj

In [4]:
def get_ligand_mol(l_f):
    mol = Chem.MolFromMol2File(l_f)
    if mol == None:
        mol = Chem.SDMolSupplier(f'{l_f[:-5]}.sdf')[0]
    if mol == None:
        sp.run(f'obabel -imol2 {l_f} -omol2 -O {l_f[:-5]}_fix.mol2', shell=True, capture_output=True)
        mol = Chem.MolFromMol2File(f'{l_f[:-5]}_fix.mol2')
        sp.run(f'rm {l_f[:-5]}_fix.mol2', shell=True, capture_output=True)
    if mol == None:
        sp.run(f'obabel -imol2 {l_f} -osdf -O {l_f[:-5]}_fix.sdf', shell=True, capture_output=True)
        mol = Chem.SDMolSupplier(f'{l_f[:-5]}_fix.sdf')[0]
        sp.run(f'rm {l_f[:-5]}_fix.sdf', shell=True, capture_output=True)    
    if mol == None:
        sp.run(f'obabel -isdf {l_f[:-5]}.sdf -omol2 -O {l_f[:-5]}_fix.mol2', shell=True, capture_output=True)
        mol = Chem.MolFromMol2File(f'{l_f[:-5]}_fix.mol2')
        sp.run(f'rm {l_f[:-5]}_fix.mol2', shell=True, capture_output=True)
    if mol == None:
        sp.run(f'obabel -isdf {l_f[:-5]}.sdf -osdf -O {l_f[:-5]}_fix.sdf', shell=True, capture_output=True)
        mol = Chem.SDMolSupplier(f'{l_f[:-5]}_fix.sdf')[0]
        sp.run(f'rm {l_f[:-5]}_fix.sdf', shell=True, capture_output=True)
    return mol

In [7]:
refined_lig = [ file for file in  glob('/data/PDBbind/refined-set/*/*') if 'mol2' in file ]
other_lig = [ file for file in  glob('/data/PDBbind/v2020-other-PL/*/*') if 'mol2' in file ]
total_lig = refined_lig + other_lig

In [10]:
ligs = {}
for lig in tqdm( total_lig ):
    pdb = lig.split('/')[-2]
    try:
        mol = get_ligand_mol( lig )
        if mol != None:
            ligs[pdb] = mol
        else:
            pass
    except:
        pass
    # break

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 19446/19446 [00:20<00:00, 961.08it/s]


In [14]:
save_obj( ligs, '/data/PDBbind/ligand' )

In [17]:
refined_prot = [ file for file in glob("/data/PDBbind/refined-set/*/*") if 'protein.pdb' in file ]
other_prot   = [ file for file in glob("/data/PDBbind/v2020-other-PL/*/*") if 'protein.pdb' in file ]

total_prot = refined_prot + other_prot
proteins = { file.split("/")[-1][:4]: file for file in total_prot }

In [19]:
def get_protein_coordinate(pdb_f):
    return torch.tensor( [ [ float(line[30:38]), float(line[38:46]), float(line[46:54]) ] for line in open(pdb_f).readlines() if line[0:4] in ['ATOM', 'HETA'] and 'H' not in line[12:14] and 'HOH' not in line[17:20] ] )

def get_ligand_coordinate(mol):
    return mol.GetConformers()[0].GetPositions()

def calculate_atom_pair_distance(arr1, arr2):
    return torch.linalg.norm( arr1[:, None, :] - arr2[None, :, :], axis = -1)

def select_pocket_atom(pair_distance, cut_off):
    return torch.where( pair_distance < cut_off )[0]
    
def get_pocket_in_protein(pdb_f, select_index):
    total_atom = [ line for line in open(pdb_f).readlines() if line[0:4] in ['ATOM', 'HETA'] and 'H' not in line[12:14] and 'HOH' not in line[17:20] ]
    select_atom = [ line for idx, line in enumerate(total_atom) if idx in select_index ]

    select_residue = defaultdict(set)
    for idx, line in enumerate(total_atom):
        if idx in select_index:
            select_residue[line[21]].add( int(line[22:26]))
    
    total_lines = """"""
    for idx, line in enumerate(total_atom):
        if int( line[22:26] ) in select_residue[ line[21] ]:
            total_lines += line
    
    mol = Chem.MolFromPDBBlock( total_lines)
    Chem.AssignAtomChiralTagsFromStructure(mol)
    
    # a = mol.GetAtoms()
    # for atom in a:
    #     sym = atom.GetSymbol()
    #     if sym not in ['C', 'O', 'N','S', 'P', 'Se', 'F', 'Cl', 'Br', 'I', ]:
    #         print(sym, pdb_f)
    
    return mol

def get_pocket_residue(pdb_f, mol2_f):
    prot_xyz = get_protein_atom_xyz(pdb_f) 
    lig_xyz  = get_ligand_atom_xyz(mol2_f)
    
    pair_distance = calculate_atom_pair_distance(prot_xyz, lig_xyz)    
    select_prot_atom_index = select_pocket_atom(pair_distance, cut_off=8)
    
    return get_pocket_in_protein(pdb_f, select_prot_atom_index)

In [24]:
pocket = {}

for pdb, p_file in tqdm( proteins.items() ):
    try:
        protein_coord = get_protein_coordinate( p_file )
        ligand_coord  = get_ligand_coordinate( ligs[pdb] )
        pairwise_dist = calculate_atom_pair_distance( protein_coord, ligand_coord )

        selected_atom_index =  torch.where( pairwise_dist < 8 )[0] 
        pocket_mol = get_pocket_in_protein( p_file, selected_atom_index)    
        pocket[pdb] = pocket_mol
        
    except Exception as E:
        print(E, p_file)
    # break

  3%|█████▏                                                                                                                                                | 669/19443 [00:32<17:34, 17.81it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/refined-set/1r1h/1r1h_protein.pdb


  4%|██████▋                                                                                                                                               | 859/19443 [00:41<13:04, 23.68it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/refined-set/4abd/4abd_protein.pdb


 10%|███████████████▍                                                                                                                                     | 2016/19443 [01:39<13:23, 21.68it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/refined-set/2a5b/2a5b_protein.pdb


 12%|█████████████████▌                                                                                                                                   | 2291/19443 [01:52<10:26, 27.37it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/refined-set/2zjw/2zjw_protein.pdb


 12%|██████████████████▏                                                                                                                                  | 2374/19443 [01:56<12:30, 22.74it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/refined-set/1cps/1cps_protein.pdb


 27%|████████████████████████████████████████▌                                                                                                            | 5300/19443 [04:21<15:02, 15.68it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/refined-set/1g7v/1g7v_protein.pdb


 29%|███████████████████████████████████████████▋                                                                                                         | 5700/19443 [04:44<09:00, 25.44it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/5xfj/5xfj_protein.pdb


 31%|██████████████████████████████████████████████▍                                                                                                      | 6057/19443 [05:04<09:06, 24.50it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/3udn/3udn_protein.pdb


 32%|███████████████████████████████████████████████                                                                                                      | 6142/19443 [05:08<10:48, 20.51it/s]

'3zp9' /data/PDBbind/v2020-other-PL/3zp9/3zp9_protein.pdb


 32%|████████████████████████████████████████████████                                                                                                     | 6272/19443 [05:16<09:02, 24.28it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/4z7f/4z7f_protein.pdb


 34%|██████████████████████████████████████████████████▊                                                                                                  | 6630/19443 [05:36<08:27, 25.22it/s]

'2ci9' /data/PDBbind/v2020-other-PL/2ci9/2ci9_protein.pdb


 36%|█████████████████████████████████████████████████████▏                                                                                               | 6933/19443 [05:52<10:37, 19.62it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/5lp6/5lp6_protein.pdb


 36%|█████████████████████████████████████████████████████▍                                                                                               | 6971/19443 [05:54<12:40, 16.40it/s]

'3fxz' /data/PDBbind/v2020-other-PL/3fxz/3fxz_protein.pdb


 45%|██████████████████████████████████████████████████████████████████▌                                                                                  | 8693/19443 [07:31<09:52, 18.13it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/1qon/1qon_protein.pdb


 45%|██████████████████████████████████████████████████████████████████▊                                                                                  | 8720/19443 [07:33<10:12, 17.50it/s]

'3kck' /data/PDBbind/v2020-other-PL/3kck/3kck_protein.pdb


 48%|███████████████████████████████████████████████████████████████████████                                                                              | 9273/19443 [08:02<07:44, 21.89it/s]

'2pll' /data/PDBbind/v2020-other-PL/2pll/2pll_protein.pdb


 49%|█████████████████████████████████████████████████████████████████████████▏                                                                           | 9544/19443 [08:16<07:50, 21.05it/s]

'5hlm' /data/PDBbind/v2020-other-PL/5hlm/5hlm_protein.pdb


 53%|██████████████████████████████████████████████████████████████████████████████▍                                                                     | 10306/19443 [08:58<10:16, 14.83it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/5xwr/5xwr_protein.pdb


 55%|█████████████████████████████████████████████████████████████████████████████████                                                                   | 10646/19443 [09:17<08:05, 18.13it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/4kb7/4kb7_protein.pdb


 55%|█████████████████████████████████████████████████████████████████████████████████▏                                                                  | 10666/19443 [09:18<09:26, 15.48it/s]

'5ujo' /data/PDBbind/v2020-other-PL/5ujo/5ujo_protein.pdb


 57%|████████████████████████████████████████████████████████████████████████████████████▎                                                               | 11080/19443 [09:39<07:36, 18.31it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/4x1r/4x1r_protein.pdb


 57%|████████████████████████████████████████████████████████████████████████████████████▊                                                               | 11141/19443 [09:41<05:52, 23.58it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/2brh/2brh_protein.pdb


 57%|████████████████████████████████████████████████████████████████████████████████████▉                                                               | 11164/19443 [09:42<06:45, 20.42it/s]

'3bwf' /data/PDBbind/v2020-other-PL/3bwf/3bwf_protein.pdb


 60%|████████████████████████████████████████████████████████████████████████████████████████▎                                                           | 11603/19443 [10:07<07:15, 18.00it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/1ai6/1ai6_protein.pdb


 60%|████████████████████████████████████████████████████████████████████████████████████████▉                                                           | 11684/19443 [10:11<06:21, 20.31it/s]

'3vjs' /data/PDBbind/v2020-other-PL/3vjs/3vjs_protein.pdb


 60%|█████████████████████████████████████████████████████████████████████████████████████████▏                                                          | 11712/19443 [10:13<05:44, 22.45it/s]

'2foy' /data/PDBbind/v2020-other-PL/2foy/2foy_protein.pdb


 62%|████████████████████████████████████████████████████████████████████████████████████████████▏                                                       | 12103/19443 [10:33<05:51, 20.88it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/5nwh/5nwh_protein.pdb
'1a7x' /data/PDBbind/v2020-other-PL/1a7x/1a7x_protein.pdb


 62%|████████████████████████████████████████████████████████████████████████████████████████████▏                                                       | 12117/19443 [10:34<07:49, 15.59it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/4bxn/4bxn_protein.pdb


 64%|██████████████████████████████████████████████████████████████████████████████████████████████▉                                                     | 12467/19443 [10:54<05:50, 19.92it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/2g83/2g83_protein.pdb


 66%|█████████████████████████████████████████████████████████████████████████████████████████████████▋                                                  | 12838/19443 [11:17<04:55, 22.33it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/2nwn/2nwn_protein.pdb


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████▋                                              | 13356/19443 [11:46<04:48, 21.11it/s]

'3qlb' /data/PDBbind/v2020-other-PL/3qlb/3qlb_protein.pdb


 69%|██████████████████████████████████████████████████████████████████████████████████████████████████████▌                                             | 13481/19443 [11:53<04:41, 21.17it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/6qyn/6qyn_protein.pdb


 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████▉                                             | 13523/19443 [11:55<03:38, 27.08it/s]

'3vjt' /data/PDBbind/v2020-other-PL/3vjt/3vjt_protein.pdb


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████                                       | 14330/19443 [12:39<04:05, 20.86it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/4m3b/4m3b_protein.pdb


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                    | 14651/19443 [12:56<04:14, 18.83it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/6a30/6a30_protein.pdb


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                   | 14795/19443 [13:04<03:51, 20.04it/s]

'2fou' /data/PDBbind/v2020-other-PL/2fou/2fou_protein.pdb


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                   | 14809/19443 [13:04<02:43, 28.33it/s]

'1h07' /data/PDBbind/v2020-other-PL/1h07/1h07_protein.pdb


 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                  | 14895/19443 [13:09<04:13, 17.97it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/2c5y/2c5y_protein.pdb


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                            | 15732/19443 [13:54<03:14, 19.09it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/6mu1/6mu1_protein.pdb


 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 15793/19443 [13:57<02:23, 25.44it/s]

'1qpf' /data/PDBbind/v2020-other-PL/1qpf/1qpf_protein.pdb


 82%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                          | 15961/19443 [14:06<03:25, 16.92it/s]

'3cst' /data/PDBbind/v2020-other-PL/3cst/3cst_protein.pdb


 87%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 16983/19443 [15:02<01:26, 28.52it/s]

'2fov' /data/PDBbind/v2020-other-PL/2fov/2fov_protein.pdb


 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 17155/19443 [15:11<01:41, 22.44it/s]

'3bho' /data/PDBbind/v2020-other-PL/3bho/3bho_protein.pdb


 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                 | 17161/19443 [15:11<02:09, 17.62it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/4m3f/4m3f_protein.pdb


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 17703/19443 [15:43<01:20, 21.50it/s]

'4rlp' /data/PDBbind/v2020-other-PL/4rlp/4rlp_protein.pdb


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉            | 17861/19443 [15:51<01:03, 24.93it/s]

'2aoh' /data/PDBbind/v2020-other-PL/2aoh/2aoh_protein.pdb


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋          | 18084/19443 [16:02<00:53, 25.47it/s]

'3fy0' /data/PDBbind/v2020-other-PL/3fy0/3fy0_protein.pdb


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏        | 18284/19443 [16:13<01:06, 17.47it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/2r1w/2r1w_protein.pdb


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 18504/19443 [16:23<00:39, 23.56it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/5wyr/5wyr_protein.pdb


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍     | 18712/19443 [16:35<00:36, 20.01it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/3gpe/3gpe_protein.pdb


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌    | 18865/19443 [16:43<00:27, 20.73it/s]

Python argument types in
    rdkit.Chem.rdmolops.AssignAtomChiralTagsFromStructure(NoneType)
did not match C++ signature:
    AssignAtomChiralTagsFromStructure(RDKit::ROMol {lvalue} mol, int confId=-1, bool replaceExistingTags=True) /data/PDBbind/v2020-other-PL/1f92/1f92_protein.pdb


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 19443/19443 [17:16<00:00, 18.77it/s]


In [25]:
poc = {}
for i in pocket:
    if pocket[i] == None:
        pass
    else:
        poc[i] = pocket[i]

In [27]:
save_obj( poc, '/data/PDBbind/pocket' )

In [28]:
len(poc)

19391