In [1]:
from rdkit.Chem import AllChem as Chem
from rdkit.Chem import Draw
from rdkit.Chem.Draw import IPythonConsole
from rdkit.Chem import MACCSkeys
import csv

In [2]:
with open('../data/chembl_mtor_ic50.csv', 'r') as csvfile:
    reader = csv.DictReader(csvfile, delimiter=";")
    mtor_ligands = [Chem.MolFromSmiles(m['Smiles']) for m in reader]

suppl = Chem.SDMolSupplier('../data/drugbank.sdf')
drugs = [m for m in suppl if m]

In [3]:
mtor_maccs = [MACCSkeys.GenMACCSKeys(m) for m in mtor_ligands]
drugbank_maccs = [MACCSkeys.GenMACCSKeys(m) for m in drugs]
mtor_maccs[0]

<rdkit.DataStructs.cDataStructs.ExplicitBitVect at 0x2c196e503f0>

In [4]:
def compare(arr1, arr2):     
    similar = 0
    trueCount = 0
    
    for x, y in zip(arr1, arr2):
        similar = similar + (x & y)
        trueCount = trueCount + (x | y)
    return similar/trueCount
    

In [5]:
compare(mtor_maccs[0], mtor_maccs[1])

0.4868421052631579

In [6]:
molecule = Chem.MolFromSmiles('c1ccc(c(c1)C(=O)O)O')

In [7]:
fp = Chem.GetMorganFingerprintAsBitVect(molecule, 3)

In [8]:
p = Chem.GetMorganFingerprintAsBitVect(drugs[7], 3)

In [25]:
fp_list = []
for drug in drugs:
    drug_fp = Chem.GetMorganFingerprintAsBitVect(drug, 3)
    print(compare(drug_fp, fp))
    fp_list.append((drug_fp, compare(drug_fp, fp)))
fp_list.sort(reverse=True)

0.055865921787709494
0.05405405405405406
0.06622516556291391
0.05847953216374269
0.031007751937984496
0.072992700729927
0.07482993197278912
0.0847457627118644
0.026595744680851064
0.07368421052631578
0.12244897959183673
0.06666666666666667
0.14814814814814814
0.21951219512195122
0.07936507936507936
0.030303030303030304
0.12195121951219512
0.08163265306122448
0.10869565217391304
0.02564102564102564
0.11428571428571428
0.1282051282051282
0.1
0.05
0.08928571428571429
0.12121212121212122
0.09523809523809523
0.18181818181818182
0.041666666666666664
0.056179775280898875
0.10526315789473684
0.14285714285714285
0.04878048780487805
0.058823529411764705
0.10256410256410256
0.06451612903225806
0.05555555555555555
0.14285714285714285
0.05319148936170213
0.09803921568627451
0.10256410256410256
0.10810810810810811
0.18181818181818182
0.11764705882352941
0.04225352112676056
0.05555555555555555
0.09090909090909091
0.0851063829787234
0.11764705882352941
0.05454545454545454
0.07692307692307693
0.1
0.133

0.06741573033707865
0.06
0.18840579710144928
0.03773584905660377
0.17391304347826086
0.07407407407407407
0.03048780487804878
0.05952380952380952
0.06930693069306931
0.1111111111111111
0.05063291139240506
0.10227272727272728
0.0379746835443038
0.0784313725490196
0.1276595744680851
0.075
0.05555555555555555
0.07407407407407407
0.07936507936507936
0.0547945205479452
0.0673076923076923
0.044444444444444446
0.0898876404494382
0.0660377358490566
0.058823529411764705
0.04
0.0967741935483871
0.07407407407407407
0.08450704225352113
0.05405405405405406
0.0582010582010582
0.24324324324324326
0.1323529411764706
0.10204081632653061
0.07142857142857142
0.039473684210526314
0.02564102564102564
0.08771929824561403
0.1276595744680851
0.07228915662650602
0.1111111111111111
0.05102040816326531
0.038461538461538464
0.06578947368421052
0.04225352112676056
0.05319148936170213
0.08888888888888889
0.13043478260869565
0.054945054945054944
0.08955223880597014
0.05426356589147287
0.13636363636363635
0.0980392156

0.09195402298850575
0.06896551724137931
0.09230769230769231
0.20454545454545456
0.13559322033898305
0.06666666666666667
0.10526315789473684
0.11764705882352941
0.06796116504854369
0.04
0.07407407407407407
0.07228915662650602
0.057692307692307696
0.06896551724137931
0.06493506493506493
0.10638297872340426
0.06741573033707865
0.05555555555555555
0.06818181818181818
0.1111111111111111
0.13793103448275862
0.0898876404494382
0.11688311688311688
0.047872340425531915
0.07246376811594203
0.08163265306122448
0.08695652173913043
0.10204081632653061
0.1111111111111111
0.1
0.12941176470588237
0.08421052631578947
0.10843373493975904
0.10909090909090909
0.05806451612903226
0.043478260869565216
0.034482758620689655
0.09782608695652174
0.12727272727272726
0.038461538461538464
0.10416666666666667
0.0
0.0449438202247191
0.11290322580645161
0.05747126436781609
0.08571428571428572
0.0
0.1111111111111111
0.041666666666666664
0.031496062992125984
0.11320754716981132
0.034482758620689655
0.0196078431372549
0

0.06315789473684211
0.06862745098039216
0.0392156862745098
0.10714285714285714
0.16666666666666666
0.05263157894736842
0.047244094488188976
0.1016949152542373
0.0784313725490196
0.1282051282051282
0.04081632653061224
0.13333333333333333
0.044444444444444446
0.0625
0.03529411764705882
0.07692307692307693
0.04424778761061947
0.15492957746478872
0.023529411764705882
0.21875
0.32432432432432434
0.11764705882352941
0.047619047619047616
0.03773584905660377
0.13725490196078433
0.043478260869565216
0.0
0.08571428571428572
0.0784313725490196
0.06976744186046512
0.125
0.09523809523809523
0.04477611940298507
0.11688311688311688
0.047619047619047616
0.09210526315789473
0.06557377049180328
0.08
0.0196078431372549
0.0784313725490196
0.037037037037037035
0.10810810810810811
0.15384615384615385
0.0410958904109589
0.029411764705882353
0.05263157894736842
0.07377049180327869
0.08928571428571429
0.0
0.09090909090909091
0.0
0.03937007874015748
0.06306306306306306
0.0782608695652174
0.125
0.081632653061224

0.057692307692307696
0.049586776859504134
0.05063291139240506
0.2222222222222222
0.11666666666666667
0.031746031746031744
0.060240963855421686
0.08928571428571429
0.04918032786885246
0.17391304347826086
0.0
0.10714285714285714
0.08163265306122448
0.06382978723404255
0.03389830508474576
0.10810810810810811
0.09523809523809523
0.058823529411764705
0.09090909090909091
0.05172413793103448
0.0975609756097561
0.14516129032258066
0.047058823529411764
0.04
0.0641025641025641
0.12195121951219512
0.06944444444444445
0.018867924528301886
0.08139534883720931
0.18604651162790697
0.06140350877192982
0.08695652173913043
0.09375
0.16393442622950818
0.18181818181818182
0.03278688524590164
0.11940298507462686
0.11904761904761904
0.0847457627118644
0.022222222222222223
0.03389830508474576
0.03571428571428571
0.07142857142857142
0.06976744186046512
0.05405405405405406
0.08333333333333333
0.0782608695652174
0.11538461538461539
0.03636363636363636
0.17073170731707318
0.09090909090909091
0.041237113402061855

0.05263157894736842
0.05454545454545454
0.07142857142857142
0.0
0.10256410256410256
0.05194805194805195
0.09803921568627451
0.05
0.05309734513274336
0.15151515151515152
0.06060606060606061
0.1267605633802817
0.046511627906976744
0.1282051282051282
0.08571428571428572
0.04081632653061224
0.08695652173913043
0.038461538461538464
0.04878048780487805
0.20833333333333334
0.08571428571428572
0.0410958904109589
0.0975609756097561
0.07692307692307693
0.07272727272727272
0.05042016806722689
0.0440251572327044
0.047058823529411764
0.043478260869565216
0.05660377358490566
0.045454545454545456
0.07142857142857142
0.05970149253731343
0.07692307692307693
0.04938271604938271
0.0975609756097561
0.1111111111111111
0.15254237288135594
0.1864406779661017
0.10606060606060606
0.125
0.07446808510638298
0.10638297872340426
0.07547169811320754
0.0410958904109589
0.0641025641025641
0.05
0.13043478260869565
0.10526315789473684
0.10256410256410256
0.13559322033898305
0.05405405405405406
0.0
0.0
0.071428571428571

0.07042253521126761
0.1276595744680851
0.09722222222222222
0.08888888888888889
0.08823529411764706
0.06976744186046512
0.10810810810810811
0.08695652173913043
0.136986301369863
0.06956521739130435
0.1
0.07936507936507936
0.04225352112676056
0.0851063829787234
0.0392156862745098
0.041666666666666664
0.058823529411764705
0.1
0.125
0.11842105263157894
0.1323529411764706
0.034482758620689655
0.05
0.07
0.046511627906976744
0.25
0.09302325581395349
0.07368421052631578
0.07017543859649122
0.07228915662650602
0.08
0.05405405405405406
0.1875
0.12903225806451613
0.07142857142857142
0.023809523809523808
0.07547169811320754
0.08045977011494253
0.047619047619047616
0.16666666666666666
0.047619047619047616
0.027777777777777776
0.06493506493506493
0.024390243902439025
0.09615384615384616
0.12903225806451613
0.16279069767441862
0.06666666666666667
0.09090909090909091
0.12
0.12857142857142856
0.11538461538461539
0.09722222222222222
0.15384615384615385
0.10344827586206896
0.058823529411764705
0.09615384

0.023255813953488372
0.09375
0.030303030303030304
0.05154639175257732
0.16483516483516483
0.08108108108108109
0.05970149253731343
0.0410958904109589
0.09090909090909091
0.058823529411764705
0.022222222222222223
0.047619047619047616
0.06956521739130435
0.10256410256410256
0.06896551724137931
0.1590909090909091
0.04433497536945813
0.0379746835443038
0.05555555555555555
0.036585365853658534
0.03571428571428571
0.016129032258064516
0.04516129032258064
0.09
0.0
0.23529411764705882
0.041666666666666664
0.03773584905660377
0.11320754716981132
0.06382978723404255
0.08421052631578947
0.06451612903225806
0.04081632653061224
0.078125
0.1320754716981132
0.08653846153846154
0.05063291139240506
0.11842105263157894
0.09090909090909091
0.05405405405405406
0.0425531914893617
0.05660377358490566
0.1125
0.015873015873015872
0.09090909090909091
0.125
0.061855670103092786
0.125
0.0967741935483871
0.0
0.057971014492753624
0.1076923076923077
0.11764705882352941
0.08823529411764706
0.05970149253731343
0.11688

0.07142857142857142
0.07317073170731707
0.06382978723404255
0.16
0.05813953488372093
0.0375
0.07407407407407407
0.07058823529411765
0.25
0.060240963855421686
0.0891089108910891
0.11666666666666667
0.09523809523809523
0.11864406779661017
0.09090909090909091
0.0847457627118644
0.10588235294117647
0.08974358974358974
0.06741573033707865
0.07058823529411765
0.0625
0.08536585365853659
0.05825242718446602
0.09183673469387756
0.08
0.03355704697986577
0.03731343283582089
0.08333333333333333
0.0851063829787234
0.10144927536231885
0.14035087719298245
0.037383177570093455
0.1111111111111111
0.0851063829787234
0.03225806451612903
0.20588235294117646
0.041666666666666664
0.07446808510638298
0.04054054054054054
0.07894736842105263
0.07216494845360824
0.08064516129032258
0.07042253521126761
0.07017543859649122
0.07042253521126761
0.1
0.14285714285714285
0.03296703296703297
0.03896103896103896
0.08771929824561403
0.08955223880597014
0.14035087719298245
0.0784313725490196
0.0660377358490566
0.086956521

0.10416666666666667
0.09195402298850575
0.12
0.11666666666666667
0.15
0.10227272727272728
0.07792207792207792
0.049019607843137254
0.037037037037037035
0.15789473684210525
0.05714285714285714
0.07317073170731707
0.045454545454545456
0.02564102564102564
0.0891089108910891
0.07526881720430108
0.078125
0.06593406593406594
0.08695652173913043
0.0392156862745098
0.18604651162790697
0.11666666666666667
0.08450704225352113
0.14705882352941177
0.1320754716981132
0.16666666666666666
0.10526315789473684
0.11363636363636363
0.14285714285714285
0.08536585365853659
0.058823529411764705
0.08333333333333333
0.057971014492753624
0.1111111111111111
0.05555555555555555
0.1276595744680851
0.09090909090909091
0.10843373493975904
0.08080808080808081
0.1125
0.13333333333333333
0.08955223880597014
0.1875
0.07446808510638298
0.05970149253731343
0.07692307692307693
0.11666666666666667
0.07894736842105263
0.16363636363636364
0.04081632653061224
0.038461538461538464
0.07058823529411765
0.16666666666666666
0.2
0.

0.047619047619047616
0.0975609756097561
0.05084745762711865
0.109375
0.08955223880597014
0.08
0.0625
0.08641975308641975
0.0625
0.13846153846153847
0.12631578947368421
0.10144927536231885
0.23076923076923078
0.03333333333333333
0.24528301886792453
0.039473684210526314
0.15384615384615385
0.11688311688311688
0.1095890410958904
0.1095890410958904
0.11764705882352941
0.08791208791208792
0.0821917808219178
0.1232876712328767
0.06930693069306931
0.2222222222222222
0.20930232558139536
0.28205128205128205
0.09230769230769231
0.1111111111111111
0.06944444444444445
0.05172413793103448
0.17391304347826086
0.16071428571428573
0.1111111111111111
0.08045977011494253
0.06153846153846154
0.08823529411764706
0.0945945945945946
0.09375
0.15789473684210525
0.1
0.08955223880597014
0.078125
0.09876543209876543
0.25
0.03076923076923077
0.11267605633802817
0.06756756756756757
0.125
0.08433734939759036
0.0967741935483871
0.06153846153846154
0.08433734939759036
0.08641975308641975
0.20454545454545456
0.144927

0.05194805194805195
0.09230769230769231
0.09375
0.15
0.047058823529411764
0.15
0.15
0.03260869565217391
0.0958904109589041
0.06666666666666667
0.10666666666666667
0.11428571428571428
0.10810810810810811
0.10344827586206896
0.1724137931034483
0.20454545454545456
0.11538461538461539
0.033707865168539325
0.037037037037037035
0.04938271604938271
0.08333333333333333
0.08333333333333333
0.039603960396039604
0.1
0.061855670103092786
0.27906976744186046
0.046153846153846156
0.05555555555555555
0.0958904109589041
0.07777777777777778
0.08928571428571429
0.1232876712328767
0.07142857142857142
0.0660377358490566
0.09259259259259259
0.05263157894736842
0.09230769230769231
0.09333333333333334
0.06
0.047619047619047616
0.057692307692307696
0.0547945205479452
0.109375
0.1232876712328767
0.06593406593406594
0.05555555555555555
0.0625
0.125
0.07352941176470588
0.1038961038961039
0.10909090909090909
0.0684931506849315
0.0945945945945946
0.047619047619047616
0.0625
0.0273972602739726
0.05714285714285714
0

0.06097560975609756
0.05194805194805195
0.0945945945945946
0.10606060606060606
0.033707865168539325
0.024096385542168676
0.0821917808219178
0.041666666666666664
0.14893617021276595
0.13846153846153847
0.10344827586206896
0.12
0.0945945945945946
0.08064516129032258
0.03773584905660377
0.10666666666666667
0.060240963855421686
0.05952380952380952
0.04285714285714286
0.0759493670886076
0.07407407407407407
0.07894736842105263
0.09090909090909091
0.05747126436781609
0.07058823529411765
0.09302325581395349
0.15492957746478872
0.09333333333333334
0.07058823529411765
0.09375
0.13432835820895522
0.0625
0.06521739130434782
0.043478260869565216
0.10588235294117647
0.07547169811320754
0.1323529411764706
0.15
0.04395604395604396
0.08
0.05333333333333334
0.12162162162162163
0.1111111111111111
0.015384615384615385
0.1267605633802817
0.060240963855421686
0.11842105263157894
0.15254237288135594
0.09195402298850575
0.14754098360655737
0.14754098360655737
0.07936507936507936
0.06741573033707865
0.03191489

0.0875
0.06818181818181818
0.06944444444444445
0.078125
0.10869565217391304
0.0759493670886076
0.078125
0.05747126436781609
0.08641975308641975
0.0392156862745098
0.08695652173913043
0.06818181818181818
0.11666666666666667
0.15217391304347827
0.16981132075471697
0.07692307692307693
0.2692307692307692
0.07142857142857142
0.2
0.13559322033898305
0.13559322033898305
0.0967741935483871
0.036585365853658534
0.09523809523809523
0.06666666666666667
0.09183673469387756
0.10666666666666667
0.09090909090909091
0.08823529411764706
0.09782608695652174
0.07142857142857142
0.11428571428571428
0.07964601769911504
0.12162162162162163
0.0975609756097561
0.0891089108910891
0.10526315789473684
0.057692307692307696
0.030303030303030304
0.13636363636363635
0.041666666666666664
0.09836065573770492
0.17647058823529413
0.10714285714285714
0.15
0.0
0.13636363636363635
0.125
0.1875
0.046875
0.13793103448275862
0.04918032786885246
0.14634146341463414
0.16666666666666666
0.04460966542750929
0.06451612903225806
0.

TypeError: '<' not supported between instances of 'ExplicitBitVect' and 'ExplicitBitVect'

In [9]:
drugm = drugs[0:10]

In [None]:
# by objects

comparation_list = []
for drug in drugs:
    drug_fp = Chem.GetMorganFingerprintAsBitVect(drug, 3)
    m1_name = drug.GetProp('GENERIC_NAME')
    for drug_sec in drugs:
        m2_name = drug_sec.GetProp('GENERIC_NAME')
        if drug != drug_sec:
            if(checkIfExist(comparation_list,m1_name, m2_name) == None):
                drug_sec_fp = Chem.GetMorganFingerprintAsBitVect(drug_sec, 3)
                comparation_list.append(Comparation(m1_name, m2_name, compare(drug_fp, drug_sec_fp)))
with open(r'../ohusak/comparation.txt', 'w') as fp:
    for item in comparation_list:
        record = "{0};{1};{2}".format(item.mol1_name, item.mol2_name, item.comparation)
        fp.write("%s\n" %  record)

In [72]:
with open(r'../ohusak/comparation.txt', 'w') as fp:
    for item in comparation_list:
        record = "{0};{1};{2}".format(item.mol1_name, item.mol2_name, item.comparation)
        fp.write("%s\n" %  record)

In [66]:
len(comparation_list)
comparation_list[0].comparation

0.26865671641791045

In [10]:
class Comparation:
    def __init__(self, m1, m2, comp):
        self.mol1_name = m1
        self.mol2_name = m2
        self.comparation = comp

In [11]:
def checkIfExist(list, m1, m2):
    return next(
    (comp for comp in list if comp.mol1_name == m2 and comp.mol2_name == m1),
    None,
)

In [25]:
comparation_matrix = []
comparation_row = []
comparation_row.append("")
for drug in drugs:
    comparation_row.append(drug.GetProp('GENERIC_NAME'))
comparation_matrix.append(comparation_row)
comparation_row = []
i= 0;
for drug in drugs:
    drug_fp = Chem.GetMorganFingerprintAsBitVect(drug, 3)
    comparation_row.append(drug.GetProp('GENERIC_NAME'))
    i = i + 1
    for index in range(i):
        comparation_row.append(0)
    for drug_sec in drugm[i:]:
        drug_sec_fp = Chem.GetMorganFingerprintAsBitVect(drug_sec, 3)
        comparation_row.append(compare(drug_fp, drug_sec_fp))
    comparation_matrix.append(comparation_row)
    comparation_row = []
with open(r'../ohusak/comparation.txt', 'w', encoding='utf-8') as fp:
    for item in comparation_matrix:
        fp.write("%s\n" %  item)