New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
SIGN算法的数据预处理错误 #141
Comments
更新一下,我修正这些问题之后的结果是 |
感谢指出的问题。
bond_graph_base[range(num_bonds), [indices.index([x[1],x[0]]) for x in indices]] = 0 我们会在近期同步修正以上问题后的代码~ |
好的,我试下去掉自邻边看看,这样做除了减少计算量,有什么其它好处吗? PS. 提两个小的建议,可以加速数据预处理
我采用了这两个策略后,平均每个样本的处理耗时0.1S左右 |
这里是类似于atom graph里去掉self-loop,主要目的还是让模型学习每个target atom/bond的周围邻居的空间分布。或者单独再划分一个domain来加入这种『自邻边』也是可以的,我们之后也准备进一步尝试一下不同的策略。 特别感谢提出的一系列建议👍🏻 |
setxor错误:举例输入 setxor(a=[1, 0], b=[0, 2]),将会得到 [0, 1, 0, 2], [], 实际上按照bond_graph_base的生成方式,只需要取a[0]和 b[1]即可
PaddleHelix/apps/drug_target_interaction/sign/dataset.py
Line 149 in e5578f7
这里输出的atoms使用的是atom在特征矩阵的维度, 与后面的atom_type不符, 提供的处理好的数据是没有问题的(https://www.dropbox.com/sh/68vc7j5cvqo4p39/AAB_96TpzJWXw6N0zxHdsppEa)
PaddleHelix/apps/drug_target_interaction/sign/preprocess_pdbbind.py
Line 280 in e5578f7
存在疑惑的地方:
3. 如果 a边:[0, 1 ], b边[1, 0], 则c边为[0, 0], 如果取dist_mat[0, 0],则c边长度为inf,计算可得夹角为180度(encode为5)但按照其它的边的夹角构造方式,则夹角应该为0度(encode为0)
PaddleHelix/apps/drug_target_interaction/sign/dataset.py
Line 152 in e5578f7
The text was updated successfully, but these errors were encountered: