-
Notifications
You must be signed in to change notification settings - Fork 95
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
tplinker训练acc上不去 #24
Comments
你是采用GPU还是CPU?我使用nyt数据集用tplinker训练了20多轮就能达到97%左右,但f值是90%左右。如果你使用CPU,你确认 是epoch而不是batch,因为CPU训练一个epoch都很慢。 |
用的是gpu,您的训练参数和训练日志能发给我一份参考么?可以的话发我邮箱enbacoo@126.com,谢谢~ |
@enbacoo nyt的话一般10个epoch以后f1就上90了,你可以看看是不是学习率的问题,建议按readme里提供的参数进行设置。tplinker_plus的实体和关系都标在一个矩阵里,进行的是多分类,所以只有一个t_sample_acc。 |
这边是训练参数 |
@enbacoo batch_size设太大了,收敛慢是正常的,而且你设大了batch_size没有修改loss_weight_recover_steps,这个参数会让模型在前12000步主要关注entity的训练,在12000内逐渐恢复平衡的权重,rel才能逐渐得到训练。要么把batch_size改回24,要么把loss_weight_recover_steps设置小一点,至于设成多少,需要你自己去试了。你也可以直接设成0,这个参数只影响收敛速度。 |
@enbacoo 这是batch_size=24的log |
嗯嗯,多谢,调整了参数的确收敛了。想问下您试过单机多卡跑么?有的话可以推荐下参数么? |
@enbacoo 这个可能需要你自行尝试了,我没试过。 |
好的~多谢多谢 |
请问TPLinker Plus有没有内含loss_weight_recover_steps这个机制呢?谢谢 |
@jarork 没有 |
大佬你好,想问一下为什么这个模型对batchsize这么敏感? |
@LimKim 所有模型增大batch size收敛都会变慢,这个模型序列长是N^2,比较稀疏,收敛本身就很慢。 |
那想问一下大佬该如何加快模型训练速度? |
想问下有训练log参考下吗?nyt数据集用tplinker训练了100个epoch,实体准确率很高,但t_head_rel_sample_acc, t_tail_rel_sample_acc始终上不去。大约多少个epoch能看到显著变化呢?另外tplinker-plus训练过程中看不到t_head_rel_sample_acc了吗?只有一个t_sample_acc
The text was updated successfully, but these errors were encountered: