代码复现遇到一些问题 #3

neo-dqy · 2023-10-19T09:25:08Z

您好，我们按readme中的步骤和论文中相同的参数设置，运行了训练和预测的代码。但在预测中，有遇到两个问题：1. 模型对所有三元组都输出True，即使对于训练集的数据也只输出True，虽然训练过程中loss一直在下降；2. 模型预测时有一个warning（A decoder-only architecture is being used, but right-padding was detected! For correct generation results, please set padding_side='left' when initializing the tokenizer.）在tokenizer中设置了padding_side='left也没有用。想问问你们有遇到这样的问题吗。

The text was updated successfully, but these errors were encountered:

Zhang-Each · 2023-10-19T12:02:18Z

关于第一个问题，可以尝试用目前更新的负样本数量更多的数据集版本，也可以自己尝试定义负样本的个数。关于第二个问题，实际推理的时候batch_size为1，因此是否进行padding对结果不影响

Zhang-Each · 2023-10-19T12:24:14Z

一般来说，只要经过训练的模型就不可能全出现true的情况，你可以检查一下你的peft库的版本以及checkpoint是否保存下来，peft库存在bug，它的某些版本无法用这套代码保存lora权重，导致模型参数实际上没有更新参数，你可以检查一下你的peft版本以及保存下来的lora权重文件大小是否为0

Zhang-Each closed this as completed Oct 19, 2023

Zhang-Each reopened this Oct 19, 2023

Zhang-Each closed this as completed Oct 19, 2023

Zhang-Each added help wanted Extra attention is needed and removed help wanted Extra attention is needed labels Dec 7, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

代码复现遇到一些问题 #3

代码复现遇到一些问题 #3

neo-dqy commented Oct 19, 2023

Zhang-Each commented Oct 19, 2023

Zhang-Each commented Oct 19, 2023

代码复现遇到一些问题 #3

代码复现遇到一些问题 #3

Comments

neo-dqy commented Oct 19, 2023

Zhang-Each commented Oct 19, 2023

Zhang-Each commented Oct 19, 2023