LightNER在中文小样本实验 #127

kevinuserdd · 2022-07-18T02:23:44Z

请问作者有在中文数据集上做过few shot试验么？目前我采用msra数据集训练，最高f值只有0.75；我看论文里在英文数据集conll上面可以达到0.9；另外，我在小样本数据集上，20-shot的f值只有0.3；在500-shot的f值甚至也没有比20-shot的0.3更好；请教下，中文数据集下的指标是会有这么大差距么

flow3rdown · 2022-07-18T02:34:20Z

LightNER暂未在中文数据集上做过实验，建议您调一下batch size和learning rate，few-shot场景对这两个参数会比较敏感，全量场景可以试下不冻结bart，此外还可以试下将learn_weights设置为False

kevinuserdd · 2022-07-18T03:16:32Z

LightNER暂未在中文数据集上做过实验，建议您调一下batch size和learning rate，few-shot场景对这两个参数会比较敏感，全量场景可以试下不冻结bart，此外还可以试下将learn_weights设置为False
您说的是yaml文件中的freeze_plm 和learn_weights参数设置成False试试么？

flow3rdown · 2022-07-18T03:28:27Z

LightNER暂未在中文数据集上做过实验，建议您调一下batch size和learning rate，few-shot场景对这两个参数会比较敏感，全量场景可以试下不冻结bart，此外还可以试下将learn_weights设置为False
您说的是yaml文件中的freeze_plm 和learn_weights参数设置成False试试么？

是的

kevinuserdd · 2022-07-18T07:37:07Z

一般在全量场景下，需要跑多少个迭代？在中文场景下，准确率有0.8+，但是召回率一直只有0.5不到，知道这是什么情况导致的么

flow3rdown · 2022-07-18T09:31:29Z

CONLL数据集包括12.7k条训练实例，训练了30个epoch

kevinuserdd added the question Further information is requested label Jul 18, 2022

zxlzr closed this as completed Jul 20, 2022

flow3rdown mentioned this issue Feb 28, 2024

LightNER 在 cluener数据集下F1 Score 74% #413

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LightNER在中文小样本实验 #127

LightNER在中文小样本实验 #127

kevinuserdd commented Jul 18, 2022

flow3rdown commented Jul 18, 2022

kevinuserdd commented Jul 18, 2022

flow3rdown commented Jul 18, 2022

kevinuserdd commented Jul 18, 2022

flow3rdown commented Jul 18, 2022

LightNER在中文小样本实验 #127

LightNER在中文小样本实验 #127

Comments

kevinuserdd commented Jul 18, 2022

flow3rdown commented Jul 18, 2022

kevinuserdd commented Jul 18, 2022

flow3rdown commented Jul 18, 2022

kevinuserdd commented Jul 18, 2022

flow3rdown commented Jul 18, 2022