Skip to content

[Question]: 微调之后的UIE结果输出 #10420

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
Chinesejunzai opened this issue Apr 16, 2025 · 1 comment
Open

[Question]: 微调之后的UIE结果输出 #10420

Chinesejunzai opened this issue Apr 16, 2025 · 1 comment
Assignees
Labels
question Further information is requested

Comments

@Chinesejunzai
Copy link

请提出你的问题

微调之后的UIE, 可以一次性输出想要的实体词么

@Chinesejunzai Chinesejunzai added the question Further information is requested label Apr 16, 2025
@Chinesejunzai
Copy link
Author

这个是prompt
['<|im_start|>system\nYou are Qwen, created by Alibaba Cloud. You are a helpful assistant.<|im_end|>\n<|im_start|>user\n\n你是一个阅读理解专家,请提取所给句子与问题,提取实体。请注意,如果存在实体,则一定在原句中逐字出现,请输出对应实体的原文,不要进行额外修改;如果无法提取,请输出“无相应实体”。\n 句子开始\n 不倒翁泡菜拉面油炸方便面120g*5\n 句子结束\n 问题开始\n 集团, 品牌, 规格, 口味, 肉种, 多包装, 包装类型, 加工方式, 地域特色风味, 食用方式\n 问题结束\n 回答开始\n <|im_end|>\n<|im_start|>assistant\n', '<|im_start|>system\nYou are Qwen, created by Alibaba Cloud. You are a helpful assistant.<|im_end|>\n<|im_start|>user\n\n你是一个阅读理解专家,请提取所给句子与问题,提取实体。请注意,如果存在实体,则一定在原句中逐字出现,请输出对应实体的原文,不要进行额外修改;如果无法提取,请输出“无相应实体”。\n 句子开始\n 康师傅茶的传人无糖普洱茶500ml\n 句子结束\n 问题开始\n 集团, 品牌, 规格, 口味, 水果口味, 包装, 制作工艺, 含糖情况, 茶种, 复合口味\n 问题结束\n 回答开始\n <|im_end|>\n<|im_start|>assistant\n', '<|im_start|>system\nYou are Qwen, created by Alibaba Cloud. You are a helpful assistant.<|im_end|>\n<|im_start|>user\n\n你是一个阅读理解专家,请提取所给句子与问题,提取实体。请注意,如果存在实体,则一定在原句中逐字出现,请输出对应实体的原文,不要进行额外修改;如果无法提取,请输出“无相应实体”。\n 句子开始\n 奈雪的茶鸭屎香柠檬茶低糖250ml\n 句子结束\n 问题开始\n 集团, 品牌, 规格, 口味, 水果口味, 包装, 制作工艺, 含糖情况, 茶种, 复合口味\n 问题结束\n 回答开始\n <|im_end|>\n<|im_start|>assistant\n', '<|im_start|>system\nYou are Qwen, created by Alibaba Cloud. You are a helpful assistant.<|im_end|>\n<|im_start|>user\n\n你是一个阅读理解专家,请提取所给句子与问题,提取实体。请注意,如果存在实体,则一定在原句中逐字出现,请输出对应实体的原文,不要进行额外修改;如果无法提取,请输出“无相应实体”。\n 句子开始\n 小豆芽五常大米10kg\n 句子结束\n 问题开始\n 集团, 品牌, 规格, 地域特产, 米种, 形状\n 问题结束\n 回答开始\n <|im_end|>\n<|im_start|>assistant\n']

训练完成之后, 用训练模型进行抽取, 给出的结果为:

Sentence: 不倒翁泡菜拉面油炸方便面120g*5
Prompt: 集团, 品牌, 规格, 口味, 肉种, 多包装, 包装类型, 加工方式, 地域特色风味, 食用方式
Result: 无相应实体

Sentence: 康师傅茶的传人无糖普洱茶500ml
Prompt: 集团, 品牌, 规格, 口味, 水果口味, 包装, 制作工艺, 含糖情况, 茶种, 复合口味
Result: 无相应实体

Sentence: 奈雪的茶鸭屎香柠檬茶低糖250ml
Prompt: 集团, 品牌, 规格, 口味, 水果口味, 包装, 制作工艺, 含糖情况, 茶种, 复合口味
Result: 无相应实体

Sentence: 小豆芽五常大米10kg
Prompt: 集团, 品牌, 规格, 地域特产, 米种, 形状
Result: 无相应实体

但是将prompt中的实体分开提问就能提取出来, 那么如何给定上面全部的schema, 然后一次性输出想要的内容, 是需要训练的时候指定格式, 还是怎么处理

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested
Projects
None yet
Development

No branches or pull requests

2 participants