Checklist / 检查清单
Bug Description / Bug 描述
背景:对于多轮对话数据,assistant是可以通过loss=true/false自定义是否学习,但是tool_call这样设置却没有生效。 (1)tool_call本质上也是assistant的内容 (2)agentic多轮学习中,非常需要屏蔽指定轮的assistant或者tool_call 。例如只需要学习回复范式时需要设置tool_call不学习的场景
How to Reproduce / 如何复现
目前现状:对于tool_call角色,loss配置是不生效的。

Additional Information / 补充信息
No response
Checklist / 检查清单
Bug Description / Bug 描述
背景:对于多轮对话数据,assistant是可以通过loss=true/false自定义是否学习,但是tool_call这样设置却没有生效。 (1)tool_call本质上也是assistant的内容 (2)agentic多轮学习中,非常需要屏蔽指定轮的assistant或者tool_call 。例如只需要学习回复范式时需要设置tool_call不学习的场景
How to Reproduce / 如何复现
目前现状:对于tool_call角色,loss配置是不生效的。

Additional Information / 补充信息
No response