作者您好,我在trinity/algorithm/sample_strategy/mix_sample_strategy.py里面把grpo prompt和sft prompt都print出来,发现grpo的prompt都有<|im_start|>system\nxxx<|im_end|><|im_start|>user\nxxx<|im_end|>\n<|im_start|>assistant\n,但是sft prompt里面没有这些<|im_start|>特殊token,就只有纯question。请问这对训练有影响吗?谢谢!