user_token和assistant_token有对应的明文吗？ #239

greyamber · 2023-10-26T10:26:07Z

如题，我在使用llama.cpp运行百川2 13B，发现多轮对话的分隔符在百川官方pytorch版本的demo中是直接用generation_config.json里配置好的，而不是用明文拼接后tokenizer自动生成的。
有办法不做一些额外的处理（比如改llama.cpp代码，自己增加词表映射等）来处理正确的拼接多轮对话的prompt吗？

greyamber · 2023-10-27T08:25:05Z

已经解决。分别是
<reserved_106> <reserved_107>

apepkuss · 2023-10-28T14:16:54Z

@greyamber 你好，请问是否可以给个多轮对话prompt字符串形式的例子么？多谢！

greyamber closed this as completed Oct 27, 2023

shirubei mentioned this issue Oct 28, 2023

chat模型的prompt template #227

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

user_token和assistant_token有对应的明文吗？ #239

user_token和assistant_token有对应的明文吗？ #239

greyamber commented Oct 26, 2023

greyamber commented Oct 27, 2023

apepkuss commented Oct 28, 2023

user_token和assistant_token有对应的明文吗？ #239

user_token和assistant_token有对应的明文吗？ #239

Comments

greyamber commented Oct 26, 2023

greyamber commented Oct 27, 2023

apepkuss commented Oct 28, 2023