chat模型的prompt template #227

apepkuss · 2023-10-22T09:14:09Z

请问，在使用chat模型进行多轮对话的场景下，所使用的prompt template的具体格式是怎样的？谢谢！

djsaber · 2023-10-26T05:00:09Z

可以参考模型文件中的generation_utils.py

apepkuss · 2023-10-26T05:57:20Z

@djsaber 谢谢回复！研究了generation_utils.py，但是这里面处理的数据，输入是python dict, 而输出的是tokens。是否可以提供一个字符串形式的prompt template？比如类似于 llama2-7B-chat 给出的prompt template:

<s>[INST] <<SYS>>
{{ system_prompt }}
<</SYS>>

{{ user_message }} [/INST]

djsaber · 2023-10-27T03:52:37Z

据我个人经验，百川的多轮对话用了两个特殊token表示用户和模型，这两个token在多轮对话场景下具有较强的影响：
user_token_id = 195
assistant_token_id = 196
整体prompt的组成是sys + histort + query，sys为系统信息，可为空“”，history为上下文多轮问答信息，query为当前轮用户提问，例如第n轮聊天，具体输入就是：
sys+[195]+q1+[196]+a1+[195]+q2+[196]+a2+...+[195]+qn+[196]
以上仅个人愚见，仅供参考

shirubei · 2023-10-28T11:28:22Z

据我个人经验，百川的多轮对话用了两个特殊token表示用户和模型，这两个token在多轮对话场景下具有较强的影响： user_token_id = 195 assistant_token_id = 196 整体prompt的组成是sys + histort + query，sys为系统信息，可为空“”，history为上下文多轮问答信息，query为当前轮用户提问，例如第n轮聊天，具体输入就是： sys+[195]+q1+[196]+a1+[195]+q2+[196]+a2+...+[195]+qn+[196] 以上仅个人愚见，仅供参考

请问，您上面说的195, 196是指的ascii码吗？谢谢

shirubei · 2023-10-28T13:46:39Z

#239

apepkuss · 2023-10-28T14:21:52Z

百川在hugging face上给出的models，都没有详细陈述 prompt template 的字符串形式，这其实对于直接使用模型而不是通过API调用的开发来说是很困难的。

shirubei · 2023-10-28T15:18:47Z

只能自己摸索

apepkuss · 2023-10-28T15:20:17Z

没错！

djsaber · 2023-10-29T09:21:06Z

据我个人经验，百川的多轮对话用了两个特殊token表示用户和模型，这两个token在多轮对话场景下具有较强的影响： user_token_id = 195 assistant_token_id = 196 整体prompt的组成是sys + histort + query，sys为系统信息，可为空“”，history为上下文多轮问答信息，query为当前轮用户提问，例如第n轮聊天，具体输入就是： sys+[195]+q1+[196]+a1+[195]+q2+[196]+a2+...+[195]+qn+[196] 以上仅个人愚见，仅供参考

请问，您上面说的195, 196是指的ascii码吗？谢谢

是输入模型的token的编码

shirubei · 2023-10-30T01:10:52Z

据我个人经验，百川的多轮对话用了两个特殊token表示用户和模型，这两个token在多轮对话场景下具有较强的影响： user_token_id = 195 assistant_token_id = 196 整体prompt的组成是sys + histort + query，sys为系统信息，可为空“”，history为上下文多轮问答信息，query为当前轮用户提问，例如第n轮聊天，具体输入就是： sys+[195]+q1+[196]+a1+[195]+q2+[196]+a2+...+[195]+qn+[196] 以上仅个人愚见，仅供参考

请问，您上面说的195, 196是指的ascii码吗？谢谢

是输入模型的token的编码

多谢！那如果我要判断的是否为该token的话，用的是 \u195 和 \u196 这样的形式吗

greyamber · 2023-10-30T01:16:52Z

百川通过两个保留token(token的类型是int32_t) 195和196来代表用户和模型的开始点。195对应明文(明文的类型是string)是"<reserved_106>", 196对应明文是"<reserved_107>"

所以具体格式要看是如何实现tokenizer的。
如果tokenizer支持字符串 + token_id的方式，格式是：
"""
系统prompt \n
[195] + 用户输入1 + [196] + 模型输出1 + [195] + 用户输入2 + [196] + 模型输出2 ...... + [196]
"""

如果tokenizer只支持明文的方式，格式是
"""
系统prompt \n
<reserved_106> + 用户输入1 + <reserved_107> + 模型输出1 + <reserved_106> + 用户输入2 + <reserved_107> + 模型输出2 ...... + <reserved_107>
"""

值得注意的是，使用纯明文的prompt之前，需要测试一下自己实现的tokenizer，是不是能正确的把<reserved_106>和<reserved_107>序列化成195和196这两个token。因为自己实现tokenizer（比如llama.cpp server的baichuan tokenzier），可能会做一些预处理，也可能会有一些编码上的不对齐，导致这种比较特殊的token被错误转换。

官方给出的例子使用字符串 + token_id的方式
https://modelscope.cn/models/baichuan-inc/Baichuan2-13B-Chat/file/view/master/generation_utils.py

shirubei · 2023-10-30T01:18:58Z

感谢楼上，解释非常清楚，明白了！

dalong2hongmei · 2023-12-19T07:47:21Z

百川通过两个保留token(token的类型是int32_t) 195和196来代表用户和模型的开始点。195对应明文(明文的类型是string)是"<reserved_106>", 196对应明文是"<reserved_107>"

所以具体格式要看是如何实现tokenizer的。如果tokenizer支持字符串 + token_id的方式，格式是： """ 系统prompt \n [195] + 用户输入1 + [196] + 模型输出1 + [195] + 用户输入2 + [196] + 模型输出2 ...... + [196] """

如果tokenizer只支持明文的方式，格式是 """ 系统prompt \n <reserved_106> + 用户输入1 + <reserved_107> + 模型输出1 + <reserved_106> + 用户输入2 + <reserved_107> + 模型输出2 ...... + <reserved_107> """

值得注意的是，使用纯明文的prompt之前，需要测试一下自己实现的tokenizer，是不是能正确的把<reserved_106>和<reserved_107>序列化成195和196这两个token。因为自己实现tokenizer（比如llama.cpp server的baichuan tokenzier），可能会做一些预处理，也可能会有一些编码上的不对齐，导致这种比较特殊的token被错误转换。

官方给出的例子使用字符串 + token_id的方式 https://modelscope.cn/models/baichuan-inc/Baichuan2-13B-Chat/file/view/master/generation_utils.py

感谢啊，就是要找的明文输入方式。有点疑问，看generation_utils.py的build_chat_input方法，没看到system prompt要加“/n”换行的，是我理解错了吗？

mvllwong · 2024-03-27T14:30:20Z

百川通过两个保留token(token的类型是int32_t) 195和196来代表用户和模型的开始点。195对应明文(明文的类型是string)是"<reserved_106>", 196对应明文是"<reserved_107>"
所以具体格式要看是如何实现tokenizer的。如果tokenizer支持字符串 + token_id的方式，格式是： """ 系统prompt \n [195] + 用户输入1 + [196] + 模型输出1 + [195] + 用户输入2 + [196] + 模型输出2 ...... + [196] """
如果tokenizer只支持明文的方式，格式是 """ 系统prompt \n <reserved_106> + 用户输入1 + <reserved_107> + 模型输出1 + <reserved_106> + 用户输入2 + <reserved_107> + 模型输出2 ...... + <reserved_107> """
值得注意的是，使用纯明文的prompt之前，需要测试一下自己实现的tokenizer，是不是能正确的把<reserved_106>和<reserved_107>序列化成195和196这两个token。因为自己实现tokenizer（比如llama.cpp server的baichuan tokenzier），可能会做一些预处理，也可能会有一些编码上的不对齐，导致这种比较特殊的token被错误转换。
官方给出的例子使用字符串 + token_id的方式 https://modelscope.cn/models/baichuan-inc/Baichuan2-13B-Chat/file/view/master/generation_utils.py

感谢啊，就是要找的明文输入方式。有点疑问，看generation_utils.py的build_chat_input方法，没看到system prompt要加“/n”换行的，是我理解错了吗？

他写错了，而且jinja版本也写错了

apepkuss closed this as completed Nov 9, 2023

ericg108 mentioned this issue Jan 5, 2024

[BUG]Baichuan2-13B-chat api_server 结果看起来是续写，像是base模型的结果，而不是chat ModelTC/lightllm#279

Closed

1 task

simon-mo mentioned this issue Jan 9, 2024

Add baichuan chat template jinjia file vllm-project/vllm#2390

Merged

tlopex mentioned this issue Feb 21, 2024

[Question] TVMError: Unknown conversation template mlc-ai/mlc-llm#1796

Closed

This was referenced Mar 6, 2024

No output when using Baichuan2-7B-Chat with 2k input and int4 on XPU intel-analytics/ipex-llm#10310

Closed

Fix Baichuan2 prompt format intel-analytics/ipex-llm#10334

Merged

NovTi mentioned this issue Mar 18, 2024

Inference Baichuan2-7B with 2k input, but no output intel-analytics/ipex-llm#10437

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

chat模型的prompt template #227

chat模型的prompt template #227

apepkuss commented Oct 22, 2023

djsaber commented Oct 26, 2023

apepkuss commented Oct 26, 2023

djsaber commented Oct 27, 2023

shirubei commented Oct 28, 2023 •

edited

shirubei commented Oct 28, 2023

apepkuss commented Oct 28, 2023

shirubei commented Oct 28, 2023

apepkuss commented Oct 28, 2023

djsaber commented Oct 29, 2023

shirubei commented Oct 30, 2023

greyamber commented Oct 30, 2023 •

edited

shirubei commented Oct 30, 2023

dalong2hongmei commented Dec 19, 2023

mvllwong commented Mar 27, 2024

chat模型的prompt template #227

chat模型的prompt template #227

Comments

apepkuss commented Oct 22, 2023

djsaber commented Oct 26, 2023

apepkuss commented Oct 26, 2023

djsaber commented Oct 27, 2023

shirubei commented Oct 28, 2023 • edited

shirubei commented Oct 28, 2023

apepkuss commented Oct 28, 2023

shirubei commented Oct 28, 2023

apepkuss commented Oct 28, 2023

djsaber commented Oct 29, 2023

shirubei commented Oct 30, 2023

greyamber commented Oct 30, 2023 • edited

shirubei commented Oct 30, 2023

dalong2hongmei commented Dec 19, 2023

mvllwong commented Mar 27, 2024

shirubei commented Oct 28, 2023 •

edited

greyamber commented Oct 30, 2023 •

edited