-
Notifications
You must be signed in to change notification settings - Fork 5k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
1. 修改stream_chat的接口,在请求体中选择knowledge_base_id;2. 增加stream_chat_bing接口;3. 增加了调用流式接口的方法说明;4. 优化cli_demo.py的逻辑:支持 输入提示;多输入;重新输入 #630
Conversation
只需更新下git是吧,大佬 |
要等review&merge以后才行,你如果只想测试这个功能可以clone我fork下的dev分支,但我的分支跟owner的分支是有冲突的,最好还是等merge以后再测试吧 |
安排安排!感谢提交PR,这两天会尽快完成测试和merge。 |
刚刚被我误close了--! |
你好,我看我的PR还没有指定reviewer,是不准备引入这些特性了吗?如果是的话,我就close这个PR,因为我还有新的PR想要提交,但是跟这些特性不适合一起提交。 |
不好意思哈,最近处理速度稍微有点慢,这个是我自己来做审核的所以没分配,这两天我会尽快完成处理。如果有新功能,建议新建分支提交,基于dev分支修改,并提交至dev分支,再次感谢🙏 |
明白,维护这样一个特性丰富的项目确实比较麻烦,加油! |
为什么用streat_chat会出现某些情况下一直重复输出结果 |
如果是用cpu加载量化版本的模型,是会出现这样的问题,解决办法就是cpu和量化只选一个 |
我是GPU,而且加载的是非量化版本的模型 chatglm-6b |
在少数情况下,模型会出现推理失败的情况,但尝试不同的query或重新加载模型会解决。但如果无论重启模型还是更换prompt都是一直都重复,那就还是环境配错了,需要检查下载的包、系统、CUDA版本等是不是与标准配置一致 |
@soultrans 目前的开发者没有这个计划,这需要参考chatglm的model.py写chat和stream_chat,如果你有兴趣,欢迎提PR |
优化了[FEATURE][FEATURE] bing搜索问答有流式的API么? #617,增加了api.py的stream_chat_bing接口;
优化了api.py的stream_chat的接口,更改为在请求体中选择knowledge_base_id,从而无需两次指定knowledge_base_id;
在api.py里增加了如何调用stream_chat和steam_chat_bing的方法:
如果想测试websocket的流式问答,需要使用支持websocket的测试工具,如postman,insomnia
强烈推荐开源的insomnia,使用insomnia调用的方式如下:
在测试时选择new websocket request,并将url的协议改为ws,如ws://localhost:7861/local_doc_qa/stream_chat_bing
优化了cli_demo.py的逻辑:
4.1 增加了输入提示;
4.2 支持多个文件输入;
4.3 支持文件输入错误有再次输入,而非直接因报错而退出;
4.4 支持部分文件因路径错误而未加载成功后,可选再次加载。