民间版中文羊驼模型 v3.2
本次以功能性更新为主,包括添加指令精调脚本、LangChain支持、基于Gradio的本地Demo等。
添加了指令精调脚本,优化实验启动流程(#322)
- 添加了指令精调代码 run_clm_sft_with_peft.py
- 优化了预训练和精调启动流程,现在可以更方便地运行实验了
- 添加了预训练启动脚本run_pt.sh和精调启动脚本run_sft.sh
- 添加了预训练notebook和指令精调notebook,可直接在jupyter-notebook或Colab中执行
- 详细使用方法请参考Wiki中的相关教程
添加了LangChain使用示例(#338)
- Chinese-Alpaca可以轻松地与LLM应用程序开发框架LangChain结合进行二次开发
- 添加了使用Chinese-Alpaca和LangChain进行 检索问答(Retrieval QA) 和 摘要生成(Summarization) 的示例
- 详细使用方法请参考Wiki中的LangChain教程
添加了基于Gradio的本地Web Demo(#300)
- 在本地浏览器中使用原生的🤗transformers进行推理,并且支持多轮对话
- 请参考wiki中的使用Transformers推理
感谢@sunyuhan19981208 贡献的PR。
其他更新
- 🤗transformers推理脚本inference_hf.py现在支持使用多GPU进行推理(#272)
- 修复了alpaca_data_zh_51k.json指令精调数据
- 修复了merge_llama_with_chinese_lora.py保存多个分块的一个问题