Ecommerce Agent 是一个基于大语言模型的垂直电商客服智能助手系统,专门针对电商客服场景进行深度优化。项目通过 LoRA 微调、DPO 对齐和 ReAct 推理框架,构建了一个能够理解复杂业务逻辑、合规调用工具、并提供专业客服服务的智能助手。
- ReAct 框架:采用思考-行动-观察(Reasoning-Action-Observation)循环,实现多轮工具调用
- 业务逻辑深度理解:基于《垂直电商客服 Agent 逻辑全梳理》文档,掌握6大核心场景的决策树
- 合规性校验:严格遵守《工具调用合法性校验协议》,确保工具调用的合法性和安全性
- query_order - 查询订单/物流状态
- apply_refund - 处理退款/退货/换货/补发
- transfer_human - 智能转接人工客服
- update_address - 更新收货地址
- query_product_info - 查询商品信息/参数
- knowledge_retrieval - 知识/促销/政策综合检索
- 模拟工具库:包含7个核心工具函数,模拟真实电商后端API
- 参数完备性校验:严格校验必填参数,防止盲目调用
- 序列合法性验证:确保工具调用符合业务逻辑阶段顺序
基础模型 (Qwen1.5-7B-Chat)
↓
SFT 监督微调 (LoRA)
↓
DPO 直接偏好优化
↓
模型合并与部署
- LoRA 微调:使用4-bit量化,在保持模型性能的同时大幅降低显存需求
- DPO 对齐:通过偏好数据优化模型输出,提升客服话术质量
- ReAct 推理:实现多轮工具调用和复杂问题解决能力
Ecommerce_Agent/
├── data/ # 训练数据
│ ├── agent_data.jsonl # SFT训练数据
│ ├── agent_dpo_dataset.jsonl # DPO偏好数据
│ └── raw_data.jsonl # 原始数据
├── src/ # 源代码
│ ├── train.py # SFT训练脚本
│ ├── dpo_train.py # DPO训练脚本
│ └── merge.py # 模型合并脚本
├── scripts/ # 推理和测试脚本
│ ├── agent_inference.py # 单次推理演示
│ ├── agent_inference_test.py # 批量测试
│ └── agent_test_report.txt # 测试报告
├── evaluation/ # 评估系统
│ ├── 垂直电商客服 Agent 逻辑全梳理.md # 业务逻辑文档
│ ├── 工具调用合法性校验协议.md # 合规性协议
│ ├── evaluate.py # 自动评估脚本
│ ├── clean.py # 数据清洗
│ └── raw_outputs/ # 评估结果(99个测试案例)
└── README.md # 项目说明文档
** 由于存储资源限制,本项目暂不提供预训练权重。开发者可以使用本项目提供的 src/train.py,配合 Hugging Face 上的 Qwen1.5-7B 基础模型和 data 数据格式,即可复现本实验的效果。**
# 安装依赖
pip install torch transformers peft trl datasets accelerate bitsandbytes# 运行单次推理演示
python scripts/agent_inference.py
# 运行批量测试
python scripts/agent_inference_test.py# SFT 监督微调
python src/train.py
# DPO 直接偏好优化
python src/dpo_train.py
# 模型合并
python src/merge.py项目包含完整的评估体系,通过99个测试案例对比微调模型与基础模型的性能:
- 格式与规范性:是否严格遵循 Thought -> Action -> Action Input 结构
- 逻辑深度与路径正确性:是否满足"先查后动"原则和正确的分流逻辑
- 工具调用合法性:语义对齐和拦截意识
- 参数完备性与逻辑边界:必填参数校验和边界处理
评估脚本会自动生成对比报告,统计模型胜率、缺陷分布和性能提升情况。
- 先查后动:在执行任何修改操作前必须先确认订单状态
- 参数完备性:用户未提供必要信息时必须引导补充,禁止盲目调用
- 状态约束:严格遵守订单状态对操作的限制
- 安全隐私:严禁跨越用户权限,保护用户隐私
- 修改地址:必须提供新地址,且订单必须在运输中或未发货状态
- 申请退款:必须确认退款理由,且符合售后政策
- 转人工:必须先尝试知识库拦截,满足特定条件才可转接
根据测试报告,微调后的模型在以下方面表现优异:
- 逻辑推理能力:能够理解复杂业务场景,做出合理决策
- 工具调用合规性:严格遵守工具调用协议,避免非法调用
- 客服话术质量:输出亲和、专业的客服回复
- 边界处理能力:正确处理异常情况和边界条件
- 电商平台客服系统:作为智能客服助手,处理常见咨询
- 客服培训工具:展示标准客服流程和话术
- 业务逻辑验证:测试和验证客服业务规则的完整性
- AI研究平台:研究大语言模型在垂直领域的应用
- 工具扩展:集成更多真实电商API,支持更复杂的业务场景
- 多模态支持:增加图片识别和处理能力
- 实时学习:支持在线学习和模型更新
- 多语言支持:扩展支持多语言客服场景
欢迎提交 Issue 和 Pull Request 来改进项目。在提交代码前,请确保:
- 代码符合项目编码规范
- 添加相应的测试用例
- 更新相关文档
感谢以下开源项目和技术:
- Qwen - 基础语言模型
- Hugging Face Transformers - 模型训练框架
- PEFT - 参数高效微调
- TRL - 强化学习训练库
项目状态:🚀 活跃开发中
最后更新:2026年3月