Ecommerce Agent - 垂直电商客服智能助手

项目概述

Ecommerce Agent 是一个基于大语言模型的垂直电商客服智能助手系统，专门针对电商客服场景进行深度优化。项目通过 LoRA 微调、DPO 对齐和 ReAct 推理框架，构建了一个能够理解复杂业务逻辑、合规调用工具、并提供专业客服服务的智能助手。

核心特性

🚀 智能推理能力

ReAct 框架：采用思考-行动-观察（Reasoning-Action-Observation）循环，实现多轮工具调用
业务逻辑深度理解：基于《垂直电商客服 Agent 逻辑全梳理》文档，掌握6大核心场景的决策树
合规性校验：严格遵守《工具调用合法性校验协议》，确保工具调用的合法性和安全性

🔧 六大核心场景

query_order - 查询订单/物流状态
apply_refund - 处理退款/退货/换货/补发
transfer_human - 智能转接人工客服
update_address - 更新收货地址
query_product_info - 查询商品信息/参数
knowledge_retrieval - 知识/促销/政策综合检索

🛠️ 工具调用系统

模拟工具库：包含7个核心工具函数，模拟真实电商后端API
参数完备性校验：严格校验必填参数，防止盲目调用
序列合法性验证：确保工具调用符合业务逻辑阶段顺序

技术架构

模型训练流程

基础模型 (Qwen1.5-7B-Chat)
    ↓
SFT 监督微调 (LoRA)
    ↓
DPO 直接偏好优化
    ↓
模型合并与部署

关键技术

LoRA 微调：使用4-bit量化，在保持模型性能的同时大幅降低显存需求
DPO 对齐：通过偏好数据优化模型输出，提升客服话术质量
ReAct 推理：实现多轮工具调用和复杂问题解决能力

项目结构

Ecommerce_Agent/
├── data/                    # 训练数据
│   ├── agent_data.jsonl     # SFT训练数据
│   ├── agent_dpo_dataset.jsonl  # DPO偏好数据
│   └── raw_data.jsonl       # 原始数据
├── src/                    # 源代码
│   ├── train.py           # SFT训练脚本
│   ├── dpo_train.py       # DPO训练脚本
│   └── merge.py           # 模型合并脚本
├── scripts/               # 推理和测试脚本
│   ├── agent_inference.py # 单次推理演示
│   ├── agent_inference_test.py # 批量测试
│   └── agent_test_report.txt # 测试报告
├── evaluation/            # 评估系统
│   ├── 垂直电商客服 Agent 逻辑全梳理.md  # 业务逻辑文档
│   ├── 工具调用合法性校验协议.md        # 合规性协议
│   ├── evaluate.py        # 自动评估脚本
│   ├── clean.py          # 数据清洗
│   └── raw_outputs/      # 评估结果（99个测试案例）
└── README.md             # 项目说明文档

** 由于存储资源限制，本项目暂不提供预训练权重。开发者可以使用本项目提供的 src/train.py，配合 Hugging Face 上的 Qwen1.5-7B 基础模型和 data 数据格式，即可复现本实验的效果。**

快速开始

环境准备

# 安装依赖
pip install torch transformers peft trl datasets accelerate bitsandbytes

模型推理

# 运行单次推理演示
python scripts/agent_inference.py

# 运行批量测试
python scripts/agent_inference_test.py

模型训练

# SFT 监督微调
python src/train.py

# DPO 直接偏好优化
python src/dpo_train.py

# 模型合并
python src/merge.py

评估系统

项目包含完整的评估体系，通过99个测试案例对比微调模型与基础模型的性能：

评估维度

格式与规范性：是否严格遵循 Thought -> Action -> Action Input 结构
逻辑深度与路径正确性：是否满足"先查后动"原则和正确的分流逻辑
工具调用合法性：语义对齐和拦截意识
参数完备性与逻辑边界：必填参数校验和边界处理

评估结果

评估脚本会自动生成对比报告，统计模型胜率、缺陷分布和性能提升情况。

业务逻辑规范

核心原则

先查后动：在执行任何修改操作前必须先确认订单状态
参数完备性：用户未提供必要信息时必须引导补充，禁止盲目调用
状态约束：严格遵守订单状态对操作的限制
安全隐私：严禁跨越用户权限，保护用户隐私

场景示例

修改地址：必须提供新地址，且订单必须在运输中或未发货状态
申请退款：必须确认退款理由，且符合售后政策
转人工：必须先尝试知识库拦截，满足特定条件才可转接

性能表现

根据测试报告，微调后的模型在以下方面表现优异：

逻辑推理能力：能够理解复杂业务场景，做出合理决策
工具调用合规性：严格遵守工具调用协议，避免非法调用
客服话术质量：输出亲和、专业的客服回复
边界处理能力：正确处理异常情况和边界条件

应用场景

电商平台客服系统：作为智能客服助手，处理常见咨询
客服培训工具：展示标准客服流程和话术
业务逻辑验证：测试和验证客服业务规则的完整性
AI研究平台：研究大语言模型在垂直领域的应用

未来规划

工具扩展：集成更多真实电商API，支持更复杂的业务场景
多模态支持：增加图片识别和处理能力
实时学习：支持在线学习和模型更新
多语言支持：扩展支持多语言客服场景

贡献指南

欢迎提交 Issue 和 Pull Request 来改进项目。在提交代码前，请确保：

代码符合项目编码规范
添加相应的测试用例
更新相关文档

致谢

感谢以下开源项目和技术：

Qwen - 基础语言模型
Hugging Face Transformers - 模型训练框架
PEFT - 参数高效微调
TRL - 强化学习训练库

项目状态：🚀 活跃开发中

最后更新：2026年3月

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Ecommerce Agent - 垂直电商客服智能助手

项目概述

核心特性

🚀 智能推理能力

🔧 六大核心场景

🛠️ 工具调用系统

技术架构

模型训练流程

关键技术

项目结构

快速开始

环境准备

模型推理

模型训练

评估系统

评估维度

评估结果

业务逻辑规范

核心原则

场景示例

性能表现

应用场景

未来规划

贡献指南

致谢

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
data		data
evaluation		evaluation
scripts		scripts
src		src
.clineignore		.clineignore
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

Ecommerce Agent - 垂直电商客服智能助手

项目概述

核心特性

🚀 智能推理能力

🔧 六大核心场景

🛠️ 工具调用系统

技术架构

模型训练流程

关键技术

项目结构

快速开始

环境准备

模型推理

模型训练

评估系统

评估维度

评估结果

业务逻辑规范

核心原则

场景示例

性能表现

应用场景

未来规划

贡献指南

致谢

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages