Skip to content

Inceton/Ecommerce-Agent

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Ecommerce Agent - 垂直电商客服智能助手

项目概述

Ecommerce Agent 是一个基于大语言模型的垂直电商客服智能助手系统,专门针对电商客服场景进行深度优化。项目通过 LoRA 微调、DPO 对齐和 ReAct 推理框架,构建了一个能够理解复杂业务逻辑、合规调用工具、并提供专业客服服务的智能助手。

核心特性

🚀 智能推理能力

  • ReAct 框架:采用思考-行动-观察(Reasoning-Action-Observation)循环,实现多轮工具调用
  • 业务逻辑深度理解:基于《垂直电商客服 Agent 逻辑全梳理》文档,掌握6大核心场景的决策树
  • 合规性校验:严格遵守《工具调用合法性校验协议》,确保工具调用的合法性和安全性

🔧 六大核心场景

  1. query_order - 查询订单/物流状态
  2. apply_refund - 处理退款/退货/换货/补发
  3. transfer_human - 智能转接人工客服
  4. update_address - 更新收货地址
  5. query_product_info - 查询商品信息/参数
  6. knowledge_retrieval - 知识/促销/政策综合检索

🛠️ 工具调用系统

  • 模拟工具库:包含7个核心工具函数,模拟真实电商后端API
  • 参数完备性校验:严格校验必填参数,防止盲目调用
  • 序列合法性验证:确保工具调用符合业务逻辑阶段顺序

技术架构

模型训练流程

基础模型 (Qwen1.5-7B-Chat)
    ↓
SFT 监督微调 (LoRA)
    ↓
DPO 直接偏好优化
    ↓
模型合并与部署

关键技术

  • LoRA 微调:使用4-bit量化,在保持模型性能的同时大幅降低显存需求
  • DPO 对齐:通过偏好数据优化模型输出,提升客服话术质量
  • ReAct 推理:实现多轮工具调用和复杂问题解决能力

项目结构

Ecommerce_Agent/
├── data/                    # 训练数据
│   ├── agent_data.jsonl     # SFT训练数据
│   ├── agent_dpo_dataset.jsonl  # DPO偏好数据
│   └── raw_data.jsonl       # 原始数据
├── src/                    # 源代码
│   ├── train.py           # SFT训练脚本
│   ├── dpo_train.py       # DPO训练脚本
│   └── merge.py           # 模型合并脚本
├── scripts/               # 推理和测试脚本
│   ├── agent_inference.py # 单次推理演示
│   ├── agent_inference_test.py # 批量测试
│   └── agent_test_report.txt # 测试报告
├── evaluation/            # 评估系统
│   ├── 垂直电商客服 Agent 逻辑全梳理.md  # 业务逻辑文档
│   ├── 工具调用合法性校验协议.md        # 合规性协议
│   ├── evaluate.py        # 自动评估脚本
│   ├── clean.py          # 数据清洗
│   └── raw_outputs/      # 评估结果(99个测试案例)
└── README.md             # 项目说明文档

** 由于存储资源限制,本项目暂不提供预训练权重。开发者可以使用本项目提供的 src/train.py,配合 Hugging Face 上的 Qwen1.5-7B 基础模型和 data 数据格式,即可复现本实验的效果。**

快速开始

环境准备

# 安装依赖
pip install torch transformers peft trl datasets accelerate bitsandbytes

模型推理

# 运行单次推理演示
python scripts/agent_inference.py

# 运行批量测试
python scripts/agent_inference_test.py

模型训练

# SFT 监督微调
python src/train.py

# DPO 直接偏好优化
python src/dpo_train.py

# 模型合并
python src/merge.py

评估系统

项目包含完整的评估体系,通过99个测试案例对比微调模型与基础模型的性能:

评估维度

  1. 格式与规范性:是否严格遵循 Thought -> Action -> Action Input 结构
  2. 逻辑深度与路径正确性:是否满足"先查后动"原则和正确的分流逻辑
  3. 工具调用合法性:语义对齐和拦截意识
  4. 参数完备性与逻辑边界:必填参数校验和边界处理

评估结果

评估脚本会自动生成对比报告,统计模型胜率、缺陷分布和性能提升情况。

业务逻辑规范

核心原则

  1. 先查后动:在执行任何修改操作前必须先确认订单状态
  2. 参数完备性:用户未提供必要信息时必须引导补充,禁止盲目调用
  3. 状态约束:严格遵守订单状态对操作的限制
  4. 安全隐私:严禁跨越用户权限,保护用户隐私

场景示例

  • 修改地址:必须提供新地址,且订单必须在运输中或未发货状态
  • 申请退款:必须确认退款理由,且符合售后政策
  • 转人工:必须先尝试知识库拦截,满足特定条件才可转接

性能表现

根据测试报告,微调后的模型在以下方面表现优异:

  1. 逻辑推理能力:能够理解复杂业务场景,做出合理决策
  2. 工具调用合规性:严格遵守工具调用协议,避免非法调用
  3. 客服话术质量:输出亲和、专业的客服回复
  4. 边界处理能力:正确处理异常情况和边界条件

应用场景

  • 电商平台客服系统:作为智能客服助手,处理常见咨询
  • 客服培训工具:展示标准客服流程和话术
  • 业务逻辑验证:测试和验证客服业务规则的完整性
  • AI研究平台:研究大语言模型在垂直领域的应用

未来规划

  1. 工具扩展:集成更多真实电商API,支持更复杂的业务场景
  2. 多模态支持:增加图片识别和处理能力
  3. 实时学习:支持在线学习和模型更新
  4. 多语言支持:扩展支持多语言客服场景

贡献指南

欢迎提交 Issue 和 Pull Request 来改进项目。在提交代码前,请确保:

  1. 代码符合项目编码规范
  2. 添加相应的测试用例
  3. 更新相关文档

致谢

感谢以下开源项目和技术:


项目状态:🚀 活跃开发中

最后更新:2026年3月

About

Ecommerce Agent 是一个基于大语言模型的垂直电商客服智能助手系统,专门针对电商客服场景进行深度优化。项目通过 LoRA 微调、DPO 对齐和 ReAct 推理框架,构建了一个能够理解复杂业务逻辑、合规调用工具、并提供专业客服服务的智能助手。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages