AI Customer Service System

电商智能客服项目，基于 FastAPI + LangGraph + Vue3。
当前版本重点是“可运行的多路对话编排”：登录鉴权、SSE 流式回复、知识检索、多分支路由、附件上传与会话记忆。

1. 项目目标与当前能力

1.1 目标

支持电商客服高频场景：商品咨询、订单相关、售后政策问答。
用图编排（LangGraph）实现“分流 + 并行工具 + 最终汇总”。
在保证可用性的前提下，逐步从规则/模板演进到更强的 Agent 流程。

1.2 当前已实现能力

用户登录/JWT 鉴权
聊天（同步 POST + SSE 流式）
Supervisor 路由分流（general / additional / graphrag / image / file）
GraphRAG 子图（Guardrails、任务拆分、工具选择、Map-Reduce 汇总）
Redis 会话记忆 + MySQL 长期画像更新
文件上传接口（/api/chat/upload）
确认接口（/api/chat/confirm，兼容 action 和 confirmed）

1.3 当前未完成/占位能力

图片理解节点目前仍是占位回复；file_query 已实现低成本第一版解析
升级人工流程（escalation）有模块与字段，但主链路尚未完整接入
向量库 Milvus / ES BM25 融合是升级方向，当前知识检索以本地混合检索为主

2. 技术架构

2.1 技术栈

Frontend: Vue 3 + TypeScript + Pinia + Element Plus + Vite
Backend: FastAPI + LangGraph + LangChain
LLM: DeepSeek（deepseek-chat，通过 langchain-openai 接入）
Storage:
- Redis（会话中期记忆）
- MySQL（用户画像、会话记录）
- Neo4j structured（结构化业务图）
- Neo4j unstructured（预留）

2.2 后端模块划分

backend/app/
├─ api/
│  ├─ auth.py      # 登录、JWT校验
│  ├─ chat.py      # 对话POST/SSE、上传、确认
│  └─ health.py    # 健康检查
├─ graph/
│  ├─ main_graph.py
│  ├─ nodes/
│  │  ├─ router.py
│  │  ├─ general_chat.py
│  │  ├─ image_query.py
│  │  ├─ file_query.py
│  │  └─ hallucination.py
│  └─ subgraphs/
│     ├─ graphrag_query.py
│     └─ additional_info.py
├─ knowledge/
│  ├─ neo4j_client.py
│  ├─ schema_manager.py
│  ├─ cypher_templates.py
│  └─ knowledge_search.py
├─ memory/
│  ├─ session_manager.py
│  ├─ session_lifecycle.py
│  └─ user_profile.py
├─ models/
│  ├─ state.py
│  ├─ schemas.py
│  └─ database.py
└─ safety/
   ├─ input_sanitizer.py
   ├─ output_audit.py
   └─ escalation.py

3. LangGraph 编排与 Agent 管理机制

你关心的“Agent 怎么互相管理和协作”，核心在 Supervisor + 子图 + 共享状态。

3.1 主图（Supervisor）职责

主图入口：backend/app/graph/main_graph.py

analyze_and_route_query 负责识别意图并路由
按路由进入对应业务节点/子图
所有分支最终进入 hallucination_check
统一输出

flowchart TD
    A["START"] --> B["analyze_and_route_query"]
    B -->|general-query| C["respond_to_general_query"]
    B -->|additional-query| D["additional_query_subgraph"]
    B -->|graphrag-query| E["graphrag_query_subgraph"]
    B -->|image-query| F["create_image_query (placeholder)"]
    B -->|file-query| G["create_file_query"]
    B -->|faq-hit| H["hallucination_check"]
    C --> H
    D --> H
    E --> H
    F --> H
    G --> H
    H --> I["END"]

3.2 GraphRAG 子图（多 Agent 协作核心）

子图入口：backend/app/graph/subgraphs/graphrag_query.py

协作机制：

guardrails：先判定是否在业务范围内（不在范围直接结束）
planner：把问题拆分为任务列表 tasks
tool_selection：逐任务选择工具并通过 Send 分发
并行执行工具节点（Map）
collect_results 汇总（Reduce）
generate_answer 生成最终答复

flowchart TD
    A["START"] --> B["guardrails"]
    B -->|continue| C["planner"]
    B -->|end| Z["END"]
    C --> D["tool_selection"]
    D --> E1["cypher_query"]
    D --> E2["predefined_cypher"]
    D --> E3["graphrag_search"]
    D --> E4["vector_search"]
    E1 --> F["collect_results"]
    E2 --> F
    E3 --> F
    E4 --> F
    F --> G["generate_answer"]
    G --> Z

3.3 “管理”是如何实现的

不是多个独立进程互调，而是 LangGraph 状态机内的节点编排：

Supervisor 决定“去哪个分支”
子图内部 Planner 决定“拆成哪些任务”
Tool Selector 决定“每个任务交给哪个工具节点”
状态字段（SharedState / GraphRAGSubState）是各节点协作的共享总线
operator.add / operator.or_ reducer 负责并行结果合并

也就是说，这里的 Agent 管理是 图级调度 + 共享状态合并，不是传统多进程 Agent 框架。

4. 共享状态设计（协作协议）

状态定义：backend/app/models/state.py

4.1 主状态 `SharedState`

关键字段：

会话元数据：session_id, user_id, auth_level
历史消息：messages（add_messages reducer）
路由信息：router
执行/结果：agent_results, pending_confirmation
缓存：order_cache, product_cache
附件：config（image_path/file_path）

4.2 子图状态 `GraphRAGSubState`

tasks：planner 的任务拆分结果
tool_results：并行工具输出，按 operator.add 聚合
final_answer：最终生成结果

这个状态模型就是 Agent 间“契约”。

5. 会话记忆与生命周期

5.1 Redis 中期记忆

backend/app/memory/session_manager.py：

保存会话消息列表（TTL）
保存会话鉴权信息（TTL）
保存临时缓存和情绪轨迹（TTL）

5.2 MySQL 长期记忆

backend/app/memory/session_lifecycle.py：

每轮对话后异步触发 post_session_process
LLM 生成会话摘要与满意度分析
写入 ChatSession
更新 UserProfile（偏好类目、投诉计数、最近摘要等）

6. API 契约（当前真实实现）

6.1 鉴权

POST /api/auth/login
POST /api/auth/register（开发用途）

6.2 对话

POST /api/chat
GET /api/chat/stream?message=...&session_id=...&token=...

SSE 事件类型（data.event）：

session
thinking
status
token
message
error
done

6.3 上传

POST /api/chat/upload
支持扩展名：.png .jpg .jpeg .webp .pdf .docx .xlsx .csv .txt
10MB 限制
返回：url + image_path/file_path

6.4 确认

POST /api/chat/confirm
兼容两种请求：
- 新协议：{ session_id, operation_id, action: "confirm"|"cancel" }
- 旧协议：{ session_id, confirmed: true|false }

7. 前端到后端的完整请求生命周期

sequenceDiagram
    participant U as User
    participant FE as Vue Frontend
    participant API as FastAPI /api/chat
    participant G as LangGraph
    participant T as Tool Nodes
    participant M as Redis/MySQL

    U->>FE: 输入消息/上传附件
    FE->>API: /chat 或 /chat/stream
    API->>M: 读取历史消息、初始化会话
    API->>G: 提交初始状态
    G->>G: 路由到主分支/子图
    G->>T: 并行工具查询（可选）
    T-->>G: 工具结果
    G-->>API: 最终消息
    API->>M: 写入AI消息 + 异步生命周期处理
    API-->>FE: 同步回复 或 SSE token流
    FE-->>U: 展示结果

8. 部署与运行

8.1 启动基础服务

docker compose up -d

端口映射：

Redis: 6379
MySQL: 3306
Neo4j structured: 7474/7687
Neo4j unstructured: 7475/7688
Elasticsearch: 9200

8.2 后端环境

conda create -n aics python=3.11 -y
conda activate aics
cd backend
pip install -r requirements.txt

8.3 初始化数据

cd ..
python scripts/init_mysql.py
python scripts/import_neo4j.py

8.4 启动服务

后端：

cd backend
python -m uvicorn app.main:app --reload --port 8000

前端：

cd frontend
npm install
npm run dev

9. 配置与环境变量

以根目录 .env.example 为准，最关键项：

DEEPSEEK_API_KEY
MYSQL_PASSWORD
MYSQL_DATABASE
NEO4J_STRUCTURED_PASSWORD
NEO4J_UNSTRUCTURED_PASSWORD
JWT_SECRET_KEY

10. 依赖（已精简后的后端）

见 backend/requirements.txt。当前保留为实际使用集：

FastAPI / Uvicorn / Pydantic
LangGraph / LangChain / langchain-openai
Neo4j / Redis / SQLAlchemy / aiomysql
sentence-transformers
PyJWT / python-multipart

11. 已知限制与后续建议

11.1 已知限制

图片分支可路由但业务逻辑仍为占位，文件分支已实现第一版解析
人工升级流程字段存在，但管理策略尚未完整接入主链路
当前缺少系统化自动化测试覆盖

11.2 建议下一步

实现 image_query 视觉模型调用
继续增强 file_query（表格结构化抽取、OCR、长文档分级摘要）
补 API 契约测试和核心图回归测试
将 escalation 接入主图状态流，形成闭环

12. 维护约定

忽略目录：frontend/node_modules/, backend/uploads/, __pycache__/
上传文件写入：backend/uploads/
若调整端口，务必同步：
- docker-compose.yml
- .env / .env.example
- 前后端启动说明

13. File Query 实现说明（2026-03-20 更新）

说明：为避免高 token 成本，file_query 已实现“本地解析 + 片段检索 + 小模型汇总”的低成本策略。

13.1 当前支持格式

.txt
.csv
.docx
.xlsx
.pdf

上传仍通过 /api/chat/upload，解析在 backend/app/graph/nodes/file_query.py 内执行。

13.2 执行流程

从 state.config.file_path 获取文件路径
校验文件存在、后缀、大小（10MB）
按文件类型做本地解析：
- txt: 文本读取
- csv: 按行读取（限行）
- docx: 段落提取
- xlsx: 按 sheet/行提取（限行）
- pdf: 按页提取（限页）
将全文分块（chunk）
用 query 关键词对 chunk 打分，挑选少量高相关片段
仅把这些片段喂给轻量模型生成回答

13.3 Token 控制策略

文件大小限制：10MB
文本长度上限：120000 字符
PDF 页数上限：20 页
CSV 行数上限：300 行
XLSX 每个 sheet 行数上限：300 行
进入模型的片段数上限：6
单片段长度上限：900 字符
使用 get_light_model(max_tokens=420) 生成答案

这意味着：不会把整份文件直接送进 LLM，token 消耗可控。

13.4 依赖项

backend/requirements.txt 已新增：

pdfplumber==0.11.7
python-docx==1.2.0
openpyxl==3.1.5

如运行环境缺失这些依赖，节点会返回“缺少解析依赖”的明确提示，不会无限重试消耗额度。

13.5 现状说明

file_query：已从占位改为可用第一版（低成本策略）
image_query：仍为占位逻辑（后续接视觉模型）

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
backend		backend
data		data
frontend		frontend
schemeDocs		schemeDocs
scripts		scripts
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
READMEformerVersion.md		READMEformerVersion.md
docker-compose.yml		docker-compose.yml

Folders and files

Latest commit

History

Repository files navigation

AI Customer Service System

1. 项目目标与当前能力

1.1 目标

1.2 当前已实现能力

1.3 当前未完成/占位能力

2. 技术架构

2.1 技术栈

2.2 后端模块划分

3. LangGraph 编排与 Agent 管理机制

3.1 主图（Supervisor）职责

3.2 GraphRAG 子图（多 Agent 协作核心）

3.3 “管理”是如何实现的

4. 共享状态设计（协作协议）

4.1 主状态 SharedState

4.2 子图状态 GraphRAGSubState

5. 会话记忆与生命周期

5.1 Redis 中期记忆

5.2 MySQL 长期记忆

6. API 契约（当前真实实现）

6.1 鉴权

6.2 对话

6.3 上传

6.4 确认

7. 前端到后端的完整请求生命周期

8. 部署与运行

8.1 启动基础服务

8.2 后端环境

8.3 初始化数据

8.4 启动服务

9. 配置与环境变量

10. 依赖（已精简后的后端）

11. 已知限制与后续建议

11.1 已知限制

11.2 建议下一步

12. 维护约定

13. File Query 实现说明（2026-03-20 更新）

13.1 当前支持格式

13.2 执行流程

13.3 Token 控制策略

13.4 依赖项

13.5 现状说明

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

4.1 主状态 `SharedState`

4.2 子图状态 `GraphRAGSubState`

Packages