Modular RAG MCP Server

一个可插拔、可观测的模块化 RAG（检索增强生成）服务框架，通过 MCP（Model Context Protocol）协议对外暴露工具接口，支持 Copilot / Claude 等 AI 助手直接调用

📖 目录

项目概述
分支说明
快速开始

🏗️ 项目概述

这个项目是什么

本项目将 RAG 最常见的核心环节——检索（Hybrid Search + Rerank）、多模态视觉处理（Image Captioning）、RAG 评估（Ragas + Custom）、生成（LLM Response）——以及当下热门的应用协议 MCP（Model Context Protocol） 串联为一个完整的、可运行的工程项目。

项目的一大亮点是极易适配到你自己的业务中。得益于全链路可插拔架构，你可以快速将它结合到自己已有的项目里，无论你的背景和需求如何，都能找到适合自己的使用方式。具体的使用策略会在后文谁适合用这个项目 & 怎么用中详细展开。

不只是项目，更是一整套思路

比这个项目本身更有价值的，是它背后蕴含的一整套工程化思路：

如何编写 DEV_SPEC（开发规格文档）来驱动开发
如何用 Skill 基于 Spec 自动完成代码编写
如何用 Skill 进行自动化测试、打包、环境配置
如何基于可插拔架构进行扩展（比如扩展到 Agent）

学会了思路，你可以自己做全新的项目和扩展。以上每一步的具体做法、设计思路，在笔记中都有对应的视频讲解，建议配合观看。

核心能力一览

模块	能力	说明
Ingestion Pipeline	PDF → Markdown → Chunk → Transform → Embedding → Upsert	全链路数据摄取，支持多模态图片描述（Image Captioning）
Hybrid Search	Dense (向量) + Sparse (BM25) + RRF Fusion + Rerank	粗排召回 + 精排重排的两段式检索架构
MCP Server	标准 MCP 协议暴露 Tools	`query_knowledge_hub`、`list_collections`、`get_document_summary`
Dashboard	Streamlit 六页面管理平台	系统总览 / 数据浏览 / Ingestion 管理 / 摄取追踪 / 查询追踪 / 评估面板
Evaluation	Ragas + Custom 评估体系	支持 golden test set 回归测试，拒绝"凭感觉"调优
Observability	全链路白盒化追踪	Ingestion 与 Query 两条链路的每一个中间状态透明可见
Skill 驱动全流程	从编写到测试、打包、配置一键完成	auto-coder / qa-tester / package / setup 等 Skill 覆盖完整开发生命周期（笔记中每个 Skill 的使用和设计思路均有讲解，请参考配套视频）

技术亮点

🔌 全链路可插拔架构：LLM / Embedding / Reranker / Splitter / VectorStore / Evaluator 每一个核心环节均定义了抽象接口，支持"乐高积木式"替换，通过配置文件一键切换后端，零代码修改。

🔍 混合检索 + 重排：BM25 稀疏检索解决专有名词精确匹配 + Dense Embedding 解决同义词语义匹配，RRF 融合后可选 Cross-Encoder / LLM Rerank 精排，平衡查全率与查准率。

🖼️ 多模态图像处理：采用 Image-to-Text 策略，利用 Vision LLM 自动生成图片描述并缝合进 Chunk，复用纯文本 RAG 链路即可实现"搜文字出图"。

📡 MCP 生态集成：遵循 Model Context Protocol 标准，可直接对接 GitHub Copilot、Claude Desktop 等 MCP Client，零前端开发，一次开发处处可用。

📊 可视化管理 + 自动化评估：Streamlit Dashboard 提供完整的数据管理与链路追踪能力，集成 Ragas 等评估框架，建立基于数据的迭代反馈回路。

🧪 三层测试体系：Unit / Integration / E2E 分层测试，覆盖独立模块逻辑、模块间交互、完整链路（MCP Client / Dashboard）。

🤖 Skill 驱动全流程：内置 auto-coder（自动编码）、qa-tester（自动测试）、package（清理打包）、setup（一键配置）等 Agent Skill，覆盖从代码编写到测试、打包、部署的完整开发生命周期。每个 Skill 的使用方法和设计思路在笔记的项目部分均有讲解视频，可参考学习。

📖 详细架构设计、模块说明和任务排期请参阅 DEV_SPEC.md

📂 分支说明

本项目提供三个分支，面向不同使用场景，请根据自身需求选择：

`main` — 最干净的完整代码

始终只有 1 个 commit，包含项目的最新完整代码
适合人群：
- 想要快速体验项目完整功能的同学
- 时间紧迫，想要快速拿到一个项目去面试、跳过中间开发过程的同学
- 想要直接在该项目基础上做二次扩展的同学
使用方式：克隆后直接运行 Setup Skill 即可体验

`dev` — 保留完整开发记录

代码与 main 完全一致，但保留了完整的 commit 历史
记录了从零开始逐步构建的每一步过程，包含大量中间节点
适合人群：想了解项目是如何一步步从零搭建起来的同学，可以通过 commit 历史回溯开发思路

`clean-start` — 干净起点，从零开始

仅包含工程骨架（Agent Skills + DEV_SPEC），所有任务进度清零
保留了完整的 Skill 配置，可以使用 Agent 辅助开发
适合人群：
- 时间充分、想要从头开发的同学（强烈建议）
- 想要体验完整工作流的同学：写 Spec → 拆任务 → 写代码 → 写测试 → 迭代优化
- 甚至可以基于自己的理解重新设计架构，用自己的思路实现，深度理解每一个模块
- 使用我们讲的所有对应思路（Spec 驱动开发、测试先行、可插拔架构等）来完成整个项目
核心理念：整个项目的代码编写是 让 AI 基于 DEV_SPEC 来自动完成的，你自己不需要手写代码。AI 通过 Skill 读取 Spec 中的任务定义、架构设计和接口规范，自动生成符合规格的代码。这个思路请参考笔记对应视频讲解：5.1 项目 Skills 使用：如何让 AI 使用 Skill 遵循 DEV_SPEC 完成代码。

🚀 快速开始

1. 克隆项目

git clone <repo-url>
cd Modular-RAG-MCP-Server

2. 一键配置（Setup Skill）

本项目提供了 Setup Skill 一键完成所有环境配置，包括：Provider 选择 → API Key 配置 → 依赖安装 → 配置文件生成 → Dashboard 启动。

在 VS Code 中打开项目，通过 Copilot / Claude 对话框输入：

setup

Agent 会自动引导你完成全部配置流程。

3. 手动配置与环境搭建

如果你不想使用 Setup Skill，也可以手动完成所有步骤：

3.1 安装依赖

pip install -e .
pip install -e ".[dev]"  # 包含测试依赖

3.2 配置 settings.yaml

编辑 config/settings.yaml，关键字段说明：

llm:                           # LLM 生成模型配置
  provider: "openai"           # openai / azure / ollama / gemini / qwen / deepseek
  model: "gpt-4o"
  api_key: "sk-xxx"           # 支持环境变量 ${VAR_NAME}

embedding:                     # Embedding 模型配置
  provider: "openai"           # openai / azure / ollama / qwen / local
  model: "text-embedding-3-small"
  dimensions: 1536

vector_store:                  # 向量存储
  provider: "chroma"
  persist_directory: "./data/db/chroma"
  collection_name: "knowledge_hub"

retrieval:                     # 检索参数
  dense_top_k: 20
  sparse_top_k: 20
  fusion_top_k: 10
  rrf_k: 60

rerank:                        # 重排序
  enabled: true
  provider: "llm"              # llm / cross_encoder / none
  top_k: 5

evaluation:                    # 评估
  enabled: false
  provider: "custom"           # custom / ragas
  metrics: ["hit_rate", "mrr"]

observability:                 # 可观测性
  log_level: "INFO"
  trace_enabled: true
  trace_file: "./logs/traces.jsonl"

ingestion:                     # 数据摄取
  chunk_size: 1000
  chunk_overlap: 200
  splitter: "recursive"
  batch_size: 100

4. MCP 配置示例

将 MCP Server 接入 AI 工具，只需在对应工具的配置文件中添加本项目：

GitHub Copilot (VS Code)

在你的项目根目录创建 .vscode/mcp.json：

{
  "servers": {
    "modular-rag": {
      "type": "stdio",
      "command": "python",
      "args": ["-m", "mcp_server.server"],
      "cwd": "${workspaceFolder}",
      "env": {
        "PYTHONPATH": "${workspaceFolder}/src"
      }
    }
  }
}

Claude Desktop

编辑 claude_desktop_config.json（通常在 %APPDATA%\Claude\ 或 ~/Library/Application Support/Claude/）：

{
  "mcpServers": {
    "modular-rag": {
      "command": "python",
      "args": ["-m", "mcp_server.server"],
      "cwd": "D:/MODULAR-RAG-MCP-SERVER",
      "env": {
        "PYTHONPATH": "D:/MODULAR-RAG-MCP-SERVER/src"
      }
    }
  }
}

配置后重启对应工具，即可在对话中调用 query_knowledge_hub、list_collections、get_document_summary 三个 MCP Tool。

5. Dashboard 使用指南

启动命令

# 方式一：使用启动脚本
python scripts/start_dashboard.py

# 方式二：直接启动
PYTHONPATH=src streamlit run src/observability/dashboard/app.py

默认访问 http://localhost:8501。

六大页面功能

页面	功能
System Overview	展示所有组件配置卡片（LLM / Embedding / VectorStore / Retrieval / Reranker / Evaluation），实时数据统计（Chroma 条目数、BM25 文档数、图片数）
Data Browser	浏览已摄入文档列表（支持集合筛选），展开查看 Chunk 详情（文本内容、Metadata），预览关联图片
Ingestion Manager	上传文件（PDF / TXT / MD 等）触发摄取，实时进度条展示各阶段进度，支持 Force Re-ingest 和跨存储协调删除
Ingestion Traces	摄取历史列表，阶段耗时瀑布图（Bar Chart），展示 load / split / transform / encode / upsert 各环节耗时
Query Traces	查询历史列表（支持关键词搜索），Dense vs Sparse 结果数对比，Rerank 前后排名变化分析
Evaluation	选择评估后端（Custom / Ragas）与 Golden Test Set，运行评估并展示 Hit Rate / MRR 等指标，支持历史报告查看

6. 运行测试

# 单元测试（281 个）
pytest tests/unit/ -q

# 集成测试（需要 ChromaDB + 本地依赖）
pytest tests/integration/ -q

# E2E 测试（全链路）
pytest tests/e2e/ -q

# 全部测试
pytest tests/ -q

# 跳过 LLM 依赖的测试
pytest tests/ -q -m "not slow"

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
.agents/skills		.agents/skills
.claude		.claude
.github/skills		.github/skills
config		config
docs		docs
scripts		scripts
src		src
tests		tests
.gitignore		.gitignore
.mcp.json		.mcp.json
DEV_SPEC.md		DEV_SPEC.md
README.md		README.md
main.py		main.py
pyproject.toml		pyproject.toml
run_dashboard.py		run_dashboard.py
start_mcp_server.py		start_mcp_server.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Modular RAG MCP Server

📖 目录

🏗️ 项目概述

这个项目是什么

不只是项目，更是一整套思路

核心能力一览

技术亮点

📂 分支说明

`main` — 最干净的完整代码

`dev` — 保留完整开发记录

`clean-start` — 干净起点，从零开始

🚀 快速开始

1. 克隆项目

2. 一键配置（Setup Skill）

3. 手动配置与环境搭建

3.1 安装依赖

3.2 配置 settings.yaml

4. MCP 配置示例

GitHub Copilot (VS Code)

Claude Desktop

5. Dashboard 使用指南

启动命令

六大页面功能

6. 运行测试

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Modular RAG MCP Server

📖 目录

🏗️ 项目概述

这个项目是什么

不只是项目，更是一整套思路

核心能力一览

技术亮点

📂 分支说明

main — 最干净的完整代码

dev — 保留完整开发记录

clean-start — 干净起点，从零开始

🚀 快速开始

1. 克隆项目

2. 一键配置（Setup Skill）

3. 手动配置与环境搭建

3.1 安装依赖

3.2 配置 settings.yaml

4. MCP 配置示例

GitHub Copilot (VS Code)

Claude Desktop

5. Dashboard 使用指南

启动命令

六大页面功能

6. 运行测试

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`main` — 最干净的完整代码

`dev` — 保留完整开发记录

`clean-start` — 干净起点，从零开始

Packages