LLM Monitoring

一个用于监控第三方大模型服务延迟和可用性的本地化监控面板。

项目可以定时或手动测试多个模型接口，记录首 token 时间、总耗时、成功率和历史延迟数据。当前内置智谱 AI、京东言犀以及通用 OpenAI 兼容接口适配器，适合部署在自己的服务器、NAS 或 Docker 环境中长期运行。

功能

多平台、多模型延迟监控
支持 TTFT、总耗时、成功率统计
支持手动测试单个模型、单个平台或全部模型
支持平台和模型的新增、编辑、启停、删除
支持历史记录查看
本地 SQLite 持久化，无需依赖外部数据库
可通过环境变量指定数据库文件位置，方便服务器和 Docker 挂载

技术栈

Next.js 16 App Router
React 19 + TypeScript
Tailwind CSS v4
shadcn/ui + Radix UI
Recharts
SQLite + better-sqlite3
pnpm

本地启动

安装依赖：

pnpm install

启动开发服务：

pnpm dev

默认访问：

http://localhost:5000

如果 5000 端口被占用，可以指定其他端口：

PORT=5001 pnpm dev

然后访问：

http://localhost:5001

数据库

项目默认使用 SQLite，启动时会自动创建数据库文件和数据表。

默认数据库位置：

data/llmmonitoring.db

可以通过环境变量指定数据库文件路径：

SQLITE_DATABASE_PATH=/data/llmmonitoring.db pnpm dev

也支持备用变量：

DATABASE_PATH=/data/llmmonitoring.db pnpm dev

建议部署时把数据库目录挂载到宿主机或持久化卷，例如 Docker 中挂载 /data。

常用命令

# 开发
pnpm dev

# 类型检查
pnpm ts-check

# 代码检查
pnpm lint

# 构建
pnpm build

# 生产启动
pnpm start

生产部署

直接部署到服务器时：

pnpm install
pnpm build
SQLITE_DATABASE_PATH=/data/llmmonitoring.db pnpm start

如果使用 Docker，重点是持久化 SQLite 数据库文件：

SQLITE_DATABASE_PATH=/data/llmmonitoring.db

并将容器内 /data 挂载到宿主机目录。

项目结构

src/
├── app/                         # 页面和 API 路由
│   ├── api/                     # 监控、平台、模型、历史接口
│   ├── history/[id]/            # 模型历史记录页面
│   └── page.tsx                 # 首页监控面板
├── components/
│   ├── monitoring/              # 监控业务组件
│   └── ui/                      # shadcn/ui 基础组件
├── lib/
│   └── monitoring/              # 适配器、注册表、数据库操作层
└── storage/
    └── database/                # SQLite 客户端和共享类型

主要接口

平台管理：

GET    /api/platforms
POST   /api/platforms
GET    /api/platforms/[id]
PUT    /api/platforms/[id]
DELETE /api/platforms/[id]

模型管理：

GET    /api/models
POST   /api/models
GET    /api/models/[id]
PUT    /api/models/[id]
DELETE /api/models/[id]

监控测试：

POST /api/ping
POST /api/ping/models/[id]
POST /api/ping/platforms/[id]

状态和历史：

GET /api/status
GET /api/history/[modelId]

初始化默认平台和模型：

POST /api/init

综合评估逻辑

项目内置一套面向“接口稳定性 + 模型验真”的综合评估流程。评估时会对同一个模型执行多轮真实调用，每个维度先计算 0-100 的子分，总分再取各子分的平均值。

当前主要维度包括：

连通性：看请求成功率，以及模型是否能稳定按要求返回指定短句。
身份一致：要求模型严格输出 JSON，校验字段结构是否合法，并比较多次调用时自报模型名、知识截止时间、函数调用能力是否稳定，同时检查自报模型名和接口返回的 model 字段是否对齐。
JSON 严格输出：不只判断能否 JSON.parse，还会校验返回结构和目标值是否完全命中，识别“表面像 JSON，但不够严格”的情况。
代码能力：要求模型输出结构化 JSON，其中包含可执行的 JavaScript 解法；系统会提取代码并运行隐藏测试用例，再结合复杂度声明进行评分。
长推理：以流式请求 (stream: true) 执行长回答测试，重点看关键需求覆盖度、回答结构完整性和内容深度。
同题稳定：对同一问题重复调用多次，结合成功率、输出长度稳定性和关键概念覆盖情况综合打分。

页面上的每个评估卡片会展示该维度的实际分数，同时保留成功次数、平均延迟、超时率等原始观测指标，方便区分“服务不稳”和“能力不真”。

添加新的模型平台

在 src/lib/monitoring/ 下创建新的适配器文件。
实现现有适配器接口。
在 src/lib/monitoring/registry.ts 注册适配器。
如需内置默认平台，在 src/app/api/init/route.ts 添加初始化配置。

注意事项

平台 API Key 存在本地 SQLite 数据库中，请保护好数据库文件。
SQLite 适合单机部署。如果未来需要多实例并发部署，建议迁移到 PostgreSQL。
当前项目使用 pnpm，preinstall 会阻止 npm/yarn 安装。

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
public		public
scripts		scripts
src		src
.gitignore		.gitignore
.npmrc		.npmrc
AGENTS.md		AGENTS.md
README.md		README.md
components.json		components.json
eslint.config.mjs		eslint.config.mjs
next-env.d.ts		next-env.d.ts
next.config.ts		next.config.ts
package.json		package.json
pnpm-lock.yaml		pnpm-lock.yaml
postcss.config.mjs		postcss.config.mjs
tsconfig.json		tsconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM Monitoring

功能

技术栈

本地启动

数据库

常用命令

生产部署

项目结构

主要接口

综合评估逻辑

添加新的模型平台

注意事项

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 1

Languages

Folders and files

Latest commit

History

Repository files navigation

LLM Monitoring

功能

技术栈

本地启动

数据库

常用命令

生产部署

项目结构

主要接口

综合评估逻辑

添加新的模型平台

注意事项

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 1

Languages

Packages