AI WorkBench

面向运维工程师的 AI 驱动智能运维平台

##还会持续更新，功能未完全实现，大家可以加群一起讨论一下实现方法，欢迎来抓虫~，加我进交流群，欢迎提Issues

什么是 AI WorkBench

AI WorkBench 是一个全栈 AIOps 平台，将 LLM 推理能力与结构化工作流引擎结合，实现从告警接入到智能诊断、知识沉淀的全链路闭环。

核心理念：LLM 负责理解和推理，代码负责精确计算，工作流负责编排协调。

核心能力

能力	说明
智能诊断	结构化推理引擎（假设→证据→验证循环），不是让 LLM 猜
工作流编排	Go 原生 DAG 引擎，20 种节点类型，30 个内置工作流（5 类）
Prompt 外化	全部 LLM 节点 system_prompt 外化到 `api/assets/prompts/*.txt`，可独立迭代
混合搜索	BM25 + 向量搜索 + RRF 融合 + Reranker 四层检索
时序分析	CUSUM 突变检测 + 趋势回归 + 异常评分 + 周期性检测
告警闭环	多源接入 → 风暴抑制 → 智能路由 → 自动诊断 → 知识沉淀
知识沉淀	案例库 + Runbook + 文档管理，诊断完成自动归档
监控集成	Prometheus 指标扫描 → AI 自动适配 → 标准名映射

技术栈

后端    Go 1.21 + Gin          前端    Vue 3.5 + Vite 5 + Element Plus
数据库  MySQL 8                 缓存    Redis（可选，内存 fallback）
监控    Prometheus              搜索    BM25 + 向量(DashScope/OpenAI兼容)
沙箱    goja (JS)               分词    go-ego/gse

快速开始

环境要求

Go 1.21+
Node.js 18+
MySQL 8（必须，自动建表）
Redis（可选）
Prometheus（可选）

1. 克隆项目

git clone https://github.com/17ovo17/AI-WorkBench.git
cd AI-WorkBench

2. 配置后端

cd api
cp config.yaml.example config.yaml
# 编辑 config.yaml，填入 MySQL 连接信息
# AI 模型、Embedding、数据源等在前端界面配置

3. 启动后端

go mod tidy
go run main.go
# 服务监听 http://localhost:8080

4. 启动前端

cd ../web
npm install
npm run dev
# 前端监听 http://localhost:3000

5. 访问平台

打开浏览器访问 http://localhost:3000，进入「AI 模型」页面配置你的 LLM API Key。

项目结构

AI-WorkBench/
├── api/                          # Go 后端
│   ├── main.go                   # 入口（143 个 API 端点）
│   ├── config.yaml.example       # 配置模板
│   └── internal/
│       ├── handler/              # HTTP 处理层
│       ├── store/                # 数据持久层（MySQL + 内存 fallback）
│       ├── model/                # 数据模型
│       ├── workflow/             # 工作流引擎
│       │   ├── engine/           # DAG 核心 + 20 种节点
│       │   │   └── builtin/      # 内置工作流 YAML
│       │   └── node/             # 节点实现
│       ├── reasoning/            # 结构化推理引擎
│       ├── timeseries/           # 时序分析引擎
│       ├── embedding/            # 混合搜索引擎
│       ├── knowledge/            # 知识库管理
│       ├── correlator/           # 跨数据源关联
│       ├── eventbus/             # 事件总线
│       ├── middleware/           # 熔断器 + 限流
│       ├── scheduler/            # 定时调度
│       └── security/             # 安全机制
├── web/                          # Vue 3 前端
│   └── src/
│       ├── views/                # 10 个页面
│       └── components/           # 可复用组件
├── docker/                       # Docker + Prometheus 配置
├── scripts/                      # 启停脚本
└── docs/                         # 项目文档

工作流引擎

Go 原生实现的 DAG 工作流引擎，零外部依赖。

20 种节点类型

类型	作用
`start` / `end`	工作流入口和出口
`llm`	调用大模型推理
`knowledge_retrieval`	知识库混合搜索
`http_request`	HTTP 请求
`code`	JavaScript 沙箱执行
`condition`	条件分支（支持 in/starts_with/regex 等）
`loop` / `iteration`	循环和迭代
`sub_workflow`	子工作流编排
`human_input`	暂停等待用户输入
`agent`	LLM + 工具自主循环
`tool`	工具调用
`template_transform`	模板渲染
`variable_aggregator` / `variable_assigner`	变量操作
`parameter_extractor` / `question_classifier`	LLM 提取/分类
`list_filter` / `document_extractor`	数据处理

30 个内置工作流（5 类）

分类	数量	代表工作流
诊断	10	diagnosis / smart_diagnosis / alert_diagnosis / domain_diagnosis / container_diagnosis / jvm_diagnosis / db_lock_analysis / slow_query_diagnosis / log_analysis / incident_postmortem
巡检	7	health_inspection / business_inspection / dependency_health / storage_health_check / middleware_inspection / network_check / incident_review
分析	6	metrics_insight / metrics_analysis / capacity_forecast / slo_compliance / traffic_anomaly_detect / incident_timeline
安全	4	security_compliance / security_audit / ssl_audit / config_drift_detect
操作	3	runbook_execute / change_rollback / knowledge_enrich

📘 详细流程图：每个工作流的节点流向、数据流表、LLM 角色定位详见 docs/architecture/工作流流程图.md（含 mermaid 图）

30 个 YAML 通过别名映射合并为 9 个对外核心工作流：smart_diagnosis / domain_diagnosis / health_inspection / metrics_insight / security_compliance / incident_review / network_check / runbook_execute / knowledge_enrich（详见系统架构全景 §4.5）。

智能路由

用户输入自然语言，系统自动选择最匹配的工作流：

"JVM Full GC 频繁"  → domain_diagnosis (domain=jvm)
"做一次全面巡检"     → health_inspection (scope=full)
"SSL 证书快过期了"   → security_compliance (audit_type=ssl)

安全机制

机制	说明
JS 沙箱	goja 运行时冻结全局对象 + 删除 eval/Function + Unicode 归一化
命令安全	L0-L4 四级分级，工作流模式 L2 降级 L1，L3/L4 拒绝
审计日志	HMAC-SHA256 签名防篡改
告警风暴	60 秒内同 IP >20 条自动抑制
LLM 并发	信号量限制 5 并发 + 熔断器
API 限流	令牌桶算法 100 req/s

API 概览

143 个 REST API 端点，按功能分组：

对话与 AI — 通用对话、Agent 对话
AIOps 智能运维 — 会话、巡检、WebSocket 实时推理
诊断 — 启动诊断、记录管理、反馈、归档
告警 — Catpaw/Alertmanager/夜莺 webhook 接入
知识库 — 案例 CRUD、文档上传、Runbook 管理、语义搜索
工作流 — CRUD、执行、SSE 流式、定时调度
拓扑 — 业务拓扑管理、AI 生成、巡检
监控 — Prometheus 集成、指标扫描、AI 适配
设置 — AI 模型、Embedding、Reranker、数据源、通知渠道

完整 API 文档见 docs/API文档.md。

前端页面

页面	功能
运维总览	仪表盘（告警/诊断/工作流/知识库统计）
智能诊断	AIOps 多轮对话 + 实时指标面板
知识中心	案例库 + Runbook + 文档管理 + 语义搜索
工作流	诊断工作流 + 工作流管理（参数化执行）
告警中心	告警列表 + 操作（确认/静默/解决）
业务拓扑	拓扑可视化 + AI 生成 + 业务巡检
AI 模型	LLM Provider 配置
系统配置	数据源 + 指标映射 + Embedding + 通知

许可证

MIT License

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI WorkBench

什么是 AI WorkBench

核心能力

技术栈

快速开始

环境要求

1. 克隆项目

2. 配置后端

3. 启动后端

4. 启动前端

5. 访问平台

项目结构

工作流引擎

20 种节点类型

30 个内置工作流（5 类）

智能路由

安全机制

API 概览

前端页面

许可证

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
api		api
docker		docker
docs		docs
scripts		scripts
web		web
.gitignore		.gitignore
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

AI WorkBench

什么是 AI WorkBench

核心能力

技术栈

快速开始

环境要求

1. 克隆项目

2. 配置后端

3. 启动后端

4. 启动前端

5. 访问平台

项目结构

工作流引擎

20 种节点类型

30 个内置工作流（5 类）

智能路由

安全机制

API 概览

前端页面

许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages