From aeedfef5cff87dd9f1bad7acd7d37adb9f467d05 Mon Sep 17 00:00:00 2001 From: juice094 <160722440+juice094@users.noreply.github.com> Date: Wed, 13 May 2026 22:48:03 +0800 Subject: [PATCH] docs(AGENTS): add World Model Strategy section MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - 架构演进方向:从静态情境编译器到动态世界模型 - 三层缺口分析(感知/世界模型/策略应对) - Spark/Flink 定位为数据工程层,非产品核心 - 两条验证路径:学术原型 + 求职映射 - 禁止事项追加:不得在主仓库引入 Spark/Flink 依赖 关联笔记: - vault/research/world-model-spark-flink-strategy.md - vault/ideas/world-model-cognition-card.md --- AGENTS.md | 47 +++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 47 insertions(+) diff --git a/AGENTS.md b/AGENTS.md index 2762cf4..cacb6f5 100644 --- a/AGENTS.md +++ b/AGENTS.md @@ -552,9 +552,56 @@ cargo metadata --format-version 1 | jq '.workspace_members' grep -rc 'crate::' src/*.rs | sort -t: -k2 -n | tail -5 ``` +## 架构演进方向:世界模型战略(World Model Strategy) + +> 该章节记录 devbase 从"静态情境编译器"向"动态世界模型"演进的战略认知。 +> 完整推导见 `vault/research/world-model-spark-flink-strategy.md`,精简认知见 `vault/ideas/world-model-cognition-card.md`。 + +### 核心认知 + +devbase 的终极壁垒不是"管理仓库的工具",而是**把静态代码库编译成 AI 可推理的动态世界模型**。 + +当前 devbase 是**静态世界模型编译器**——能把代码库的"当前快照"编译成 AI 可读的符号表征(调用图、知识图谱、Agent Memory),但不具备**时间维度**和**因果维度**的建模能力。 + +### 三层缺口分析 + +| 层级 | 当前能力 | 缺口 | 研究价值 | +|:---|:---|:---|:---:| +| **感知层** | AST、Git 状态、Vault 索引 | 时序演化感知、群体协作行为 | 中 | +| **世界模型层** | 调用图、知识图谱、向量空间 | 动态转移预测、因果结构、反事实推演 | **高** | +| **策略应对层** | 预设 Workflow 规则 | 自动规划、风险预测、基于模型的决策 | **高** | + +### 关键决策原则 + +1. **产品核心**:坚持 Local-first、Rust-native、zero ML runtime。世界模型训练可在云端,**推理必须下沉到本地**。 +2. **技术选型**:Spark/Flink 是可替换的数据工程管道,不是竞争壁垒。 +3. **差异化**:静态→动态的世界模型升级,是学术+工程的双重壁垒。 + +### Spark/Flink 定位 + +从世界模型视角,Spark/Flink 仅处于**数据工程层**: +- **Spark**:批量构建全局代码演化图谱、分布式因果发现(变量 > 10k 时有用) +- **Flink**:实时事件处理、多开发者世界模型同步 + +在单机/小团队场景下,两者均可用 `rayon` + `tokio` + `SQLite WAL` 替代。真正的研究核心在于**时序图神经网络、因果发现、世界模型压缩**,而非分布式框架本身。 + +### 两条验证路径 + +| 路径 | 形式 | 产出 | 与主仓库关系 | +|:---|:---|:---|:---| +| **学术原型** | 独立仓库 `devbase-worldmodel-research` | ICSE/FSE/NeurIPS Workshop 论文 | 复用 devbase AST 逻辑做数据预处理,模型通过 MCP 接入 | +| **求职映射** | 简历话语 | "基于 Spark/Flink 构建代码知识图谱的动态演化分析系统" | 实际支撑:devbase 符号提取 + 独立研究仓库分布式训练 | + +### 待验证假设 + +- [ ] 时序图神经网络能否预测模块缺陷爆发时间窗口? +- [ ] 因果发现算法能否从 git history 提取可靠的干预建议? +- [ ] 世界模型压缩后,本地推理延迟能否控制在 < 100ms? + ## 禁止事项 - 不得修改 `dev\third_party\*` 外部仓库 - 不得在没有迁移逻辑的情况下修改 registry schema - 不得引入已 deprecated 的协议 +- **不得在主仓库引入 Spark/Flink 依赖**(研究性质代码必须置于独立仓库,保持主仓库轻量) - **不得在任何源码文件中硬编码真实 token、api_key 或密码**(包括注释和测试数据)