Skip to content
Merged
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
47 changes: 47 additions & 0 deletions AGENTS.md
Original file line number Diff line number Diff line change
Expand Up @@ -552,9 +552,56 @@ cargo metadata --format-version 1 | jq '.workspace_members'
grep -rc 'crate::' src/*.rs | sort -t: -k2 -n | tail -5
```

## 架构演进方向:世界模型战略(World Model Strategy)

> 该章节记录 devbase 从"静态情境编译器"向"动态世界模型"演进的战略认知。
> 完整推导见 `vault/research/world-model-spark-flink-strategy.md`,精简认知见 `vault/ideas/world-model-cognition-card.md`。

### 核心认知

devbase 的终极壁垒不是"管理仓库的工具",而是**把静态代码库编译成 AI 可推理的动态世界模型**。

当前 devbase 是**静态世界模型编译器**——能把代码库的"当前快照"编译成 AI 可读的符号表征(调用图、知识图谱、Agent Memory),但不具备**时间维度**和**因果维度**的建模能力。

### 三层缺口分析

| 层级 | 当前能力 | 缺口 | 研究价值 |
|:---|:---|:---|:---:|
| **感知层** | AST、Git 状态、Vault 索引 | 时序演化感知、群体协作行为 | 中 |
| **世界模型层** | 调用图、知识图谱、向量空间 | 动态转移预测、因果结构、反事实推演 | **高** |
| **策略应对层** | 预设 Workflow 规则 | 自动规划、风险预测、基于模型的决策 | **高** |

### 关键决策原则

1. **产品核心**:坚持 Local-first、Rust-native、zero ML runtime。世界模型训练可在云端,**推理必须下沉到本地**。
2. **技术选型**:Spark/Flink 是可替换的数据工程管道,不是竞争壁垒。
3. **差异化**:静态→动态的世界模型升级,是学术+工程的双重壁垒。

### Spark/Flink 定位

从世界模型视角,Spark/Flink 仅处于**数据工程层**:
- **Spark**:批量构建全局代码演化图谱、分布式因果发现(变量 > 10k 时有用)
- **Flink**:实时事件处理、多开发者世界模型同步

在单机/小团队场景下,两者均可用 `rayon` + `tokio` + `SQLite WAL` 替代。真正的研究核心在于**时序图神经网络、因果发现、世界模型压缩**,而非分布式框架本身。

### 两条验证路径

| 路径 | 形式 | 产出 | 与主仓库关系 |
|:---|:---|:---|:---|
| **学术原型** | 独立仓库 `devbase-worldmodel-research` | ICSE/FSE/NeurIPS Workshop 论文 | 复用 devbase AST 逻辑做数据预处理,模型通过 MCP 接入 |
| **求职映射** | 简历话语 | "基于 Spark/Flink 构建代码知识图谱的动态演化分析系统" | 实际支撑:devbase 符号提取 + 独立研究仓库分布式训练 |

### 待验证假设

- [ ] 时序图神经网络能否预测模块缺陷爆发时间窗口?
- [ ] 因果发现算法能否从 git history 提取可靠的干预建议?
- [ ] 世界模型压缩后,本地推理延迟能否控制在 < 100ms?

## 禁止事项

- 不得修改 `dev\third_party\*` 外部仓库
- 不得在没有迁移逻辑的情况下修改 registry schema
- 不得引入已 deprecated 的协议
- **不得在主仓库引入 Spark/Flink 依赖**(研究性质代码必须置于独立仓库,保持主仓库轻量)
- **不得在任何源码文件中硬编码真实 token、api_key 或密码**(包括注释和测试数据)
Loading