让 AI Agent 拥有认知、自决策、自执行、自演化。不再是工具,是你的搭档。
5 秒体验(零配置):
pip install -e . && socius verify完整流程支持 Ollama(本地免费)或 DeepSeek / Kimi / Anthropic API。
███████╗ ██████╗ ██████╗██╗██╗ ██╗███████╗
██╔════╝██╔═══██╗██╔════╝██║██║ ██║██╔════╝
███████╗██║ ██║██║ ██║██║ ██║███████╗
╚════██║██║ ██║██║ ██║██║ ██║╚════██║
███████║╚██████╔╝╚██████╗██║╚██████╔╝███████║
╚══════╝ ╚═════╝ ╚═════╝╚═╝ ╚═════╝ ╚══════╝
Your AI Work Partner · 自主认知 · 自决策 · 自执行
Socius = 认知引擎 + 决策引擎 + 执行引擎 的统一体。
它不是工具链,也不是工作流,而是一个能理解任务、能判断风险、能推进执行的 AI 工作搭档。
当下的 Agent 多停留在"工具调用层",需要人类不断盯着、提醒、决策。 缺的是一个能把"认知 → 决策 → 执行"连成闭环的伙伴,而不是被动等待指令的工具。
Socius 的目标不是替代现有框架,而是补上这一块缺失的能力: 让 AI 真正承担任务,而不是半自动的工具链。
这是一个纯粹的个人项目,没有 KPI,没有 deadline,也没有商业压力。
我只是想要一个能真正替我工作、能和我并肩作战的 AI 伙伴。 于是我开始做 Socius,从一个想法,到一个骨架,再到一个能跑的 Runtime。
它是我为自己打造的工作搭档,也是在这个过程中不断成长出来的系统。
Socius = 拉丁语"同伴、搭档"。不是取代你做决定,是陪你做决定。
代码审查、文档生成、架构评审、周报编写、WebSearch 调研、知识消化、Git 提交……这些都在覆盖范围内。但 Socius 真正和其他 Agent 框架拉开差距的,是下面三条引擎。
你能看到的: 告诉 Socius 今天要做什么——可以一句、可以一堆。Agent 自动拆解、排优先级、算依赖、检查日负载、生成可执行树。以下是一个真实交互输出示例。
📋 今日任务清单
──────────────────────────────────────────────────
🔴 延期 | P059 | 05-26 | 组织行为学消化 📎
⚪ 待执行 | P078 | 05-27 | 认知偏误消化 📎
⚪ 待执行 | P081 | 06-01 | 路由重构 + 能力闸门 📎
──────────────────────────────────────────────────
共 3 个任务待执行
📎 = 有关联备忘 — = 无关联备忘
[执行 P059] [执行全部] [创建任务] [跳过]
日常讨论中的结论和待跟进事项可以一键写入项目备忘,关联到任务清单——Agent 执行时会自动加载上下文。
📋 任务详情 · P081
状态: ⚪ 待执行(计划日期 2026-06-01)
类型: knowledge_brain_learn
关联备忘: 📎 plans/project-memo.md(输入「查看备忘」打开)
[开始执行] [查看备忘] [从清单移除]
底层引擎是这样运作的:
$ socius run --prompt "重构认证模块,解耦 SMS 与 Email 通道"
⚙ 正在分析任务结构...
任务类型: code_refactor | 工具依赖: 2 | 拆解粒度: 5 个子任务
📋 子任务拆解结果
┌──────┬────────────────────────────────┬────────┬──────────────┐
│ # │ 阶段 │ 预估 │ 计划日期 │
├──────┼────────────────────────────────┼────────┼──────────────┤
│ 1 │ 提取 IAuthProvider 接口 │ 15min │ 2026-05-29 │
│ 2 │ SMS 通道迁移到新接口 │ 30min │ 2026-05-30 │
│ 3 │ Email 通道迁移到新接口 │ 30min │ 2026-05-31 │
│ 4 │ 更新 12 个调用方 │ 45min │ 2026-06-01 │
│ 5 │ 清理废弃代码 + 回归测试 │ 15min │ 2026-06-02 │
└──────┴────────────────────────────────┴────────┴──────────────┘
↳ 阶段 2 需先完成阶段 1
↳ 阶段 3 需先完成阶段 1
📊 日负载: 🟢 5 天均在预算内(240min/天)
以上拆解是否合理?
1) 写入任务,稍后手动执行
2) 写入任务 + 立即开始执行第一阶段你只管定方向,Socius 解决"先做什么、后做什么"。
你能看到的: 任务执行中遇到需要你拍板的节点——方向选择、方法取舍、高风险授权——Agent 不会卡住等待,而是主动写入决策清单,用字母告诉你需要做什么决定。
任务决策信息说明:D=方向确认 M=方法确认 G=授权执行 R=产物审核 I=信息补全
| 字母 | ID | 标题 |
|:---:|:----|:---------------------------------------------|
| M | P081 | PDF 生成不可用,降级 Markdown 还是配置环境? |
| G | P059 | 确认写入 4 份组织行为学协议到知识脑 |
| I | P083 | 提供目标市场的竞品数据源 |
底层引擎这样工作: 每个子任务执行前,Agent 自动评估 7 个维度,推导授权等级——L0 全自动,L3 必须你手动操作。
🔍 权限评估 · P081-PT1 "提取 IAuthProvider 接口"
S(安全性)=0│ Rev(可逆性)=0│ A(自动化)=1│ C(复杂度)=1
E(经验)=0 │ Auth(权限)=0 │ K(上下文)=0│
──→ L_R=1 L_C=1 → L_final=L1
✅ L1 · 告知执行
Agent: "我将执行以下操作:创建 core/auth/interface.py,定义
IAuthProvider 抽象基类(3 个方法签名)。仅写新文件,不修改现有代码。"
告知后自动执行 → 验证产物 → DONE| 等级 | 含义 | 示例 |
|---|---|---|
| L0 | 全自动执行 | 读取本地文件、格式化输出 |
| L1 | 告知计划后执行 | 创建新文件、搜索代码 |
| L2 | 提案,等你确认 | 删除文件、修改配置 |
| L3 | 提示,你手动操作 | 推送仓库、修改密钥 |
你能看到的: 把《金字塔原理》喂进去,知识脑自动分解、筛选、提炼,长出 4 份可激活的思维协议。未来类似任务自动匹配这些协议——这就是「可编程认知」。
$ socius run --prompt "消化《金字塔原理》第 1-3 章"
📖 知识消化管线启动
源材料: 金字塔原理 · 第1-3章 (12,450 字)
⏳ Step 0: 源分解...
✅ Step 0: 源分解 → 提取 8 个概念单元
⏳ Step 1: CP 类型判定...
✅ Step 1: CP 类型判定 → 3 个思维模型类, 5 个案例类
⏳ P2: 四问闸门...
✅ P2: 四问闸门 → 4/8 通过
What? — 这是什么?Why? — 为什么需要?
How? — 怎么用?Counter? — 什么情况下不适用?
⏳ Step R: 读后总结...
✅ Step R: 读后总结 → 8 单元完成
⏳ P3: 主题合成...
✅ P3: 主题合成 → 跨 8 单元关联提取 3 个跨域洞见
✅ 已写入 4 份协议到 Knowledge-Brain/protocols/
· CP-017-金字塔原理核心框架.md
· CP-018-MECE原则应用.md
· CP-019-结论先行论证逻辑.md
· CP-020-自下而上构建法.md
📋 终末总结
第1-3章的核心结构是"结论先行 → 归类分组 → 逻辑递进"三层模型。
MECE 原则贯穿全书——各层级观点须"相互独立、完全穷尽"。
关键边界:金字塔原理不适用于探索性写作和创造性思维场景。你喂新知识 → 管线自动分解/筛选/提炼 → 知识脑长出可激活的协议 → 未来相关任务自动匹配。
git clone https://github.com/socius/socius.git
cd socius
pip install -e .socius verify启动交互模式:
socius系统会询问你"今天想做什么"。试着告诉它几件事:
👋 今天想做什么?可以一次说完,我来统筹安排。
> 重构认证模块,从单体拆成策略模式;
> 给 core/ 下的 Python 代码做一次安全审查;
> 把《思考,快与慢》的认知偏误消化到知识脑Agent 自动拆解你的描述,排好优先级和依赖:
⚙ 正在分析 3 项任务的结构与依赖...
📋 今日任务清单
┌──────┬────────────────────────────────┬──────────────┬────────┐
│ # │ 任务 │ 子任务 │ 预估 │
├──────┼────────────────────────────────┼──────────────┼────────┤
│ 1 │ 重构认证模块 → 策略模式 │ 5 个子任务 │ 2h 15m │
│ 2 │ Python 代码安全审查 │ 3 个子任务 │ 1h │
│ 3 │ 消化「思考,快与慢」认知偏误 │ 6 个子任务 │ 3h 30m │
└──────┴────────────────────────────────┴──────────────┴────────┘
📊 日负载: 🟡 任务 3 延至明天(今天已超 240min 预算)
📋 任务详情 · 重构认证模块
子任务 1 提取 IAuthProvider 接口 15min L1 告知执行
子任务 2 SMS 通道迁移 30min L1 告知执行
子任务 3 Email 通道迁移 30min L1 告知执行
子任务 4 更新 12 个调用方 45min L1 告知执行
子任务 5 清理废弃代码 + 回归测试 15min L2 等待确认
[执行全部] [执行第一个] [调整排期] [跳过]选择"执行全部",Agent 从子任务 1 开始,每完成一项自动进入下一项:
🔄 开始批量执行 · 重构认证模块 (5/5 子任务待完成)
✅ 子任务 1/5 · 提取 IAuthProvider 接口
─→ 写入 core/auth/interface.py · 43 行
─→ L1 告知执行 · 已验证 DONE
✅ 子任务 2/5 · SMS 通道迁移
─→ 修改 core/auth/sms.py · 移除旧耦合
─→ L1 告知执行 · 已验证 DONE
✅ 子任务 3/5 · Email 通道迁移
─→ 修改 core/auth/email.py · 移除旧耦合
─→ L1 告知执行 · 已验证 DONE
✅ 子任务 4/5 · 更新调用方
─→ 12 个文件迁移完成 · 0 个 breaking change
─→ L1 告知执行 · 已验证 DONE
⏸ 子任务 5/5 · 清理废弃代码 + 回归测试
─→ L2 等待确认:将对 3 个旧文件执行删除操作
─→ 请输入 y/n 确认:刚才发生了什么:
- 你用自然语言说了 3 件事 → Agent 自动拆解为 14 个子任务
- 日负载计算器自动检测到超负荷 → 将任务 3 后移一天
- 每个子任务执行前走权限评估 → 前 4 个 L1 全自动,最后一个 L2 等你确认
- 无人值守——Agent 一个接一个推进,完成一项自动进入下一项
你只管说想做什么。Socius 解决"先做什么、后做什么、怎么做、做没做完"。
| 模型 | 类型 | 最低配置 |
|---|---|---|
| DeepSeek V4 Pro | 云端 | DEEPSEEK_API_KEY |
| Anthropic Claude | 云端 | ANTHROPIC_API_KEY |
| OpenAI (GPT-4o 等) | 云端 | OPENAI_API_KEY |
| Kimi K2.6 | 云端 | KIMI_API_KEY |
| Ollama | 本地 | 无需 API Key |
| LM Studio | 本地 | 无需 API Key |
| 自定义端点 | 自建 | CUSTOM_OPENAI_KEY + 端点 URL |
推荐
deepseek-v4-pro或claude-sonnet-4-6——全链路验证中指令遵循力最强的模型。
| 方式 | 时间 | 适用场景 |
|---|---|---|
| 🟢 只取知识协议 | 5 分钟 | 想复用思维模型(金字塔原理/DDD),core/knowledge/protocols/ 直接浏览 |
| 🟡 跑独立 Agent | 30 分钟 | 有任务队列,想交给 AI 自动执行 |
| 🔴 接入你的平台 | 2 小时 | 自建 IDE/DevOps 平台,实现 6 个 Protocol 接口即可 |
参考实现:adapters/cursor/adapter.py(50 行核心逻辑)
| LangChain | AutoGPT | Cursor | Devin | Socius | |
|---|---|---|---|---|---|
| 工具链编排 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 自决策 | ❌ | 半自动 | ❌ | 半自动 | ✅ L0-L3 |
| 思维模型驱动 | ❌ | ❌ | ❌ | ❌ | ✅ 11协议 |
| 知识可演化 | ❌ | ❌ | ❌ | ❌ | ✅ |
| 自动补齐技能 | ❌ | ❌ | ❌ | ❌ | 🧪 实验 |
| 平台无关 | ✅ | ✅ | 仅 Cursor | 仅 Web | ✅ |
| 本地运行 | ✅ | 受限 | ✅ | ❌ | ✅ Ollama |
| 开源协议 | MIT | MIT | 专有 | 专有 | MIT |
Socius = 认知 + 决策 + 执行 + 演化。其他框架侧重执行层,Socius 拥有完整的认知决策链。
┌──────────────────┐
│ 你的平台/IDE │
│ (Cursor/VS Code/CLI)│
└────────┬─────────┘
│ 6 个 Protocol 接口
┌──────────────────────┼──────────────────────┐
│ │ │
┌──────▼──────┐ ┌───────▼───────┐ ┌───────▼──────┐
│ 网关层 │ │ 安全横切层 │ │ 适配器层 │
│ 指令路由 │ ──── │ 高风险拦截 │ ──── │ 平台适配 │
│ 全局兜底 │ │ 数据治理宪法 │ │ 模型对接 │
└──────┬──────┘ └───────────────┘ └──────────────┘
│
┌───────▼────────┐
│ 能力层 │
│ 决策引擎 │ ← 协议反向影响决策
│ L0–L3 自动评估 │
└───────┬────────┘
│
┌───────▼────────┐
│ 认知层 │
│ 知识脑 (11协议) │ ← 可编程认知
│ 协议激活+演化 │
└───────┬────────┘
│
┌───────▼────────┐
│ 执行层 │
│ Agent 循环 │
│ read/write/ │
│ grep/glob/shell │
│ 沙箱隔离 │
└────────────────┘
Socius 当前为 v0.1.0 Alpha 实验版本。以下为真实状态说明,不含夸张。
以下能力均已通过链路级测试。主链路可运行,但偶发性问题存在,可能与跨链路胶水层未完全连通有关。
- 知识消化管线 —— 喂知识,长认知,自动分解/筛选/提炼为可激活的思维协议
- 任务拆解与排期引擎 —— 将任务自动拆解为可执行子任务树
- 权限自决策引擎(L0-L3) —— 7 维度安全评估,自动判定自主执行边界
- 日负载计算器 —— 排期时自动检查当日任务负载,超阈值告警
- 实体说明书系统 —— LLM 优先检索的知识结构
- 运行时技能自补齐 — 核心链路已设计,当前版本未进行全量验证。属于增强项。
- CLI 别名路由 — 部分覆盖。历史上移除过部分逻辑,当前版本未完全恢复。
以下胶水层尚未完成,是导致偶发性问题的主要原因。计划在 v0.1.1 作为重点补齐:
- 任务拆解后 → 不会自动触发子任务权限评估
- 检测到缺失技能 → 不会自动进入技能安装流程
- 技能安装完成 → 不会自动重新评估"当前任务现在能跑了吗"
- 可运行:是(主链路均可运行)
- 稳定性:不保证(偶发性问题存在)
- 核心链路:全部通过链路级测试
- 风险:Medium
- 建议:适合作为基线版本发布(Yes with notes)
- 权限引擎 7 维度评分依赖所使用的 LLM 模型。
deepseek-chat(非推理模型)不足以可靠驱动全链路,建议使用deepseek-v4-pro或claude-sonnet-4-6。 - Guard 安全闸门当前在 Windows 上完成验证。其他平台请运行
python scripts/check_cross_platform.py自检。
如果你也在探索"能思考、能判断、能执行的 AI Agent",欢迎点个 Star。
MIT — 可商用、可二开、可集成。详见 LICENSE