Skip to content

Phoenix-hwp/socius

Repository files navigation

Socius — AI 工作搭档

让 AI Agent 拥有认知、自决策、自执行、自演化。不再是工具,是你的搭档。

MIT License Python 3.10+

5 秒体验(零配置)pip install -e . && socius verify 完整流程支持 Ollama(本地免费)或 DeepSeek / Kimi / Anthropic API。


  ███████╗ ██████╗  ██████╗██╗██╗   ██╗███████╗
  ██╔════╝██╔═══██╗██╔════╝██║██║   ██║██╔════╝
  ███████╗██║   ██║██║     ██║██║   ██║███████╗
  ╚════██║██║   ██║██║     ██║██║   ██║╚════██║
  ███████║╚██████╔╝╚██████╗██║╚██████╔╝███████║
  ╚══════╝ ╚═════╝  ╚═════╝╚═╝ ╚═════╝ ╚══════╝

   Your AI Work Partner  ·  自主认知 · 自决策 · 自执行

Socius 是什么?

Socius = 认知引擎 + 决策引擎 + 执行引擎 的统一体。
它不是工具链,也不是工作流,而是一个能理解任务、能判断风险、能推进执行的 AI 工作搭档。

为什么现在需要 Socius?

当下的 Agent 多停留在"工具调用层",需要人类不断盯着、提醒、决策。 缺的是一个能把"认知 → 决策 → 执行"连成闭环的伙伴,而不是被动等待指令的工具。

Socius 的目标不是替代现有框架,而是补上这一块缺失的能力: 让 AI 真正承担任务,而不是半自动的工具链。

为什么我要做 Socius?

这是一个纯粹的个人项目,没有 KPI,没有 deadline,也没有商业压力。

我只是想要一个能真正替我工作、能和我并肩作战的 AI 伙伴。 于是我开始做 Socius,从一个想法,到一个骨架,再到一个能跑的 Runtime。

它是我为自己打造的工作搭档,也是在这个过程中不断成长出来的系统。

Socius = 拉丁语"同伴、搭档"。不是取代你做决定,是陪你做决定。


🧠 核心能力

代码审查、文档生成、架构评审、周报编写、WebSearch 调研、知识消化、Git 提交……这些都在覆盖范围内。但 Socius 真正和其他 Agent 框架拉开差距的,是下面三条引擎。

1. 任务拆解与排期引擎

你能看到的: 告诉 Socius 今天要做什么——可以一句、可以一堆。Agent 自动拆解、排优先级、算依赖、检查日负载、生成可执行树。以下是一个真实交互输出示例。

📋 今日任务清单
──────────────────────────────────────────────────
 🔴 延期  | P059 | 05-26 | 组织行为学消化              📎
 ⚪ 待执行 | P078 | 05-27 | 认知偏误消化                📎
 ⚪ 待执行 | P081 | 06-01 | 路由重构 + 能力闸门          📎
──────────────────────────────────────────────────
 共 3 个任务待执行
 📎 = 有关联备忘  — = 无关联备忘

 [执行 P059]  [执行全部]  [创建任务]  [跳过]

日常讨论中的结论和待跟进事项可以一键写入项目备忘,关联到任务清单——Agent 执行时会自动加载上下文。

📋 任务详情 · P081
  状态:      ⚪ 待执行(计划日期 2026-06-01)
  类型:      knowledge_brain_learn
  关联备忘:  📎 plans/project-memo.md(输入「查看备忘」打开)

  [开始执行]  [查看备忘]  [从清单移除]

底层引擎是这样运作的:

$ socius run --prompt "重构认证模块,解耦 SMS 与 Email 通道"

⚙ 正在分析任务结构...
  任务类型: code_refactor | 工具依赖: 2 | 拆解粒度: 5 个子任务

📋 子任务拆解结果
┌──────┬────────────────────────────────┬────────┬──────────────┐
│  #   │ 阶段                             │ 预估   │ 计划日期      │
├──────┼────────────────────────────────┼────────┼──────────────┤
│  1   │ 提取 IAuthProvider 接口          │ 15min  │ 2026-05-29   │
│  2   │ SMS 通道迁移到新接口              │ 30min  │ 2026-05-30   │
│  3   │ Email 通道迁移到新接口            │ 30min  │ 2026-05-31   │
│  4   │ 更新 12 个调用方                  │ 45min  │ 2026-06-01   │
│  5   │ 清理废弃代码 + 回归测试            │ 15min  │ 2026-06-02   │
└──────┴────────────────────────────────┴────────┴──────────────┘
   ↳ 阶段 2 需先完成阶段 1
   ↳ 阶段 3 需先完成阶段 1

📊 日负载: 🟢 5 天均在预算内(240min/天)

以上拆解是否合理?
  1) 写入任务,稍后手动执行
  2) 写入任务 + 立即开始执行第一阶段

你只管定方向,Socius 解决"先做什么、后做什么"。

2. 权限自决策引擎(L0-L3)

你能看到的: 任务执行中遇到需要你拍板的节点——方向选择、方法取舍、高风险授权——Agent 不会卡住等待,而是主动写入决策清单,用字母告诉你需要做什么决定。

任务决策信息说明:D=方向确认  M=方法确认  G=授权执行  R=产物审核  I=信息补全

| 字母 | ID   | 标题                                         |
|:---:|:----|:---------------------------------------------|
| M   | P081 | PDF 生成不可用,降级 Markdown 还是配置环境?      |
| G   | P059 | 确认写入 4 份组织行为学协议到知识脑               |
| I   | P083 | 提供目标市场的竞品数据源                         |

底层引擎这样工作: 每个子任务执行前,Agent 自动评估 7 个维度,推导授权等级——L0 全自动,L3 必须你手动操作。

🔍 权限评估 · P081-PT1 "提取 IAuthProvider 接口"

  S(安全性)=0│  Rev(可逆性)=0│  A(自动化)=1│  C(复杂度)=1
  E(经验)=0  │  Auth(权限)=0 │  K(上下文)=0│

  ──→ L_R=1  L_C=1  →  L_final=L1

  ✅ L1 · 告知执行
  Agent: "我将执行以下操作:创建 core/auth/interface.py,定义
         IAuthProvider 抽象基类(3 个方法签名)。仅写新文件,不修改现有代码。"
  告知后自动执行 → 验证产物 → DONE
等级 含义 示例
L0 全自动执行 读取本地文件、格式化输出
L1 告知计划后执行 创建新文件、搜索代码
L2 提案,等你确认 删除文件、修改配置
L3 提示,你手动操作 推送仓库、修改密钥

3. 知识消化管线 — 喂知识,长认知

你能看到的: 把《金字塔原理》喂进去,知识脑自动分解、筛选、提炼,长出 4 份可激活的思维协议。未来类似任务自动匹配这些协议——这就是「可编程认知」。

$ socius run --prompt "消化《金字塔原理》第 1-3 章"

📖 知识消化管线启动
  源材料: 金字塔原理 · 第1-3章 (12,450 字)

  ⏳ Step 0: 源分解...
  ✅ Step 0: 源分解 → 提取 8 个概念单元
  ⏳ Step 1: CP 类型判定...
  ✅ Step 1: CP 类型判定 → 3 个思维模型类, 5 个案例类
  ⏳ P2: 四问闸门...
  ✅ P2: 四问闸门 → 4/8 通过
     What? — 这是什么?Why? — 为什么需要?
     How?  — 怎么用?Counter? — 什么情况下不适用?
  ⏳ Step R: 读后总结...
  ✅ Step R: 读后总结 → 8 单元完成
  ⏳ P3: 主题合成...
  ✅ P3: 主题合成 → 跨 8 单元关联提取 3 个跨域洞见

  ✅ 已写入 4 份协议到 Knowledge-Brain/protocols/
     · CP-017-金字塔原理核心框架.md
     · CP-018-MECE原则应用.md
     · CP-019-结论先行论证逻辑.md
     · CP-020-自下而上构建法.md

  📋 终末总结
     第1-3章的核心结构是"结论先行 → 归类分组 → 逻辑递进"三层模型。
     MECE 原则贯穿全书——各层级观点须"相互独立、完全穷尽"。
     关键边界:金字塔原理不适用于探索性写作和创造性思维场景。

你喂新知识 → 管线自动分解/筛选/提炼 → 知识脑长出可激活的协议 → 未来相关任务自动匹配。


🚀 5 分钟跑通:建任务清单 → 批量自动执行

1. 安装

git clone https://github.com/socius/socius.git
cd socius
pip install -e .

2. 框架自检(<1 秒,零 API Key)

socius verify

3. 创建你的第一条任务清单

启动交互模式:

socius

系统会询问你"今天想做什么"。试着告诉它几件事:

👋 今天想做什么?可以一次说完,我来统筹安排。

> 重构认证模块,从单体拆成策略模式;
> 给 core/ 下的 Python 代码做一次安全审查;
> 把《思考,快与慢》的认知偏误消化到知识脑

Agent 自动拆解你的描述,排好优先级和依赖:

⚙ 正在分析 3 项任务的结构与依赖...

📋 今日任务清单
┌──────┬────────────────────────────────┬──────────────┬────────┐
│  #   │ 任务                            │ 子任务       │ 预估   │
├──────┼────────────────────────────────┼──────────────┼────────┤
│  1   │ 重构认证模块 → 策略模式          │ 5 个子任务    │ 2h 15m │
│  2   │ Python 代码安全审查              │ 3 个子任务    │ 1h     │
│  3   │ 消化「思考,快与慢」认知偏误      │ 6 个子任务    │ 3h 30m │
└──────┴────────────────────────────────┴──────────────┴────────┘
📊 日负载: 🟡 任务 3 延至明天(今天已超 240min 预算)

📋 任务详情 · 重构认证模块
  子任务 1   提取 IAuthProvider 接口          15min  L1 告知执行
  子任务 2   SMS 通道迁移                    30min  L1 告知执行
  子任务 3   Email 通道迁移                  30min  L1 告知执行
  子任务 4   更新 12 个调用方                 45min  L1 告知执行
  子任务 5   清理废弃代码 + 回归测试           15min  L2 等待确认

  [执行全部]  [执行第一个]  [调整排期]  [跳过]

4. 执行全部 — Agent 逐一推进

选择"执行全部",Agent 从子任务 1 开始,每完成一项自动进入下一项:

🔄 开始批量执行 · 重构认证模块 (5/5 子任务待完成)

  ✅ 子任务 1/5 · 提取 IAuthProvider 接口
     ─→ 写入 core/auth/interface.py · 43 行
     ─→ L1 告知执行 · 已验证 DONE

  ✅ 子任务 2/5 · SMS 通道迁移
     ─→ 修改 core/auth/sms.py · 移除旧耦合
     ─→ L1 告知执行 · 已验证 DONE

  ✅ 子任务 3/5 · Email 通道迁移
     ─→ 修改 core/auth/email.py · 移除旧耦合
     ─→ L1 告知执行 · 已验证 DONE

  ✅ 子任务 4/5 · 更新调用方
     ─→ 12 个文件迁移完成 · 0 个 breaking change
     ─→ L1 告知执行 · 已验证 DONE

  ⏸ 子任务 5/5 · 清理废弃代码 + 回归测试
     ─→ L2 等待确认:将对 3 个旧文件执行删除操作
     ─→ 请输入 y/n 确认:

刚才发生了什么:

  1. 你用自然语言说了 3 件事 → Agent 自动拆解为 14 个子任务
  2. 日负载计算器自动检测到超负荷 → 将任务 3 后移一天
  3. 每个子任务执行前走权限评估 → 前 4 个 L1 全自动,最后一个 L2 等你确认
  4. 无人值守——Agent 一个接一个推进,完成一项自动进入下一项

你只管说想做什么。Socius 解决"先做什么、后做什么、怎么做、做没做完"。


📦 支持的模型 & 接入方式

模型 类型 最低配置
DeepSeek V4 Pro 云端 DEEPSEEK_API_KEY
Anthropic Claude 云端 ANTHROPIC_API_KEY
OpenAI (GPT-4o 等) 云端 OPENAI_API_KEY
Kimi K2.6 云端 KIMI_API_KEY
Ollama 本地 无需 API Key
LM Studio 本地 无需 API Key
自定义端点 自建 CUSTOM_OPENAI_KEY + 端点 URL

推荐 deepseek-v4-proclaude-sonnet-4-6——全链路验证中指令遵循力最强的模型。

三种接入方式

方式 时间 适用场景
🟢 只取知识协议 5 分钟 想复用思维模型(金字塔原理/DDD),core/knowledge/protocols/ 直接浏览
🟡 跑独立 Agent 30 分钟 有任务队列,想交给 AI 自动执行
🔴 接入你的平台 2 小时 自建 IDE/DevOps 平台,实现 6 个 Protocol 接口即可

参考实现:adapters/cursor/adapter.py(50 行核心逻辑)


📊 Socius vs 其他框架

LangChain AutoGPT Cursor Devin Socius
工具链编排
自决策 半自动 半自动 ✅ L0-L3
思维模型驱动 ✅ 11协议
知识可演化
自动补齐技能 🧪 实验
平台无关 仅 Cursor 仅 Web
本地运行 受限 ✅ Ollama
开源协议 MIT MIT 专有 专有 MIT

Socius = 认知 + 决策 + 执行 + 演化。其他框架侧重执行层,Socius 拥有完整的认知决策链。


🏗 系统架构

                          ┌──────────────────┐
                          │   你的平台/IDE     │
                          │ (Cursor/VS Code/CLI)│
                          └────────┬─────────┘
                                   │ 6 个 Protocol 接口
            ┌──────────────────────┼──────────────────────┐
            │                      │                      │
     ┌──────▼──────┐      ┌───────▼───────┐      ┌───────▼──────┐
     │  网关层       │      │  安全横切层     │      │  适配器层      │
     │  指令路由      │ ──── │  高风险拦截      │ ──── │  平台适配      │
     │  全局兜底      │      │  数据治理宪法    │      │  模型对接      │
     └──────┬──────┘      └───────────────┘      └──────────────┘
            │
    ┌───────▼────────┐
    │  能力层          │
    │  决策引擎         │  ← 协议反向影响决策
    │  L0–L3 自动评估  │
    └───────┬────────┘
            │
    ┌───────▼────────┐
    │  认知层          │
    │  知识脑 (11协议)  │  ← 可编程认知
    │  协议激活+演化    │
    └───────┬────────┘
            │
    ┌───────▼────────┐
    │  执行层          │
    │  Agent 循环      │
    │  read/write/     │
    │  grep/glob/shell │
    │  沙箱隔离         │
    └────────────────┘

⚠ 发布说明

Socius 当前为 v0.1.0 Alpha 实验版本。以下为真实状态说明,不含夸张。

🎯 核心能力(已验证,不保证稳定性)

以下能力均已通过链路级测试。主链路可运行,但偶发性问题存在,可能与跨链路胶水层未完全连通有关。

  • 知识消化管线 —— 喂知识,长认知,自动分解/筛选/提炼为可激活的思维协议
  • 任务拆解与排期引擎 —— 将任务自动拆解为可执行子任务树
  • 权限自决策引擎(L0-L3) —— 7 维度安全评估,自动判定自主执行边界
  • 日负载计算器 —— 排期时自动检查当日任务负载,超阈值告警
  • 实体说明书系统 —— LLM 优先检索的知识结构

🧪 实验能力

  • 运行时技能自补齐 — 核心链路已设计,当前版本未进行全量验证。属于增强项。
  • CLI 别名路由 — 部分覆盖。历史上移除过部分逻辑,当前版本未完全恢复。

🔗 跨链路自动编排(当前版本未完成)

以下胶水层尚未完成,是导致偶发性问题的主要原因。计划在 v0.1.1 作为重点补齐:

  • 任务拆解后 → 不会自动触发子任务权限评估
  • 检测到缺失技能 → 不会自动进入技能安装流程
  • 技能安装完成 → 不会自动重新评估"当前任务现在能跑了吗"

📌 发布状态

  • 可运行:是(主链路均可运行)
  • 稳定性:不保证(偶发性问题存在)
  • 核心链路:全部通过链路级测试
  • 风险:Medium
  • 建议:适合作为基线版本发布(Yes with notes)

模型兼容性

  • 权限引擎 7 维度评分依赖所使用的 LLM 模型。deepseek-chat(非推理模型)不足以可靠驱动全链路,建议使用 deepseek-v4-proclaude-sonnet-4-6
  • Guard 安全闸门当前在 Windows 上完成验证。其他平台请运行 python scripts/check_cross_platform.py 自检。

⭐ 支持 Socius

如果你也在探索"能思考、能判断、能执行的 AI Agent",欢迎点个 Star。


License

MIT — 可商用、可二开、可集成。详见 LICENSE

About

Socius — Your AI Work Partner. 认知 + 决策 + 执行三大引擎的统一 Runtime。不是工具链,是能替你工作、和你并肩作战的 AI 搭档。

Topics

Resources

License

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors