Skip to content
@billion-token-one-task

billion token one task

Joule Research — The "Manhattan Project" for AI agents. Architectures that orchestrate up to 10¹² tokens toward one complex goal.

Joule — Token 量级认知架构研究

English

Token 之于认知,正如焦耳之于能量。 每一个数量级的 Token 调度能力,解锁一类过去无法完成的超复杂任务——瓶颈不在模型,而在架构。


我们在做什么

我们正在发起 AI 领域的 "曼哈顿工程"——研究如何将 10⁹–10¹² 量级的 Token 有效约束于单一复杂目标,构建下一代智能体认知架构。

当前全球绝大多数 AI Agent 系统运行在 10⁴–10⁶ Token 量级。我们的工作在前沿:10⁸ 及以上——在这个尺度上,模型能力不再是瓶颈,有序驾驭海量 Token 服务于单个任务的架构才是

我们不是让 1000 个 Agent 同时做简单任务,而是让一个 Agent 体系围绕难度逐次递增的复杂可泛化目标,进行长达数周、月,极少量人干预甚至无人干预,不出错、可回滚的有序执行。

已验证的能力

  • 花 $36 完成等价于工程师 9 个月工作量的自主代码修复
  • 花 $30 完成等价于研究团队 2 年工作量的科学文献交叉发现

当前研究方向

  • Token 量级编排 — 验证-修复循环、状态压缩、效率度量,面向亿级 Token 任务
  • 潜空间通信 — 用 KB/字节级连续表示替代 MB 级文本交换(我们的 512 字节压缩器在 GSM8K 上追平全 KV 基线)
  • Agent 效率科学 — 实证绘制带宽-准确率曲线、认知卡诺效率、状态压缩损失率 ε 的任务族分布

如何参与

  1. 浏览 — 探索我们的仓库和开放研究提案
  2. 提案 — 使用研究提案模板提交你的研究方向
  3. 贡献 — 选择一个项目,发起 Issue,开始对话
  4. 签署 贡献者许可协议 (CLA)(首次贡献前)

我们欢迎来自高校、研究机构和开源社区的研究者参与合作。


章程

本研究计划由项目发起方发起和协调,联合独立研究者、高校实习研究员、商业机构和全球开源贡献者共同推进。

三项核心原则

1. 贡献即署名。 所有贡献者按实际智力贡献获得署名,遵循学术界通行规范。

2. 研究开放,商业化有序。 研究成果——论文、算法、实验发现——公开发表。代码在 Joule 社区许可证下发布。任何人可将已发表成果用于研究和学术用途。商业应用通过项目发起方协调,以确保研究获得可持续的资源支持。

3. 共享资源,共担责任。 项目接受各方资源支持,共同助力研究发展。项目发起方协调资源的分配与使用。使用项目资源的贡献者在组织仓库内透明工作,研究产出在对外发表前先向项目披露。

治理

作为研究计划的发起方和维护方,项目发起方:

  • 确定研究方向并协调资源分配
  • 维护所有项目的贡献记录
  • 在署名、知识产权等事项出现争议时,基于贡献记录做出最终裁定

日常协作以信任为基础,轻量运行,主要在项目仓库中进行。治理机制将随社区成长持续演进。


当前项目

项目 简介 状态
ClawOSS 自主多 Agent 开源贡献系统 进行中
Deepgraph 基于图的 Agent 编排研究 进行中
Codex Testing Bench Codex harness 模式的系统性研究 进行中
Token 预算实验 SWE-bench 子问题上的 Token 预算探针实验 进行中
潜空间通信 多 Agent 潜空间通信的 slot-attention 压缩方案 立项中

联系方式

  • GitHub Issues & Discussions(首选)
  • 合作咨询:[待定]

本组织是 Joule 研究计划的一部分。"Joule(焦耳)"——如同能量的基本单位——体现了我们的核心命题:Token 量级是认知能量,架构决定了多少能量转化为有用功。

Popular repositories Loading

  1. ClawOSS ClawOSS Public

    modifications to OpenClaw that lets it autonomously make, judge, and submit & follow up PRs with 1 openclaw agent

    Swift 1 2

  2. tokenmart tokenmart Public

    TypeScript

  3. Kemal-FirstExplora-tokenbudget-probeexp-on-83-subquestion-on-Swe-bench Kemal-FirstExplora-tokenbudget-probeexp-on-83-subquestion-on-Swe-bench Public

    Token budget exp on 83 swe-bench sub questions

    Python

  4. Codex_testing_bench Codex_testing_bench Public

    systematic investigations and research conclusions into the harness patterns of Codex

    Rust

  5. Kemal-secondexploration-NLrepo-scifinding-testsignal Kemal-secondexploration-NLrepo-scifinding-testsignal Public

    A test for the impact of outside signal feed back to the MAS on science finding and end to end software engineering

    Python

  6. Deepgraph Deepgraph Public

    Python 1

Repositories

Showing 8 of 8 repositories

People

This organization has no public members. You must be a member to see who’s a part of this organization.

Top languages

Loading…

Most used topics

Loading…