Paper Agent

多智能体科技论文分析与推导系统

基于 LLM (Ollama / Qwen3-30B) 的多智能体系统，支持数学、物理、计算机科学等领域论文的自动解析、知识推导与智能续写。六个专业化智能体协同工作，具备自我演化能力——随论文阅读量增长自动积累知识并优化推导策略。

Author & Maintainer: Jiangsheng Yu · License: MIT

核心特性

双工作流 — 论文分析 (paper-agent) + 想法生论文 (idea-to-paper)
多领域支持 — 数学 · 物理 · 计算机科学 · 工程 · 生物 · 化学 · 跨学科
六大专业智能体 — 26 项可组合技能，按论文领域自动调度
多层验证 — 自洽性检查 + 反例搜索 + 论证有效性评估
自我演化 — 经验积累 → 技能自适应 → 知识提炼，跨论文持续学习
学术搜索 — 自动检索 Google Scholar 相关论文并下载 PDF
多格式输出 — Markdown / LaTeX (PDF) / JSON 报告
可编程 API — 可作为 Python 库在代码中直接调用

系统流程

本系统提供两条工作流：论文分析（paper-agent）和想法生论文（idea-to-paper）。

工作流 1 — 论文分析 (`paper-agent`)

PDF 论文 ──▶ 文本提取 ──▶ LLM 实体抽取 ──▶ 领域检测
                                             │
                   ┌─────────────────────────┘
                   ▼
            知识图谱构建 (NetworkX)
                   │
                   ▼
       ┌───────────────────────┐
       │  AgentRegistry 路由    │
       │  按领域选择智能体       │
       └───┬───┬───┬───┬───┬───┘
           │   │   │   │   │   │
         数学 物理 CS 文献 方法 续写
           │   │   │   │   │   │
       └───┴───┴───┴───┴───┴───┘
                   │
                   ▼
            多层验证 (自洽性 · 反例 · 论证有效性)
                   │
                   ▼
         经验记录 → 知识提炼 → 策略自适应
                   │
                   ▼
          Markdown / LaTeX / JSON 报告

工作流 2 — 想法 → 论文 (`idea-to-paper`)

想法文本 (.txt)
     │
     ▼
 LLM 想法分析 ──▶ 提取关键词 / 领域 / 研究问题
     │
     ▼
 Google Scholar 搜索 ──▶ 下载相关论文 PDF
     │
     ▼
 逐篇解析 (PaperParser) ──▶ 实体抽取 ──▶ 知识图谱
     │
     ▼
 多智能体推导 (AgentRegistry) ──▶ 新结论候选
     │
     ▼
 LLM 多轮合成
  ├── 摘要 / 引言 / 相关工作 / 方法 / 结论
  └── 跨论文综合 + 新结果推导
     │
     ▼
 LaTeX 论文组装 ──▶ tectonic 编译 ──▶ PDF 输出

智能体与技能

数学推导智能体 (`math`)

技能	策略	描述
推论推导	`corollary`	对已知定理特殊化，限定参数推导推论
定理推广	`generalization`	放松前提条件，扩展适用范围
定理组合	`combination`	链接两个定理的结论与前提，推导新结论
对偶发现	`duality`	探索对偶形式（正↔对偶空间等）
类比迁移	`analogy`	将结论迁移到近亲数学结构
逆命题探索	`converse`	分析逆命题和否命题的成立性

物理推理智能体 (`physics`)

技能	策略	描述
量纲分析	`dimensional_analysis`	通过量纲一致性推导物理关系
极限情形	`limiting_case`	分析极端参数下的方程行为
对称性论证	`symmetry_argument`	利用对称性推导守恒量
思想实验	`thought_experiment`	构造理想化场景检验假说

计算机科学智能体 (`cs`)

技能	策略	描述
复杂度分析	`complexity_analysis`	分析时间/空间复杂度上下界
算法优化	`algorithm_optimization`	识别瓶颈并提出改进方案
问题规约	`reduction`	通过规约建立问题间难度关系
抽象泛化	`abstraction`	将特定方法抽象为通用框架

文献综合智能体 (`literature`) — 跨领域

技能	策略	描述
跨论文综合	`synthesis`	发现互补结论，综合更强结果
矛盾发现	`decomposition`	识别不同工作间的隐含矛盾
脉络梳理	`pattern_recognition`	追踪概念演化脉络
空白识别	`cross_domain_transfer`	发现尚未充分研究的方向

方法论评审智能体 (`methodology`) — 跨领域

技能	策略	描述
方法论评估	`decomposition`	评估方法有效性与局限性
实验设计	`synthesis`	根据理论预测提出实验方案
方法迁移	`cross_domain_transfer`	将成功方法迁移到新领域
方法重构	`decomposition`	分解复杂方法并探索替代组合

论文续写智能体 (`writing`) — 跨领域

技能	策略	描述
后续预测	`pattern_recognition`	预测最可能的后续研究方向
假说生成	`synthesis`	提出可验证的新假说
论证写作	`synthesis`	为新结果撰写完整论证
创新提炼	`pattern_recognition`	提炼最具原创性的贡献

自我演化

系统通过三层机制实现自我演化：

层	模块	功能
经验积累	`ExperienceStore`	记录每次推导的成败、置信度、失败原因
策略自适应	`SkillTracker`	成功率 >70% 提升优先级，<30% 降级
知识提炼	`KnowledgeBase`	LLM 从经验中提炼可复用知识，注入后续 prompt

数据持久化在 data/ 目录，跨运行累积。

快速开始

# 安装
pip install -e .

# 启动 Ollama 并下载模型
ollama serve
ollama pull qwen3:30b

# 论文分析
python -m paper_agent paper.pdf

# 想法 → 论文
idea-to-paper idea.txt

论文分析常用选项

python -m paper_agent paper.pdf --domain physics       # 指定领域
python -m paper_agent paper.pdf --agents math cs        # 只用特定智能体
python -m paper_agent paper.pdf --depth 3               # 加大推导深度
python -m paper_agent paper.pdf --no-evolution           # 关闭演化
python -m paper_agent paper.pdf --no-verify              # 跳过验证

想法 → 论文常用选项

idea-to-paper idea.txt --max-papers 10                 # 搜索更多论文
idea-to-paper idea.txt --min-citations 50              # 只用高引论文
idea-to-paper idea.txt --pdfs a.pdf b.pdf              # 附加本地 PDF
idea-to-paper idea.txt --skip-search --pdfs a.pdf      # 跳过Scholar搜索

paper-agent 参数

参数	默认值	说明
`pdf`	—	PDF 论文路径（必须）
`--model`	`qwen3:30b`	Ollama 模型
`--ollama-url`	`http://localhost:11434`	Ollama 地址
`--depth`	`2`	推导深度
`--max-candidates`	`10`	每轮最大候选数
`--temperature`	`0.3`	LLM 温度
`--output`	`output`	输出目录
`--data-dir`	`data`	演化数据目录
`--domain`	自动	论文领域
`--agents`	自动	启用的智能体
`--no-verify`	—	跳过验证
`--no-evolution`	—	禁用演化
`--max-workers`	`4`	最大并发线程数（设为 1 则顺序执行）

idea-to-paper 参数

参数	默认值	说明
`idea`	—	想法描述文件路径（`.txt`，必须）
`--model`	`qwen3:30b`	Ollama 模型
`--ollama-url`	`http://localhost:11434`	Ollama 地址
`--max-papers`	`5`	最多搜索论文数
`--min-citations`	`0`	最低引用数过滤
`--depth`	`1`	多智能体推导深度
`--max-candidates`	`5`	每轮最大候选数
`--temperature`	`0.3`	LLM 温度
`--output`	`output`	输出目录
`--skip-search`	—	跳过 Google Scholar 搜索
`--pdfs`	—	额外的本地 PDF 文件路径

输出文件

paper-agent 输出

文件	说明
`report.md`	Markdown 推导报告
`derived_results.tex`	LaTeX 推导结果
`knowledge_graph.json`	知识图谱
`derivation_log.json`	推导日志
`agent_capabilities.md`	智能体能力报告
`evolution_stats.json`	演化统计

idea-to-paper 输出

文件	说明
`paper.tex`	完整 LaTeX 论文源码
`paper.pdf`	编译后的 PDF 论文
`knowledge_graph.json`	合并后的知识图谱
`synthesis_log.json`	合成过程日志

项目结构

src/paper_agent/
├── __init__.py               # 包元信息
├── __main__.py               # python -m paper_agent 入口
├── main.py                   # 论文分析主流程（5 阶段管线）
├── idea_to_paper.py          # 想法→论文流水线（idea-to-paper）
├── scholar_search.py         # Google Scholar 搜索 & PDF 下载
├── config.py                 # 全局配置
├── models.py                 # 数据模型（实体 / 候选 / 经验 / 知识）
├── llm_client.py             # Ollama HTTP 客户端
├── paper_parser.py           # PDF 解析 + 领域检测
├── knowledge_graph.py        # NetworkX 知识图谱
├── verification.py           # 多层验证
├── output_manager.py         # 多格式导出
├── utils.py                  # 共用工具函数
│
├── agents/                   # 智能体
│   ├── base_agent.py         # 抽象基类
│   ├── agent_registry.py     # 注册 & 路由 & 协调
│   ├── math_derivation.py    # 数学推导（6 技能）
│   ├── physics_reasoning.py  # 物理推理（4 技能）
│   ├── cs_analysis.py        # CS 分析（4 技能）
│   ├── literature_review.py  # 文献综合（4 技能）
│   ├── methodology_critic.py # 方法论评审（4 技能）
│   └── writing_synthesis.py  # 论文续写（4 技能）
│
├── evolution/                # 自我演化
│   ├── evolution_engine.py   # 演化引擎
│   ├── experience_store.py   # 经验存储
│   ├── skill_tracker.py      # 技能追踪
│   └── knowledge_base.py     # 知识库
│
└── prompts/                  # LLM Prompt 模板
    ├── shared_prompts.py     # 通用（解析 / 验证）
    ├── synthesis_prompts.py  # 想法→论文合成
    ├── math_prompts.py       # 数学推导
    ├── physics_prompts.py    # 物理推理
    ├── cs_prompts.py         # CS 分析
    ├── literature_prompts.py # 文献综合
    ├── methodology_prompts.py# 方法论
    └── writing_prompts.py    # 续写

详细文档

文档	内容
系统架构	五阶段管线、模块关系、数据流
智能体详解	6 个智能体 × 26 项技能的完整说明
自演化机制	经验、技能、知识三层演化系统
配置参考	全部参数及常用场景配置示例
贡献指南	编码规范、提交流程、扩展方法

示例代码

基础用法 — 命令行各种使用场景
编程接口 — 作为 Python 库集成

License

MIT — see LICENSE

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
docs		docs
examples		examples
src/paper_agent		src/paper_agent
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Paper Agent

核心特性

系统流程

工作流 1 — 论文分析 (`paper-agent`)

工作流 2 — 想法 → 论文 (`idea-to-paper`)

智能体与技能

数学推导智能体 (`math`)

物理推理智能体 (`physics`)

计算机科学智能体 (`cs`)

文献综合智能体 (`literature`) — 跨领域

方法论评审智能体 (`methodology`) — 跨领域

论文续写智能体 (`writing`) — 跨领域

自我演化

快速开始

论文分析常用选项

想法 → 论文常用选项

paper-agent 参数

idea-to-paper 参数

输出文件

paper-agent 输出

idea-to-paper 输出

项目结构

详细文档

示例代码

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Paper Agent

核心特性

系统流程

工作流 1 — 论文分析 (paper-agent)

工作流 2 — 想法 → 论文 (idea-to-paper)

智能体与技能

数学推导智能体 (math)

物理推理智能体 (physics)

计算机科学智能体 (cs)

文献综合智能体 (literature) — 跨领域

方法论评审智能体 (methodology) — 跨领域

论文续写智能体 (writing) — 跨领域

自我演化

快速开始

论文分析常用选项

想法 → 论文常用选项

paper-agent 参数

idea-to-paper 参数

输出文件

paper-agent 输出

idea-to-paper 输出

项目结构

详细文档

示例代码

License

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

工作流 1 — 论文分析 (`paper-agent`)

工作流 2 — 想法 → 论文 (`idea-to-paper`)

数学推导智能体 (`math`)

物理推理智能体 (`physics`)

计算机科学智能体 (`cs`)

文献综合智能体 (`literature`) — 跨领域

方法论评审智能体 (`methodology`) — 跨领域

论文续写智能体 (`writing`) — 跨领域

Packages