多智能体科技论文分析与推导系统
基于 LLM (Ollama / Qwen3-30B) 的多智能体系统,支持数学、物理、计算机科学等领域论文的自动解析、知识推导与智能续写。六个专业化智能体协同工作,具备自我演化 能力——随论文阅读量增长自动积累知识并优化推导策略。
Author & Maintainer: Jiangsheng Yu · License: MIT
双工作流 — 论文分析 (paper-agent) + 想法生论文 (idea-to-paper)
多领域支持 — 数学 · 物理 · 计算机科学 · 工程 · 生物 · 化学 · 跨学科
六大专业智能体 — 26 项可组合技能,按论文领域自动调度
多层验证 — 自洽性检查 + 反例搜索 + 论证有效性评估
自我演化 — 经验积累 → 技能自适应 → 知识提炼,跨论文持续学习
学术搜索 — 自动检索 Google Scholar 相关论文并下载 PDF
多格式输出 — Markdown / LaTeX (PDF) / JSON 报告
可编程 API — 可作为 Python 库在代码中直接调用
本系统提供两条工作流:论文分析 (paper-agent)和想法生论文 (idea-to-paper)。
工作流 1 — 论文分析 (paper-agent)
PDF 论文 ──▶ 文本提取 ──▶ LLM 实体抽取 ──▶ 领域检测
│
┌─────────────────────────┘
▼
知识图谱构建 (NetworkX)
│
▼
┌───────────────────────┐
│ AgentRegistry 路由 │
│ 按领域选择智能体 │
└───┬───┬───┬───┬───┬───┘
│ │ │ │ │ │
数学 物理 CS 文献 方法 续写
│ │ │ │ │ │
└───┴───┴───┴───┴───┴───┘
│
▼
多层验证 (自洽性 · 反例 · 论证有效性)
│
▼
经验记录 → 知识提炼 → 策略自适应
│
▼
Markdown / LaTeX / JSON 报告
工作流 2 — 想法 → 论文 (idea-to-paper)
想法文本 (.txt)
│
▼
LLM 想法分析 ──▶ 提取关键词 / 领域 / 研究问题
│
▼
Google Scholar 搜索 ──▶ 下载相关论文 PDF
│
▼
逐篇解析 (PaperParser) ──▶ 实体抽取 ──▶ 知识图谱
│
▼
多智能体推导 (AgentRegistry) ──▶ 新结论候选
│
▼
LLM 多轮合成
├── 摘要 / 引言 / 相关工作 / 方法 / 结论
└── 跨论文综合 + 新结果推导
│
▼
LaTeX 论文组装 ──▶ tectonic 编译 ──▶ PDF 输出
技能
策略
描述
推论推导
corollary
对已知定理特殊化,限定参数推导推论
定理推广
generalization
放松前提条件,扩展适用范围
定理组合
combination
链接两个定理的结论与前提,推导新结论
对偶发现
duality
探索对偶形式(正↔对偶空间等)
类比迁移
analogy
将结论迁移到近亲数学结构
逆命题探索
converse
分析逆命题和否命题的成立性
技能
策略
描述
量纲分析
dimensional_analysis
通过量纲一致性推导物理关系
极限情形
limiting_case
分析极端参数下的方程行为
对称性论证
symmetry_argument
利用对称性推导守恒量
思想实验
thought_experiment
构造理想化场景检验假说
技能
策略
描述
复杂度分析
complexity_analysis
分析时间/空间复杂度上下界
算法优化
algorithm_optimization
识别瓶颈并提出改进方案
问题规约
reduction
通过规约建立问题间难度关系
抽象泛化
abstraction
将特定方法抽象为通用框架
文献综合智能体 (literature) — 跨领域
技能
策略
描述
跨论文综合
synthesis
发现互补结论,综合更强结果
矛盾发现
decomposition
识别不同工作间的隐含矛盾
脉络梳理
pattern_recognition
追踪概念演化脉络
空白识别
cross_domain_transfer
发现尚未充分研究的方向
方法论评审智能体 (methodology) — 跨领域
技能
策略
描述
方法论评估
decomposition
评估方法有效性与局限性
实验设计
synthesis
根据理论预测提出实验方案
方法迁移
cross_domain_transfer
将成功方法迁移到新领域
方法重构
decomposition
分解复杂方法并探索替代组合
技能
策略
描述
后续预测
pattern_recognition
预测最可能的后续研究方向
假说生成
synthesis
提出可验证的新假说
论证写作
synthesis
为新结果撰写完整论证
创新提炼
pattern_recognition
提炼最具原创性的贡献
系统通过三层机制实现自我演化:
层
模块
功能
经验积累
ExperienceStore
记录每次推导的成败、置信度、失败原因
策略自适应
SkillTracker
成功率 >70% 提升优先级,<30% 降级
知识提炼
KnowledgeBase
LLM 从经验中提炼可复用知识,注入后续 prompt
数据持久化在 data/ 目录,跨运行累积。
# 安装
pip install -e .
# 启动 Ollama 并下载模型
ollama serve
ollama pull qwen3:30b
# 论文分析
python -m paper_agent paper.pdf
# 想法 → 论文
idea-to-paper idea.txt
python -m paper_agent paper.pdf --domain physics # 指定领域
python -m paper_agent paper.pdf --agents math cs # 只用特定智能体
python -m paper_agent paper.pdf --depth 3 # 加大推导深度
python -m paper_agent paper.pdf --no-evolution # 关闭演化
python -m paper_agent paper.pdf --no-verify # 跳过验证
idea-to-paper idea.txt --max-papers 10 # 搜索更多论文
idea-to-paper idea.txt --min-citations 50 # 只用高引论文
idea-to-paper idea.txt --pdfs a.pdf b.pdf # 附加本地 PDF
idea-to-paper idea.txt --skip-search --pdfs a.pdf # 跳过Scholar搜索
参数
默认值
说明
pdf
—
PDF 论文路径(必须)
--model
qwen3:30b
Ollama 模型
--ollama-url
http://localhost:11434
Ollama 地址
--depth
2
推导深度
--max-candidates
10
每轮最大候选数
--temperature
0.3
LLM 温度
--output
output
输出目录
--data-dir
data
演化数据目录
--domain
自动
论文领域
--agents
自动
启用的智能体
--no-verify
—
跳过验证
--no-evolution
—
禁用演化
--max-workers
4
最大并发线程数(设为 1 则顺序执行)
参数
默认值
说明
idea
—
想法描述文件路径(.txt,必须)
--model
qwen3:30b
Ollama 模型
--ollama-url
http://localhost:11434
Ollama 地址
--max-papers
5
最多搜索论文数
--min-citations
0
最低引用数过滤
--depth
1
多智能体推导深度
--max-candidates
5
每轮最大候选数
--temperature
0.3
LLM 温度
--output
output
输出目录
--skip-search
—
跳过 Google Scholar 搜索
--pdfs
—
额外的本地 PDF 文件路径
文件
说明
report.md
Markdown 推导报告
derived_results.tex
LaTeX 推导结果
knowledge_graph.json
知识图谱
derivation_log.json
推导日志
agent_capabilities.md
智能体能力报告
evolution_stats.json
演化统计
文件
说明
paper.tex
完整 LaTeX 论文源码
paper.pdf
编译后的 PDF 论文
knowledge_graph.json
合并后的知识图谱
synthesis_log.json
合成过程日志
src/paper_agent/
├── __init__.py # 包元信息
├── __main__.py # python -m paper_agent 入口
├── main.py # 论文分析主流程(5 阶段管线)
├── idea_to_paper.py # 想法→论文流水线(idea-to-paper)
├── scholar_search.py # Google Scholar 搜索 & PDF 下载
├── config.py # 全局配置
├── models.py # 数据模型(实体 / 候选 / 经验 / 知识)
├── llm_client.py # Ollama HTTP 客户端
├── paper_parser.py # PDF 解析 + 领域检测
├── knowledge_graph.py # NetworkX 知识图谱
├── verification.py # 多层验证
├── output_manager.py # 多格式导出
├── utils.py # 共用工具函数
│
├── agents/ # 智能体
│ ├── base_agent.py # 抽象基类
│ ├── agent_registry.py # 注册 & 路由 & 协调
│ ├── math_derivation.py # 数学推导(6 技能)
│ ├── physics_reasoning.py # 物理推理(4 技能)
│ ├── cs_analysis.py # CS 分析(4 技能)
│ ├── literature_review.py # 文献综合(4 技能)
│ ├── methodology_critic.py # 方法论评审(4 技能)
│ └── writing_synthesis.py # 论文续写(4 技能)
│
├── evolution/ # 自我演化
│ ├── evolution_engine.py # 演化引擎
│ ├── experience_store.py # 经验存储
│ ├── skill_tracker.py # 技能追踪
│ └── knowledge_base.py # 知识库
│
└── prompts/ # LLM Prompt 模板
├── shared_prompts.py # 通用(解析 / 验证)
├── synthesis_prompts.py # 想法→论文合成
├── math_prompts.py # 数学推导
├── physics_prompts.py # 物理推理
├── cs_prompts.py # CS 分析
├── literature_prompts.py # 文献综合
├── methodology_prompts.py# 方法论
└── writing_prompts.py # 续写
文档
内容
系统架构
五阶段管线、模块关系、数据流
智能体详解
6 个智能体 × 26 项技能的完整说明
自演化机制
经验、技能、知识三层演化系统
配置参考
全部参数及常用场景配置示例
贡献指南
编码规范、提交流程、扩展方法
MIT — see LICENSE