Skip to content

yujiangsheng/Paper_Agent

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Paper Agent

Python License LLM

多智能体科技论文分析与推导系统

基于 LLM (Ollama / Qwen3-30B) 的多智能体系统,支持数学、物理、计算机科学等领域论文的自动解析、知识推导与智能续写。六个专业化智能体协同工作,具备自我演化能力——随论文阅读量增长自动积累知识并优化推导策略。

Author & Maintainer: Jiangsheng Yu · License: MIT

核心特性

  • 双工作流 — 论文分析 (paper-agent) + 想法生论文 (idea-to-paper)
  • 多领域支持 — 数学 · 物理 · 计算机科学 · 工程 · 生物 · 化学 · 跨学科
  • 六大专业智能体 — 26 项可组合技能,按论文领域自动调度
  • 多层验证 — 自洽性检查 + 反例搜索 + 论证有效性评估
  • 自我演化 — 经验积累 → 技能自适应 → 知识提炼,跨论文持续学习
  • 学术搜索 — 自动检索 Google Scholar 相关论文并下载 PDF
  • 多格式输出 — Markdown / LaTeX (PDF) / JSON 报告
  • 可编程 API — 可作为 Python 库在代码中直接调用

系统流程

本系统提供两条工作流:论文分析paper-agent)和想法生论文idea-to-paper)。

工作流 1 — 论文分析 (paper-agent)

PDF 论文 ──▶ 文本提取 ──▶ LLM 实体抽取 ──▶ 领域检测
                                             │
                   ┌─────────────────────────┘
                   ▼
            知识图谱构建 (NetworkX)
                   │
                   ▼
       ┌───────────────────────┐
       │  AgentRegistry 路由    │
       │  按领域选择智能体       │
       └───┬───┬───┬───┬───┬───┘
           │   │   │   │   │   │
         数学 物理 CS 文献 方法 续写
           │   │   │   │   │   │
       └───┴───┴───┴───┴───┴───┘
                   │
                   ▼
            多层验证 (自洽性 · 反例 · 论证有效性)
                   │
                   ▼
         经验记录 → 知识提炼 → 策略自适应
                   │
                   ▼
          Markdown / LaTeX / JSON 报告

工作流 2 — 想法 → 论文 (idea-to-paper)

想法文本 (.txt)
     │
     ▼
 LLM 想法分析 ──▶ 提取关键词 / 领域 / 研究问题
     │
     ▼
 Google Scholar 搜索 ──▶ 下载相关论文 PDF
     │
     ▼
 逐篇解析 (PaperParser) ──▶ 实体抽取 ──▶ 知识图谱
     │
     ▼
 多智能体推导 (AgentRegistry) ──▶ 新结论候选
     │
     ▼
 LLM 多轮合成
  ├── 摘要 / 引言 / 相关工作 / 方法 / 结论
  └── 跨论文综合 + 新结果推导
     │
     ▼
 LaTeX 论文组装 ──▶ tectonic 编译 ──▶ PDF 输出

智能体与技能

数学推导智能体 (math)

技能 策略 描述
推论推导 corollary 对已知定理特殊化,限定参数推导推论
定理推广 generalization 放松前提条件,扩展适用范围
定理组合 combination 链接两个定理的结论与前提,推导新结论
对偶发现 duality 探索对偶形式(正↔对偶空间等)
类比迁移 analogy 将结论迁移到近亲数学结构
逆命题探索 converse 分析逆命题和否命题的成立性

物理推理智能体 (physics)

技能 策略 描述
量纲分析 dimensional_analysis 通过量纲一致性推导物理关系
极限情形 limiting_case 分析极端参数下的方程行为
对称性论证 symmetry_argument 利用对称性推导守恒量
思想实验 thought_experiment 构造理想化场景检验假说

计算机科学智能体 (cs)

技能 策略 描述
复杂度分析 complexity_analysis 分析时间/空间复杂度上下界
算法优化 algorithm_optimization 识别瓶颈并提出改进方案
问题规约 reduction 通过规约建立问题间难度关系
抽象泛化 abstraction 将特定方法抽象为通用框架

文献综合智能体 (literature) — 跨领域

技能 策略 描述
跨论文综合 synthesis 发现互补结论,综合更强结果
矛盾发现 decomposition 识别不同工作间的隐含矛盾
脉络梳理 pattern_recognition 追踪概念演化脉络
空白识别 cross_domain_transfer 发现尚未充分研究的方向

方法论评审智能体 (methodology) — 跨领域

技能 策略 描述
方法论评估 decomposition 评估方法有效性与局限性
实验设计 synthesis 根据理论预测提出实验方案
方法迁移 cross_domain_transfer 将成功方法迁移到新领域
方法重构 decomposition 分解复杂方法并探索替代组合

论文续写智能体 (writing) — 跨领域

技能 策略 描述
后续预测 pattern_recognition 预测最可能的后续研究方向
假说生成 synthesis 提出可验证的新假说
论证写作 synthesis 为新结果撰写完整论证
创新提炼 pattern_recognition 提炼最具原创性的贡献

自我演化

系统通过三层机制实现自我演化:

模块 功能
经验积累 ExperienceStore 记录每次推导的成败、置信度、失败原因
策略自适应 SkillTracker 成功率 >70% 提升优先级,<30% 降级
知识提炼 KnowledgeBase LLM 从经验中提炼可复用知识,注入后续 prompt

数据持久化在 data/ 目录,跨运行累积。


快速开始

# 安装
pip install -e .

# 启动 Ollama 并下载模型
ollama serve
ollama pull qwen3:30b

# 论文分析
python -m paper_agent paper.pdf

# 想法 → 论文
idea-to-paper idea.txt

论文分析常用选项

python -m paper_agent paper.pdf --domain physics       # 指定领域
python -m paper_agent paper.pdf --agents math cs        # 只用特定智能体
python -m paper_agent paper.pdf --depth 3               # 加大推导深度
python -m paper_agent paper.pdf --no-evolution           # 关闭演化
python -m paper_agent paper.pdf --no-verify              # 跳过验证

想法 → 论文常用选项

idea-to-paper idea.txt --max-papers 10                 # 搜索更多论文
idea-to-paper idea.txt --min-citations 50              # 只用高引论文
idea-to-paper idea.txt --pdfs a.pdf b.pdf              # 附加本地 PDF
idea-to-paper idea.txt --skip-search --pdfs a.pdf      # 跳过Scholar搜索

paper-agent 参数

参数 默认值 说明
pdf PDF 论文路径(必须)
--model qwen3:30b Ollama 模型
--ollama-url http://localhost:11434 Ollama 地址
--depth 2 推导深度
--max-candidates 10 每轮最大候选数
--temperature 0.3 LLM 温度
--output output 输出目录
--data-dir data 演化数据目录
--domain 自动 论文领域
--agents 自动 启用的智能体
--no-verify 跳过验证
--no-evolution 禁用演化
--max-workers 4 最大并发线程数(设为 1 则顺序执行)

idea-to-paper 参数

参数 默认值 说明
idea 想法描述文件路径(.txt,必须)
--model qwen3:30b Ollama 模型
--ollama-url http://localhost:11434 Ollama 地址
--max-papers 5 最多搜索论文数
--min-citations 0 最低引用数过滤
--depth 1 多智能体推导深度
--max-candidates 5 每轮最大候选数
--temperature 0.3 LLM 温度
--output output 输出目录
--skip-search 跳过 Google Scholar 搜索
--pdfs 额外的本地 PDF 文件路径

输出文件

paper-agent 输出

文件 说明
report.md Markdown 推导报告
derived_results.tex LaTeX 推导结果
knowledge_graph.json 知识图谱
derivation_log.json 推导日志
agent_capabilities.md 智能体能力报告
evolution_stats.json 演化统计

idea-to-paper 输出

文件 说明
paper.tex 完整 LaTeX 论文源码
paper.pdf 编译后的 PDF 论文
knowledge_graph.json 合并后的知识图谱
synthesis_log.json 合成过程日志

项目结构

src/paper_agent/
├── __init__.py               # 包元信息
├── __main__.py               # python -m paper_agent 入口
├── main.py                   # 论文分析主流程(5 阶段管线)
├── idea_to_paper.py          # 想法→论文流水线(idea-to-paper)
├── scholar_search.py         # Google Scholar 搜索 & PDF 下载
├── config.py                 # 全局配置
├── models.py                 # 数据模型(实体 / 候选 / 经验 / 知识)
├── llm_client.py             # Ollama HTTP 客户端
├── paper_parser.py           # PDF 解析 + 领域检测
├── knowledge_graph.py        # NetworkX 知识图谱
├── verification.py           # 多层验证
├── output_manager.py         # 多格式导出
├── utils.py                  # 共用工具函数
│
├── agents/                   # 智能体
│   ├── base_agent.py         # 抽象基类
│   ├── agent_registry.py     # 注册 & 路由 & 协调
│   ├── math_derivation.py    # 数学推导(6 技能)
│   ├── physics_reasoning.py  # 物理推理(4 技能)
│   ├── cs_analysis.py        # CS 分析(4 技能)
│   ├── literature_review.py  # 文献综合(4 技能)
│   ├── methodology_critic.py # 方法论评审(4 技能)
│   └── writing_synthesis.py  # 论文续写(4 技能)
│
├── evolution/                # 自我演化
│   ├── evolution_engine.py   # 演化引擎
│   ├── experience_store.py   # 经验存储
│   ├── skill_tracker.py      # 技能追踪
│   └── knowledge_base.py     # 知识库
│
└── prompts/                  # LLM Prompt 模板
    ├── shared_prompts.py     # 通用(解析 / 验证)
    ├── synthesis_prompts.py  # 想法→论文合成
    ├── math_prompts.py       # 数学推导
    ├── physics_prompts.py    # 物理推理
    ├── cs_prompts.py         # CS 分析
    ├── literature_prompts.py # 文献综合
    ├── methodology_prompts.py# 方法论
    └── writing_prompts.py    # 续写

详细文档

文档 内容
系统架构 五阶段管线、模块关系、数据流
智能体详解 6 个智能体 × 26 项技能的完整说明
自演化机制 经验、技能、知识三层演化系统
配置参考 全部参数及常用场景配置示例
贡献指南 编码规范、提交流程、扩展方法

示例代码


License

MIT — see LICENSE

About

A multi-agent-based paper generator for mathematics, computer science, physics, etc.

Resources

License

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages