"Read Less, Understand More." ScholarAgent 是一个基于 LLM 的科研辅助智能体。它不仅仅是总结摘要,更能通过 Deep Reading (深度精读) 和 Deep Research (全网调研),为你生成一份包含学术脉络、领域热度、核心创新点及费曼式讲解的深度研报。
作为科研人员,我们在阅读论文时常面临以下痛点:
- 信息孤岛:只看 PDF 无法了解该论文在领域内的真实地位(是 SOTA 还是灌水?)。
- 理解门槛:复杂的数学公式和术语难以快速消化。
- 脉络缺失:不知道这篇论文基于谁(Baselines),又被谁改进(Future Works)。
ScholarAgent 的解决方案:
- 全网调研 (Web Search):利用 Tavily API 实时搜索 GitHub 代码、社区评价和最新引用,打破信息孤岛。
- 费曼精读 (Feynman Technique):强制 AI 使用“通俗类比”和“生活案例”解释核心算法。
- 学术族谱 (Academic Lineage):专门梳理论文的“父亲”(前人工作)和“孩子”(后续研究),构建知识图谱。
graph TD
User[用户上传 PDF] --> Parser(LlamaParse 解析器)
Parser -- 提取全文 --> Brain{DeepSeek 大脑}
subgraph "Step 1: 元数据提取"
Brain -- 提取 Title/Domain/Keywords --> Meta[元数据 JSON]
end
subgraph "Step 2: 全网调研 (Tools)"
Meta -- 构造查询 --> Search[Tavily 搜索引擎]
Search -- 搜索领域趋势 --> Context1[外部情报: 趋势]
Search -- 搜索论文评价 --> Context2[外部情报: 评价]
Search -- 搜索引用脉络 --> Context3[外部情报: 族谱]
end
subgraph "Step 3: 深度思考 (CoT)"
Brain -- 结合原文 + 外部情报 --> Thinking[思维链: 批判/类比/定位]
Thinking -- 生成 --> Report[深度研报 Markdown]
end
Report --> UI[Streamlit 前端展示]
- PDF 解析: LlamaParse (SOTA 级文档解析,支持复杂布局)
- 推理大脑: DeepSeek-V3 (兼具高智商与高性价比)
- 联网工具: Tavily (专为 AI 优化的搜索引擎)
- 前端界面: Streamlit (快速构建数据应用)
git clone [https://github.com/rgnp/ScholarAgent.git](https://github.com/rgnp/ScholarAgent.git)
cd ScholarAgent# 创建虚拟环境
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
# 安装依赖
pip install -r requirements.txt在根目录新建 .env 文件,填入你的 API Keys:
# 核心大模型
DEEPSEEK_API_KEY=sk-xxxxxx
DEEPSEEK_BASE_URL=[https://api.deepseek.com](https://api.deepseek.com)
# PDF 解析服务
LLAMA_CLOUD_API_KEY=llx-xxxxxx
# 联网搜索服务
TAVILY_API_KEY=tvly-xxxxxxstreamlit run src/app.pyScholarAgent/
├── assets/ # 静态资源 (截图等)
├── src/
│ ├── app.py # 前端主程序 (Streamlit)
│ ├── tools.py # 工具箱 (封装 LlamaParse 和 Tavily)
│ └── researcher.py # 核心逻辑 (Prompt Engineering & 流程编排)
├── .env # 配置文件 (不要上传到 GitHub!)
├── .gitignore # Git 忽略规则
├── requirements.txt # 依赖列表
└── README.md # 项目文档
在这个项目中,我重点探索了 Prompt Engineering 在复杂任务中的应用。通过设计结构化的 Super Prompt,我成功让 LLM 从“复读机”变成了具备批判性思维的“审稿人”。特别是在处理学术脉络分析时,结合联网搜索能显著减少大模型的幻觉问题。
Created by [RGNP] - AI Engineering Journey.