Skip to content

yingchu/DeepTechScout

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🌍 Deep Tech Scout — Open Source Edition

English | 繁體中文

一款基於多 Agent LLM 架構的深科技產業戰略研究引擎。以美國 NSF 科研專案為示範,協助研究人員與投資人快速探勘前沿技術、分析市場動態、追蹤專利佈局,並自動生成繁體中文產業分析報告。


✨ 核心功能

功能模組 說明
🚀 專案探勘 搜尋美國 NSF 科研補助資料庫,分析各技術領域的 R&D 投入趨勢
🛡️ 專利分析 解析全球公開專利資料(需自行串接 API,詳見下方說明)
📈 市場訊號 抓取 PMI、VC 融資新聞、ArXiv 論文、SEC EDGAR 財務數據
📰 相關新聞 即時搜尋 Google News RSS(免費,無需 API)
🎯 M&A Hunter 篩選潛在併購標的,輔助戰略決策
📊 綜合報告 整合上述所有 Agent 輸出,以 LLM 自動撰寫繁體中文深度分析報告

⚙️ 系統需求

  • 作業系統:macOS / Linux / Windows (WSL)
  • Python 版本:3.10 以上
  • 套件管理pip 或建議使用 uv 以加速安裝

🚀 快速開始

1. 取得程式碼並安裝依賴

git clone <your-repo-url>
cd DeepTechResearch_Opensource

# 建立虛擬環境
python -m venv .venv
source .venv/bin/activate        # macOS / Linux
# .venv\Scripts\activate          # Windows

# 安裝套件
pip install uv
uv pip install -r requirements.txt

2. 設定 API 金鑰

cp .streamlit/secrets.toml.example .streamlit/secrets.toml

然後編輯 .streamlit/secrets.toml,填入您自己申請的 API 金鑰。

⚠️ 請勿將含有真實金鑰的 secrets.toml 提交至版本控制(git)!

3. 啟動應用程式

streamlit run main.py

開啟瀏覽器,前往 http://localhost:8501 即可使用。

您也可以直接在左側 「🔑 API 金鑰設定」 欄位中輸入金鑰,無需編輯檔案。


🔑 必要 API 金鑰申請說明

本工具依賴外部 LLM 服務進行分析與報告生成。以下金鑰需要您自行申請,系統才能正常運作。

必填(核心功能)

服務 用途 申請連結 備註
Google Gemini 報告生成、研究分析 aistudio.google.com 有免費額度,建議優先申請
Groq 快速專案分析、摘要 console.groq.com 免費層速度極快,推薦使用

選填(擴充功能)

服務 用途 申請連結 備註
Anthropic Claude 報告 Executive Summary 生成 console.anthropic.com 摘要品質極佳,建議搭配使用
OpenAI 備用 AI 模型(Failover) platform.openai.com 非必要,系統會自動 Failover

填寫方式

方式 A:直接在介面輸入(推薦)

啟動後,在左側「🔑 API 金鑰設定」展開欄位,逐一貼上即可。每次啟動後需重新輸入(Session 內有效)。

方式 B:寫入設定檔(長期使用)

編輯 .streamlit/secrets.toml

[general]
GOOGLE_API_KEY  = "AIzaSy..."
GROQ_API_KEY    = "gsk_..."
CLAUDE_API_KEY  = "sk-ant-..."
OPENAI_API_KEY  = "sk-proj-..."

🛡️ 專利資料庫說明(需自行申請串接)

本開源版本的 專利分析 Tab 已包含基礎搜尋框架,但專利資料庫 API 金鑰需使用者自行申請並整合才能完整使用。

⚠️ 開源版功能說明:

  • 核心參與者分析:在 M&A Hunter 分頁中,系統預設會從抓取到的專利權人 (Assignee) 統計前五大玩家。
  • 自動備援機制 (Fallback):若目前尚未串接專利資料庫,系統會自動改為統計「US NSF 科研專案」的執行機構作為替代,確保您依然能從研發投入的角度識別出該領域的核心機構與潛在標的。

以下是主要的全球公開專利資料庫:

可免費或低成本串接的資料庫

資料庫 涵蓋範圍 API 申請連結 說明
USPTO PatentsView 美國專利 (1976–今) patentsview.org/apis 免費,REST API,不需要金鑰
Lens.org 全球 (USPTO + EPO + WIPO),含引用數據 lens.org/lens/user/subscriptions 免費學術帳號,API 需申請
Google Patents (非官方 RSS) 全球 透過 Google 搜尋 site:patents.google.com 無官方 API,需 SerpAPI 或爬蟲
EPO Open Patent Services (OPS) 歐洲專利局 (EP) ops.epo.org 需申請 Consumer Key,免費額度
WIPO PATENTSCOPE 國際 PCT 專利 patentscope.wipo.int 提供免費批量下載
SerpAPI (Google Patents) 透過 Google Patents 搜尋 serpapi.com 付費服務,每月有免費額度

如何整合至本系統

  1. 申請上方任一資料庫的 API 存取權限
  2. .streamlit/secrets.toml 新增對應的金鑰(例如 EPO_CONSUMER_KEY
  3. agents/patent_agent.py 中參考現有的 fetch_global_patents() 函式,新增對應的 API 呼叫邏輯
  4. 重啟系統即可在 Tab 2 — 專利分析 看到資料

📂 本地知識庫與資料管理

系統會將搜尋到的原始資料自動存儲於 kb_data/ 目錄下(JSONL 格式),這為使用者帶來以下價值:

  1. 跨分頁情資整合:M&A Hunter 等 Agent 透過讀取本地知識庫,實現跨分頁的資料協同分析,無需重複搜尋。
  2. 節省 API 成本與時間:資料一旦存檔,後續的分析與報告生成將優先讀取本地快取,減少對外部 API 的重複呼叫。
  3. 具備未來擴充性:結構化的 JSONL 資料便於使用者後續匯入其他資料庫,或作為 RAG (檢索增強生成) 系統的基礎素材。

🏗️ 核心架構

main.py                          # 主程式入口、側邊欄設定、Tab 路由
│
└── agents/
    ├── project_agent.py         # Tab 1:NSF 科研專案探勘
    ├── patent_agent.py          # Tab 2:全球專利分析(需自行串接 API)
    ├── market_agent.py          # Tab 3:PMI / VC / ArXiv / SEC EDGAR
    ├── ma_screener_agent.py     # Tab 4:M&A 候選篩選
    ├── news_agent.py            # Tab 5:Google News RSS 新聞
    ├── report_agent.py          # Tab 6:LLM 綜合報告生成(僅頁面顯示)
    └── ecosystem_agent.py       # 生態系分析(進階,需自行擴充)

.streamlit/
    ├── secrets.toml             # 您的 API 金鑰(請勿公開!)
    └── secrets.toml.example     # 金鑰格式範例

🔓 開放的免費資料來源

本工具預設連接以下完全免費、無需 API 金鑰的資料來源:

  • 🇺🇸 US NSF Awardsnsf.gov/awardsearch — 美國國科會科研補助
  • 🏛️ US SEC EDGAR XBRLsec.gov/edgar — 美國上市公司財務數據
  • 📰 Google News RSS:全球產業即時新聞(無需金鑰)
  • 📚 arXiv.org API:全球前沿學術論文搜尋


🍴 Fork 與自行擴充

本專案歡迎任何人 Fork 後自行擴充與修改,但不接受 Pull Request

若您希望增加新功能或資料來源,請:

  1. 點擊右上角 Fork 按鈕,複製一份到您自己的 GitHub 帳號
  2. 在您的 Fork 版本中自由開發:
    • 新增專利資料庫串接(參考 agents/patent_agent.py
    • 新增其他國家的科研資料庫(參考 agents/project_agent.py
    • 擴充本地知識庫或向量搜尋功能
  3. 如有公開成果,歡迎在 Issues 頁面分享連結讓社群參考

⚖️ 授權與免責聲明

授權

本專案採 GNU General Public License v3.0 (GPL-3.0) 授權(詳見 LICENSE 檔案)。

免責聲明

使用本軟體前,請詳閱以下事項:

  1. 資料版權:本平台連接的所有外部資料來源(包括但不限於 NSF、SEC EDGAR、Google News、arXiv、各國專利局等)之內容版權均屬原始資料提供者所有。使用者應自行評估相關資料的授權條款與遵守著作權法。

  2. LLM 服務條款:使用各第三方 AI 服務(Google Gemini、Groq、Anthropic Claude、OpenAI 等)時,使用者需自行遵守各服務商的使用條款(Terms of Service)及資料政策(Data Policy)。

  3. 報告內容非投資建議:本平台 AI 生成的所有分析報告、市場預測、企業評估等內容,僅供學術研究與資訊參考之用,不構成任何形式的投資建議、財務建議或法律意見。投資決策請諮詢合格的專業顧問。

  4. 準確性不保證:AI 生成內容可能存在錯誤、過時或不完整的資訊。本專案開發者對任何因使用本工具所產生的直接或間接損失,概不負責。

  5. API 金鑰安全:使用者需自行妥善保管所有 API 金鑰,避免外洩或未授權使用。開發者不對因金鑰外洩造成的費用或損失負責。

  6. 本地部署限制:本工具設計用於本地端研究使用。若部署為公開服務,使用者需自行評估並承擔相關的法律責任與安全風險。

使用本軟體即表示您已閱讀、理解並同意上述所有免責條款。

About

Deep Tech Scout 是一款基於多 Agent 架構的深科技研發情資引擎。本工具先以以美國 NSF 科研專案為核心示範,整合全球專利分析框架、市場訊號(SEC 財報、ArXiv 論文)與即時產業新聞。透過自動化數據抓取與 LLM 深度分析,協助研究人員快速掌握研發趨勢、識別核心參與者,並自動生成繁體中文產業分析報告。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages