GitHub - LLMSystems/picobot

picobot 是一個輕量 agent 專案，目標是用清楚、可擴展的方式，實作一個可聊天、可調工具、可操作 workspace、操作網頁、搜尋資料的 Web agent。

1. 功能概覽

後端 / Agent

可配置的聊天與異 agent 執行核心
資料庫以 SQL 為主
可調用工具的多輪互動能力
session 與 per-session workspace 管理
可直接掛到 FastAPI 的後端 API
可逐步擴充的 skills、prompt、eval 架構

前端 Web UI

多 session 管理（建立、重新命名、刪除）
SSE 串流即時顯示 AI 回答
Markdown 完整渲染（粗體、斜體、程式碼塊、表格、Mermaid 圖表）
工具呼叫視覺化（展示 agent 每次 tool call 的輸入輸出）
Workspace 面板（檔案樹 + 檔案預覽，支援語法高亮）
可拖拉調整寬度的三欄版面（sidebar、主聊天、workspace）
全螢幕檔案預覽 Modal
深色 / 淺色主題切換

2. 專案架構

picobot/
  simplified_chatbot/
    agent/          # agent loop, message flow, run result
    config/         # config schema / loader / env handling
    prompts/        # system prompt 與 prompt 組裝
    providers/      # OpenAI-compatible provider
    runtime/        # session runtime, store, workspace 管理
    server/         # FastAPI endpoints 與 schemas
    skills/         # builtin / workspace skills loader
    tools/          # file, search, shell, skill tools
  frontend/
    src/
      components/   # chat、layout、workspace、common UI 元件
      composables/  # useAutoScroll、useHorizontalResize、useVerticalSplit 等
      lib/          # api、sse、markdown、types
      stores/       # Pinia stores（capabilities、sessions、chat、workspace）
      views/        # ChatView、EmptyView
  eval/             # eval datasets, runs, scripts
  tests/            # pytest 測試
  README.md
  pyproject.toml

3. 驗測結果

目前的評測資料放在 eval/datasets/agent_core_21.jsonl，為自行標註，內容主要包含三種資訊：每題的 prompt、預期行為條件（例如 expected_contains、expected_tools、expected_files），以及需要預先建立的 setup_files。這讓同一份題庫既能工具調用與 workspace 產物。

可直接用以下指令執行 eval：

python3 eval/scripts/run_eval.py example_config.json eval/datasets/agent_core_21.jsonl

目前已用 gpt-5-mini 進行一輪本地 eval 驗測。依 run.json 記錄，2026-05-14 21:20:56 這次執行實際跑了 21 題，全部成功完成且全部通過 rule-based scoring，pass_rate = 1.0。

tool_calling: 8 / 8 通過
workspace: 13 / 13 通過

這套 eval 的設計方法是用 JSONL 題庫描述每一題的 prompt、預期工具、預期文字輸出，以及預期產生的 workspace 檔案，再由本地 runner 逐題執行並收集 content、tools_used、events、workspace_outputs。評分目前採 rule-based scoring，會檢查 expected_contains、forbidden_contains、expected_tools、expected_files 與檔案內容條件。

每一題都會建立自己的 session_id，也會分配自己的 session workspace，因此不同 case 之間的對話歷史、工具操作與檔案產物彼此隔離。這讓 picobot 可以被測試成一個真正會使用工具、讀寫檔案、操作 workspace 的 agent，而不只是單純比對文字回覆。

每次跑完 eval 後，都會在 eval/runs/<run_id>/ 生成一份完整結果資料夾(可參考驗測結果)，結構大致如下：

eval/
└── runs/
    └── <run_id>/
        ├── run.json
        ├── config_snapshot.json
        ├── dataset_snapshot.jsonl
        ├── cases/
        │   └── <case_id>.json
        ├── sessions/
        └── workspaces/

閱讀方式可以這樣看：

run.json
- 先看整體摘要，例如 case_count、completed、failed、scored_pass、pass_rate，以及各 category 的統計。
cases/<case_id>.json
- 看單題細節，包含 content、tools_used、events、workspace_outputs、score，適合追某一題為什麼通過或失敗。
config_snapshot.json
- 記錄這次 run 使用的 config，方便回頭比對模型、溫度、iteration 等設定。
dataset_snapshot.jsonl
- 記錄當次實際跑的題庫內容，避免之後題目改了卻無法重現舊結果。
sessions/
- 保存這次 eval 過程中的 session 歷史資料。
workspaces/
- 保存每一題自己的 session workspace，可直接檢查 agent 產生或修改的檔案結果。

這份結果代表目前 picobot 的工具調用與 workspace 讀寫主幹已經可以穩定運作；後續若擴充更多能力，會再持續用 eval/ 題庫做回歸驗證。

4. 快速開始

4.1 安裝後端

需求：Python 3.11 以上

python3 -m pip install -e .

4.2 設定 API Key

請在專案根目錄建立 .env：

OPENAI_API_KEY=your_api_key_here
CORS_ALLOWED_ORIGINS=web_url_here
TAVILY_API_KEY=tvly-your_api_key_here

可選：

OPENAI_BASE_URL=http://localhost:11434/v1

4.3 範例設定檔

example_config.json：

{
  "provider": "openai_compat",
  "model": "gpt-4.1-mini",
  "maxTokens": 2000,
  "contextWindowTokens": 32000,
  "maxIterations": 20,
  "temperature": 0.2,
  "workspaceRootDir": "workspaces"
}

4.4 啟動後端 Server

python3 fastapi_server.py --config example_config.json --host 0.0.0.0 --port 8000

或是

sh start_fastapi_server.sh

若容器要對外提供服務：

HOST=0.0.0.0 PORT=8000 sh start_fastapi_server.sh

4.5 啟動前端

需求：Node.js 18 以上

cd frontend
npm install
npm run dev

預設會在 http://localhost:5173 啟動。前端預設將 API 請求代理到 http://localhost:8000，可在 frontend/vite.config.ts 調整。

正式部署時可用：

npm run build

產出靜態檔案在 frontend/dist/，可直接由後端或任意靜態伺服器提供服務。

4.6 使用 LocalAgentRuntime（純 Python）

import asyncio

from simplified_chatbot.runtime.local_runtime import LocalAgentRuntime


async def main() -> None:
    runtime = LocalAgentRuntime.from_config("example_config.json")

    first = await runtime.handle_message_async(
        session_id="demo-session",
        message="你好，請先簡單介紹你自己。",
    )
    print("Assistant:", first.content)

    second = await runtime.handle_message_async(
        session_id="demo-session",
        message="請延續上一輪，再用一句話介紹你目前有哪些工具能力。",
    )
    print("Assistant:", second.content)


if __name__ == "__main__":
    asyncio.run(main())

4.7 測試

python3 -m pytest tests -q

5. 前端功能說明

5.1 多 Session 管理

左側 Sidebar 列出所有對話，可：

點擊「新增對話」建立空白 session
點擊 session 切換對話
右鍵或點選選單可重新命名、刪除

5.2 串流聊天

訊息送出後透過 SSE 即時顯示 AI 回答，支援：

串流中顯示打字游標
串流中即時渲染 Markdown
按 Escape 或點擊停止按鈕中斷串流

Composer 快捷鍵

按鍵	動作
`Enter`	送出訊息
`Shift + Enter`	換行
`Escape`	停止串流 / 清空輸入框
`↑`（空白時）	帶回上一則使用者訊息

5.3 Markdown 渲染

AI 回答支援完整 Markdown，包含：

粗體（**text**）、斜體（*text*）
程式碼塊（含語法高亮，支援 30+ 語言）
表格、引用、水平線
Mermaid 圖表（flowchart、sequenceDiagram 等）
行內程式碼

5.4 工具呼叫視覺化

Agent 每次呼叫工具時，訊息中會顯示 ToolCall 卡片，包含工具名稱、輸入參數、執行結果，可展開查看詳情。

5.5 Workspace 面板

當後端 capabilities 回傳 session_workspace: true 時，右側會出現 Workspace 面板：

檔案樹：展開 / 收合資料夾，點擊即可預覽檔案
檔案預覽：
- Markdown 檔案：完整 Markdown 渲染（含 Mermaid）
- 程式碼檔案：語法高亮（highlight.js）
- 一鍵複製檔案內容
- 全螢幕預覽（90vw × 85vh Modal）
- 超長檔案支援「載入更多」分頁

Workspace 會監聽串流中的 workspace_changed 事件，AI 操作檔案後自動刷新。

5.6 可拖拉版面

三欄式版面均可用滑鼠拖拉調整：

區域	方向	最小 / 最大
左側 Sidebar	水平（右邊緣）	180px / 60vw
Workspace 面板	水平（左邊緣）	240px / 60vw
Workspace 檔案樹 / 預覽	垂直	15% / 85%

寬度 / 比例會自動儲存至 localStorage。

5.7 主題切換

右上角提供深色 / 淺色主題切換，設定儲存至 localStorage。

6. API 摘要

Chat

POST /chat — 非串流，回完整回答與 trace events
GET /chat/stream — SSE 串流
POST /chat/stream — SSE 串流，使用 JSON body

Session

GET /sessions — 取得 session 清單與 metadata
POST /sessions — 建立空白 session
PATCH /sessions/{session_id} — 更新 session title
GET /sessions/{session_id}/messages — 取得完整歷史訊息
DELETE /sessions/{session_id} — 刪除 session

Workspace

GET /sessions/{session_id}/workspace/tree — 列出 workspace 目錄內容
GET /sessions/{session_id}/workspace/file — 讀取 workspace 中的 UTF-8 文字檔

Capability / Health

GET /capabilities — 回傳 model、tools、feature flags
GET /health — 健康檢查

串流事件

/chat/stream 透過 SSE 回傳以下事件：

事件	說明
`run_started`	agent 開始執行
`tool_call_started`	工具呼叫開始
`tool_call_finished`	工具呼叫結束（含結果）
`workspace_changed`	workspace 檔案有異動
`delta`	文字串流片段
`done`	串流結束（含完整 usage）
`error`	發生錯誤

7. 前端技術棧

分類	套件
框架	Vue 3 + TypeScript
建構	Vite
狀態管理	Pinia
UI 元件	shadcn-vue
樣式	Tailwind CSS v4
Markdown	markdown-it + DOMPurify
語法高亮	highlight.js
圖表	Mermaid

8. 感謝

picobot 的整體架構設計主要參考了 nanobot，特別是在以下方向上受到啟發：

agent loop 的設計思路
tool calling 形式
skills 機制
prompt 分層概念
workspace / runtime 導向的 agent 架構

同時，picobot 也和 nanobot 有著不同的特色：

更小的開發範圍
- 主要專注在 agent 最核心的執行框架，更易閱讀、理解
基於異步構建 Agent : 對 web chatbot / agent UI 、多併發整合更友善
有明確的 per-session workspace 路線
- 對 web chatbot / agent UI 的整合更簡單

對 nanobot 表示感謝，是這個專案得以快速長出可靠骨架的重要原因。picobot 會繼續沿著這條路，維持「小而清楚，但可持續擴展」的方向演進。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

1. 功能概覽

2. 專案架構

3. 驗測結果

4. 快速開始

4.1 安裝後端

4.2 設定 API Key

4.3 範例設定檔

4.4 啟動後端 Server

4.5 啟動前端

4.6 使用 LocalAgentRuntime（純 Python）

4.7 測試

5. 前端功能說明

5.1 多 Session 管理

5.2 串流聊天

5.3 Markdown 渲染

5.4 工具呼叫視覺化

5.5 Workspace 面板

5.6 可拖拉版面

5.7 主題切換

6. API 摘要

Chat

Session

Workspace

Capability / Health

串流事件

7. 前端技術棧

8. 感謝

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 64 Commits
assets		assets
doc		doc
eval		eval
frontend		frontend
prompt		prompt
simplified_chatbot		simplified_chatbot
tests		tests
.env.example		.env.example
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.json		config.json
example_config.json		example_config.json
fastapi_server.py		fastapi_server.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
start_fastapi_server.sh		start_fastapi_server.sh

Folders and files

Latest commit

History

Repository files navigation

1. 功能概覽

2. 專案架構

3. 驗測結果

4. 快速開始

4.1 安裝後端

4.2 設定 API Key

4.3 範例設定檔

4.4 啟動後端 Server

4.5 啟動前端

4.6 使用 LocalAgentRuntime（純 Python）

4.7 測試

5. 前端功能說明

5.1 多 Session 管理

5.2 串流聊天

5.3 Markdown 渲染

5.4 工具呼叫視覺化

5.5 Workspace 面板

5.6 可拖拉版面

5.7 主題切換

6. API 摘要

Chat

Session

Workspace

Capability / Health

串流事件

7. 前端技術棧

8. 感謝

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages