1.UI界面使用(最建议):
直接启动 release 中的 exe 可执行文件。
操作指南见 release note
或:
使用 uv 启动 gui.py (cpy=3.10.0)
uv run python ./gui.py为能够连接使用 OCR ,请预先启动 .\tools\addition\Umi-OCR\Umi-OCR.exe , 并保证主机、端口为 127.0.0.1 , 1224 (即默认情况)。
2.命令行使用:
先安装依赖库
uv sync使用 uv 启动 aiclass.py (cpy=3.10.0)
uv run python ./aiclass.py若还没有 uv , 请先安装
pip install uv程序读取 Deepseek API KEY 时通过 手动输入 、 读取系统环境变量 DEEPSEEK_API_KEY 两种方式
读取 MCP 文件时支持 .py , .json 文件输入,支持多文件输入(不同文件中间用空格分开)。
建议使用局部路径,如
./tools/files.py ./tools/mcp_config.json
- 可调用线上 MCP Server,如
MCP.so仓库上的服务器,只用改tools\mcp_config.json中的内容,支持npx,uvx,这里默认是howtocook-mcp。注:tools\mcp_config.json中只能添加一个 MCP Server - 允许输入本地MCP脚本文件,如操作文件、网络爬虫等,这里提供了简单的操作工具
tools\files.py和tools\network.py等用来简单的agent功能。 - 允许自定义 System Prompt 系统提示词、Temperature 温度值。
- 较大操作链实施时,在有循环深度限制下,根据前一步的报错改正重试。最大操作循环深度,由
MAX_ITER决定。 - 内置
tools\ocr.pyOCR 工具函数,对图片, PDF 文档进行文字识别。 - 完备的注释系统,方便维护、查阅。
- 零 AI 基础人群友好的 GUI 界面 #4
- 提供更好的接口
- 高度自由化
- 社区模块开发友好
- 增加本地历史储存功能 #2
- i18n
- 添加 RAG
- 支持多 MCP Server 链接服务
- 优化 token 使用
old_console.py命令行主程序(停更)aiclass.py对原命令行主程序封装得到的类(持续更新),其中main()还实现了一个简单的控制台版 AI Agentgui.pyUI界面实现(使用PySide6)mcp_utils.pyMCP连接实现tools包含额外的本地MCP服务files.py,network.py,osmanager.py,ocr.py以及简单写了连接howtocook-mcp的配置文件mcp_config.json。uv.lockPython 依赖库
- Umi-OCR in https://github.com/hiroi-sora/Umi-OCR
- PySide 界面原型 in https://zhuanlan.zhihu.com/p/1906002163316028282
若对深度学习有兴趣,想要接触了解一下,欢迎来看 我的博客 ,共同学习呀~