Releases: fkyah3/experiment-console
Releases · fkyah3/experiment-console
V3 - 工具调用修复版
V3 - 工具调用修复版
修复
- DeepSeek SSE 解析:删除了基于 inish_reason 的工具调用检测(DeepSeek 流式 API 全程不发 inish_reason),改为基于本地 _tool_call_buf 数据存在性判断
- reasoning_content 独立发送:assistant 消息有 reasoning 就发
easoning_content 而非合并到 content,保证多轮推理链不断 - Sanitizer 保险:发送前自动补 (reasoning omitted),确保 API 不会拒收
功能
- 工具调用:内置 list_dir /
ead 工具,自动轮转上限可调(Inspector 中 _tc_max_rounds) - opencode Provider 源码内嵌:opencode-provider/ 目录包含真实 Provider 源码,开箱即可复现推理语言漂移实验
- 模板:V8-多轮漂移测试模板,system prompt 引导模型通过 tool calling 探索 Provider 代码
数据
- 320+ 次批量验证(8 组 × 40 次)
- 分析报告 7 篇(溯源 → 复现 → 根因确认 → 工程复盘)
- DeepSeek Issue #1255 回复 6 篇
下载使用
- 下载 V3.zip
- 解压后运行 deepseek_experiment_console.exe
- ⚙ 设置 → 填入 DeepSeek API Key
- 📋 模板 → 选 V8-多轮漂移测试 → ▶ 发送
V2 - 批量实验 + 污染溯源 + 重构稳定版
消息实验台 V2
新功能
- 批量实验模式:一键跑 40 轮,自动生成统计报告(含语言检测、token 分析)
- BatchReader:浏览历史实验报告,上下翻页导航
- UI 全重构:布局重写,操作更流畅
- 批量摘要加 prompt 原文:每份报告首行附系统提示词
- stats 统计增强:综合推理语言/输出语言/token 等多维度统计
修复的 bug
- 思考模式切换不再被软件配置硬编码影响
- 3 处工具调用和消息解析的不稳定问题
新增内容
- README:完整的项目首页,含实验数据索引、核心结论
- 分析报告:工具调用 reasoning 语言漂移溯源 + 繁体字泄漏分析
- 320 次批量验证数据(8 组 × 40 次)全部公开
下载
- 免安装,解压即跑
- 首次使用:⚙ 设置 → 填入 DeepSeek API Key → 保存
V1 - 消息实验台首个公开版本
消息实验台 V1
🧪 AI 消息积木实验台——逐条控制 messages/reasoning/thinking,亲眼看到 API 层的 AI 不是魔法是 token 序列。
这是什么
把 AI 的 messages 拆成一块块积木,让你手动组装。每条 system/user/assistant/tool 消息独立控制,thinking 开关任意切换,reasoning_content 和 content 分开显示。
核心功能
- 搭积木式消息列表:逐条增删改 system/user/assistant/tool
- reasoning 可视化:展开看到 AI 的思考过程和最终回答
- 参数全控制:模型/thinking/effort/max_tokens 全部可调
- 原始 JSON 日志:完整请求体 + 响应体 + usage 统计
- 实验模版:内置中文锚定测试、前置条件测试,一键加载
- 配置管理:API Key 图形化输入,存储路径自定义,点击打开文件夹
使用方式
- 下载 V1.zip,解压
- 运行 ExperimentConsole.exe(Windows 免安装)
- ⚙ 设置 → 填入 DeepSeek API Key → 保存
- 开始搭积木
文档
使用说明和完整 DeepSeek API 文档包含在压缩包 docs/ 目录中。