Skip to content

Releases: fkyah3/experiment-console

V3 - 工具调用修复版

09 May 02:14

Choose a tag to compare

V3 - 工具调用修复版

修复

  • DeepSeek SSE 解析:删除了基于 inish_reason 的工具调用检测(DeepSeek 流式 API 全程不发 inish_reason),改为基于本地 _tool_call_buf 数据存在性判断
  • reasoning_content 独立发送:assistant 消息有 reasoning 就发
    easoning_content 而非合并到 content,保证多轮推理链不断
  • Sanitizer 保险:发送前自动补 (reasoning omitted),确保 API 不会拒收

功能

  • 工具调用:内置 list_dir /
    ead 工具,自动轮转上限可调(Inspector 中 _tc_max_rounds)
  • opencode Provider 源码内嵌:opencode-provider/ 目录包含真实 Provider 源码,开箱即可复现推理语言漂移实验
  • 模板:V8-多轮漂移测试模板,system prompt 引导模型通过 tool calling 探索 Provider 代码

数据

  • 320+ 次批量验证(8 组 × 40 次)
  • 分析报告 7 篇(溯源 → 复现 → 根因确认 → 工程复盘)
  • DeepSeek Issue #1255 回复 6 篇

下载使用

  1. 下载 V3.zip
  2. 解压后运行 deepseek_experiment_console.exe
  3. ⚙ 设置 → 填入 DeepSeek API Key
  4. 📋 模板 → 选 V8-多轮漂移测试 → ▶ 发送

V2 - 批量实验 + 污染溯源 + 重构稳定版

07 May 21:52

Choose a tag to compare

消息实验台 V2

新功能

  • 批量实验模式:一键跑 40 轮,自动生成统计报告(含语言检测、token 分析)
  • BatchReader:浏览历史实验报告,上下翻页导航
  • UI 全重构:布局重写,操作更流畅
  • 批量摘要加 prompt 原文:每份报告首行附系统提示词
  • stats 统计增强:综合推理语言/输出语言/token 等多维度统计

修复的 bug

  • 思考模式切换不再被软件配置硬编码影响
  • 3 处工具调用和消息解析的不稳定问题

新增内容

  • README:完整的项目首页,含实验数据索引、核心结论
  • 分析报告:工具调用 reasoning 语言漂移溯源 + 繁体字泄漏分析
  • 320 次批量验证数据(8 组 × 40 次)全部公开

下载

  • 免安装,解压即跑
  • 首次使用:⚙ 设置 → 填入 DeepSeek API Key → 保存

GitHub 源码

V1 - 消息实验台首个公开版本

06 May 14:20

Choose a tag to compare

消息实验台 V1

🧪 AI 消息积木实验台——逐条控制 messages/reasoning/thinking,亲眼看到 API 层的 AI 不是魔法是 token 序列。

这是什么

把 AI 的 messages 拆成一块块积木,让你手动组装。每条 system/user/assistant/tool 消息独立控制,thinking 开关任意切换,reasoning_content 和 content 分开显示。

核心功能

  • 搭积木式消息列表:逐条增删改 system/user/assistant/tool
  • reasoning 可视化:展开看到 AI 的思考过程和最终回答
  • 参数全控制:模型/thinking/effort/max_tokens 全部可调
  • 原始 JSON 日志:完整请求体 + 响应体 + usage 统计
  • 实验模版:内置中文锚定测试、前置条件测试,一键加载
  • 配置管理:API Key 图形化输入,存储路径自定义,点击打开文件夹

使用方式

  1. 下载 V1.zip,解压
  2. 运行 ExperimentConsole.exe(Windows 免安装)
  3. ⚙ 设置 → 填入 DeepSeek API Key → 保存
  4. 开始搭积木

文档

使用说明和完整 DeepSeek API 文档包含在压缩包 docs/ 目录中。