Skip to content

v0.3.2

Latest

Choose a tag to compare

@github-actions github-actions released this 06 May 06:11

v0.3.2 — VRAM 检测修复 + MoE partial 保护 + RTX PRO 支持

修复

  • VRAM 虚高修复:Windows Resizable BAR / 共享 GPU 内存导致 nvidia-smi 报告虚假 VRAM(如 4070 显示 31GB 而非 12GB)。现在 XML 与 CSV 交叉校验,并用已知 GPU VRAM 上限表兜底
  • MoE partial OOM 修复:当模型大小 > 1.2× 总 VRAM 时,强制走 moe_offload(全部 expert 放 CPU),不再尝试 moe_partial 导致必然 OOM
  • RTX PRO 带宽修复:新增 PRO 6000/5000/4500/4000/2000 到带宽枚举表,修复带宽=0 导致调参不准

新增

  • knownMaxVRAM() 查找表:覆盖所有消费级/专业/数据中心 NVIDIA GPU 的已知 VRAM 上限,防止驱动误报

Full Changelog: v0.3.1...v0.3.2